The Role of Open Data in AI systems as Digital Public Goods
October 29, 2024
Theo: https://www.digitalpublicgoods.net/blog/the-role-of-open-data-in-ai-systems-as-digital-public-goods
Bài được đưa lên Internet ngày: 29/10/2024
Author: Liv Marte Nordhaug, Secretariat CEO, Digital Public Goods Alliance
Tác giả: Liv Marte Nordhaug, Giám đốc điều hành của Ban Thư ký, Liên minh Hàng hóa Công cộng Kỹ thuật số
Trong vài năm qua, đã có sử nổi lên của mối quan tâm và việc áp dụng các hệ thống trí tuệ nhân tạo tạo sinh (Generative AI), và mối quan tâm tương tự trong việc làm rõ và phân định nguồn mở có nghĩa là gì đối với AI và làm thế nào để đảm bảo AI phục vụ vì lợi ích của công chúng. Ban Thư ký của DPGA đã tham gia tích cực vào các thảo luận đó. Nhận biết được tiềm năng biến đổi của AI, chúng tôi đã khám phá các cách thức để dân chủ hóa những lợi ích của nó, ủng hộ việc chi tiêu công cho AI mà ưu tiên lợi ích của công chúng (bản dịch sang tiếng Việt) và quyền truy cập công bằng. Ngoài ra, chúng tôi đã và đang xem xét cách Tiêu chuẩn DPG có thể cần thiết để tùy chỉnh nhằm xác định tốt hơn những gì tạo nên các hệ thống AI như một dạng hàng hóa công cộng kỹ thuật số, thông qua một cộng đồng thực hành - CoP (Community of Practice), được UNICEF đồng tổ chức.
Công việc này được triển khai trong bối cảnh các sáng kiến và tổ chức khác cũng giải quyết các câu hỏi phức tạp xung quanh sự phát triển và sử dụng trí tuệ nhân tạo trong tương lai trong phạm vi lợi ích công cộng. Một trong những sáng kiến đặc biệt quan trọng đó là công việc định nghĩa AI Nguồn Mở do Sáng kiến nguồn mở (OSI) quản lý với sự tham gia của nhiều bên liên quan và chuyên gia. Sau quá trình kéo dài hai năm, Định nghĩa AI Nguồn Mở (OSAID) Phiên bản 1.0 (bản dịch sang tiếng Việt) đã được phát hành vào ngày 28/10/2024.
Quá trình mà OSI thực hiện, theo lời của Mozilla, "là một bước tiến đáng kể hướng tới việc mang lại sự rõ ràng và chặt chẽ cho cuộc thảo luận về AI Nguồn Mở" và "đã thiết lập một điểm tham chiếu quan trọng cho các cuộc thảo luận về AI Nguồn Mở". Mozilla cũng lưu ý rằng một số vấn đề phức tạp đã được đưa ra hàng đầu, đặc biệt là xung quanh việc liệu dữ liệu đào tạo cho các mô hình AI có nên được chia sẻ như một phần của AI Nguồn Mở hay không và chia sẻ như thế nào.
Với việc các hệ thống AI mở có thể nhận được sự công nhận của DPG, các chủ đề đã được giải quyết như một phần của quá trình định nghĩa AI Nguồn Mở - OSAID (Open Source AI Definition) có tầm quan trọng sống còn đối với Liên minh Hàng hóa Công cộng Kỹ thuật số - DPGA (Digital Public Goods Alliance). Theo Lộ trình Hợp tác Kỹ thuật số của Tổng thư ký Liên hợp quốc, hàng hóa công cộng kỹ thuật số là các phần mềm nguồn mở, tiêu chuẩn mở, dữ liệu mở, hệ thống AI mở và bộ sưu tập nội dung mở tuân thủ luật về quyền riêng tư và các luật hiện hành khác cũng như các thông lệ tốt nhất, không gây hại và giúp đạt được các Mục tiêu Phát triển Bền vững (SDG). Định nghĩa này được vận hành thông qua Tiêu chuẩn DPG, một bộ chín chỉ số được sử dụng để xác định liệu một giải pháp có thể được công nhận là hàng hóa công cộng kỹ thuật số hay không. Do đó, Tiêu chuẩn DPG không chỉ yêu cầu cấp phép nguồn mở; Tiêu chuẩn này còn đánh giá rằng các giải pháp kỹ thuật số có liên quan đến SDG, có thể truy cập, có thể tùy chỉnh, không phụ thuộc vào nền tảng, tuân thủ các thông lệ tốt nhất và được thiết kế để giảm thiểu rủi ro gây hại. Ban thư ký DPGA duy trì Tiêu chuẩn DPG và cũng đánh giá các giải pháp kỹ thuật số được đề cử theo tiêu chuẩn này. Các giải pháp được xác minh đáp ứng các tiêu chí của Tiêu chuẩn DPG được liệt kê trong Sổ đăng ký DPG.
Vào năm 2023, Ban thư ký DPGA, cùng với UNICEF, đã đồng triệu tập một CoP chuyên gia về các hệ thống AI như là hàng hóa công cộng kỹ thuật số. Mục đích là đưa ra các khuyến nghị về cách Tiêu chuẩn DPG có thể phát triển để định nghĩa và công nhận tốt hơn các hệ thống AI là DPG. Mặc dù CoP bao gồm những người tham gia vào quá trình OSAID song song, nhưng mục đích của CoP là xây dựng dựa trên các bài học kinh nghiệm và kết quả của quá trình OSAID.
Gần đây, CoP đã đưa ra các khuyến nghị cuối cùng cho Hội đồng Tiêu chuẩn DPG. Các khuyến nghị này bao gồm duy trì cách tiếp cận nhị phân của Tiêu chuẩn DPG để xác định các mô hình AI là nguồn mở hay không, cung cấp càng nhiều dữ liệu càng tốt, loại trừ các giấy phép AI có trách nhiệm và thêm một số yêu cầu không gây hại như bắt buộc thực hiện một số biện pháp giảm thiểu rủi ro, bao gồm đánh giá rủi ro AI cho các trường hợp sử dụng cụ thể mà mô hình được phát triển, hướng dẫn sử dụng có trách nhiệm và kế hoạch sử dụng các nguyên tắc thiết kế an toàn AI. Bạn có thể tìm thấy toàn bộ các khuyến nghị và hiểu biết sâu sắc về các lĩnh vực chưa bao giờ đạt được sự đồng thuận hoàn toàn tại đây.
Hội đồng Tiêu chuẩn DPG hiện đang trong quá trình thực hiện một số bản cập nhật cho Tiêu chuẩn DPG liên quan đến các hệ thống AI, được thông báo bởi các khuyến nghị của CoP cũng như các cam kết và tham vấn khác với các bên liên quan. Điều quan trọng là đề xuất, sẽ sớm chuyển sang tham vấn cộng đồng, là tiếp tục yêu cầu dữ liệu đào tạo mở cho các hệ thống AI được coi là DPG.
Tiêu chuẩn DPG có thể phát triển theo hướng dễ dãi hơn theo thời gian, nhưng trước khi xem xét bất kỳ trường hợp ngoại lệ nào, điều quan trọng là phải hiểu rõ hơn về các phương pháp tiếp cận và công cụ đang được xem xét để giải quyết một số thách thức chính hiện tại xung quanh việc chia sẻ dữ liệu và AI. Những thách thức này bao gồm quản trị dữ liệu, tính minh bạch và trách nhiệm giải trình; sự đồng ý và cấp phép cho việc đào tạo; tuân thủ quy định và các ưu tiên về chính sách. Chúng ta cần thời gian để khám phá sâu hơn mối liên hệ giữa dữ liệu mở, chia sẻ dữ liệu và các hệ thống AI, đồng thời thu thập thêm nhiều quan điểm và sở thích từ các bên liên quan chiếm đa số trên toàn cầu. Điều này mở rộng đến tầm quan trọng tương đối của dữ liệu mở cho đào tạo chất lượng cao như một yếu tố đầu vào cho các hệ thống AI mà họ muốn xây dựng.
Ban thư ký DPGA cũng dành riêng cho việc bảo vệ tính toàn vẹn của dữ liệu mở. Gần đây, một bản cập nhật quan trọng đã được giới thiệu để củng cố cam kết này: hiện tại, chỉ các bộ sưu tập nội dung mở và tập dữ liệu có giấy phép mở hoàn toàn mới đủ điều kiện được công nhận là hàng hóa công cộng kỹ thuật số. Đối với các hệ thống AI, cần phải đảm bảo rằng chúng ta không vô tình làm suy yếu phong trào dữ liệu mở và dữ liệu mở như một loại DPG bằng cách thúc đẩy một cách tiếp cận đối với các hệ thống AI dễ dãi hơn so với các chủng loại DPG khác.
Việc duy trì một rào cản cao đối với dữ liệu đào tạo có khả năng dẫn đến ít hệ thống AI đáp ứng các tiêu chí Tiêu chuẩn DPG hơn. Tuy nhiên, tính liên quan đến SDG, tính độc lập của nền tảng và không gây hại theo thiết kế là những tính năng giúp DPG khác biệt với các giải pháp nguồn mở khác—và vì những lý do đó, việc đưa dữ liệu đào tạo vào là cần thiết. Với DPG, chúng tôi muốn giúp phát triển bối cảnh AI vì lợi ích công cộng khi hệ sinh thái này hiểu rõ hơn về cách giải quyết những phức tạp liên quan đến dữ liệu mở và chia sẻ dữ liệu.
Đề xuất cuối cùng của Hội đồng Tiêu chuẩn DPG, bao gồm việc yêu cầu dữ liệu đào tạo mở cho các hệ thống AI dưới dạng DPG, sẽ xuất hiện trên GitHub vào đầu tháng 11 và sẽ mở để công chúng bình luận trong thời gian đánh giá cộng đồng kéo dài 4 tuần. Tại cuộc họp thường niên sắp tới của các thành viên và trong năm tới, Ban thư ký DPGA mong muốn thúc đẩy và đóng góp vào các cuộc thảo luận cực kỳ quan trọng này cùng với bối cảnh ngày càng mở rộng của các bên liên quan cam kết đảm bảo AI Nguồn Mở thúc đẩy các mục tiêu vì lợi ích công cộng. Điều đó cũng bao gồm các bên liên quan trong cộng đồng dữ liệu mở, nội dung mở và kiến thức mở có thể giúp cung cấp thông tin cho các cuộc thảo luận cực kỳ quan trọng này. Hãy tham gia cùng chúng tôi trong các cuộc thảo luận này!
*Cập nhật: Đề xuất cuối cùng của Hội đồng Tiêu chuẩn DPG, sẽ mở để công chúng bình luận trong 4 tuần, đã được công bố vào ngày 5/11 trên GitHub và có thể xem tại đây.
Tác giả: admin
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Trang Web này được thành lập theo Quyết định số 142/QĐ-HH do Chủ tịch Hiệp hội các trường đại học, cao đẳng Việt Nam – AVU&C (Association of Vietnam Universities and Colleges), GS.TS. Trần Hồng Quân ký ngày 16/09/2019, ngay trước thềm của Hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do 5...