Toward public interest AI: the role of AI DPGs and public resources for AI
June 30, 2024
Bài được đưa lên Internet ngày: 30/06/2024
Author: Lea Gimpel, Director of AI and Country Engagement (Visiting Fellow)
Tác giả: Lea Gimpel, Giám đốc AI và Tham gia quốc gia (Nghiên cứu viên thỉnh giảng)
Sự gia tăng của AI vì lợi ích công cộng, nói chung là các hệ thống AI phục vụ cho sự tồn tại và hạnh phúc lâu dài của loài người, và các nguồn lực công cho AI, bao gồm cơ sở hạ tầng và tài trợ cho các nhà phát triển và nghiên cứu AI, có khả năng thúc đẩy sự phát triển của các giải pháp AI sáng tạo giải quyết các thách thức toàn cầu cấp bách, từ biến đổi khí hậu đến chăm sóc sức khỏe. Mặc dù về mặt kỹ thuật tách biệt nhau, cả AI vì lợi ích công cộng và các nguồn lực công đều giao thoa vì chúng có thể đẩy nhanh quá trình phát triển, triển khai và quản trị toàn diện các DPG AI1 —các hệ thống AI là nguồn mở2, có liên quan đến SDG và không gây hại theo thiết kế. Bài đăng sau đây phản ánh về sự giao thoa này giữa AI vì lợi ích công cộng, DPG AI và tài trợ công cho cơ sở hạ tầng AI. Bài viết này được thông báo bởi Hội nghị Bellagio về các nguồn lực công cho AI do Quỹ Rockefeller tổ chức từ ngày 3 đến ngày 7/06/2024.
Kể từ khi OpenAI ra mắt ChatGPT, các cuộc thảo luận liên quan đến các quy định về AI đã trở nên sôi nổi hơn giữa các nhà hoạch định chính sách, nhà công nghệ và học giả. Điều này đã dẫn đến những kết quả hữu hình như Đạo luật AI của EU và Sắc lệnh hành pháp của Hoa Kỳ về Phát triển và Sử dụng Trí tuệ nhân tạo An toàn, Bảo mật và Đáng tin cậy. Bên cạnh sự quan tâm mạnh mẽ đến quy định về AI, gần đây đã có sự chuyển dịch sang các câu hỏi liên quan đến AI vì lợi ích công cộng để đảm bảo những tiến bộ trong công nghệ AI lấy con người làm trung tâm và phục vụ lợi ích công cộng. Điều này đang chuyển hướng cuộc trò chuyện để vượt ra ngoài việc thảo luận về cách giảm thiểu rủi ro, như được phản ánh trong các quy định đã đề cập ở trên. Đồng thời, thuật ngữ "AI công cộng" (Public AI) xuất hiện, ám chỉ AI là cơ sở hạ tầng công cộng được khu vực công tạo điều kiện tiếp cận để mang lại lợi ích cho tất cả mọi người, chịu trách nhiệm trước công chúng và phản ánh các giá trị của xã hội.
Mặc dù chưa có sự đồng thuận, vài mục tiêu mong muốn gắn với Ai công cộng và vì lợi ích công cộng bao gồm:
xúc tác tốt hơn cho việc sử dụng Ai để xử lý các thách thức cấp bách về xã hội và môi trường,
cải thiện quyền truy cập tới các năng lực phát triển AI để thúc đẩy đổi mới và khuyến khích sáng tạo ra các giải pháp được bản địa hóa cho các thách thức đặc thù ngữ cảnh,
hỗ trợ cho nghiên cứu AI cơ bản và nghiên cứu trong các lĩnh vực khác, chẳng hạn như phát triển thuốc,
định hình cấu trúc thị trường và giải quyết sự mất cân bằng của thị trường.
Hiện tại, sự thống trị thị trường trong toàn bộ công nghệ AI (tức là phần cứng, máy tính, tập dữ liệu, mô hình, điểm chuẩn và các công cụ khác) đang bị tập trung hóa cao độ và do rất ít công ty và khu vực thống trị. Điều này hạn chế các lợi ích tiềm năng về lợi ích công cộng của AI và làm trầm trọng thêm tình trạng bất bình đẳng về mặt cấu trúc trong và giữa các xã hội vì hầu hết các quốc gia đều không được tiếp cận với các nguồn lực phát triển AI quan trọng. Điều này đặc biệt đáng lo ngại vì nhiều quốc gia như vậy đang phải đối mặt với tình trạng thất bại của thị trường trong việc cung cấp các dịch vụ cơ bản. Hiện tại không có cơ hội thị trường nào cho các công ty công nghệ lớn có thể chứng minh cho các khoản đầu tư tư nhân vào các tập dữ liệu cục bộ địa phương, cụ thể theo lĩnh vực, đào tạo mô hình và phát triển sản phẩm có thể giải quyết các thách thức phát triển. Do đó, cần có các giải pháp tại địa phương.
Để giải quyết vấn đề hiện tại, cần tăng cường quyền truy cập tới các thành phần cơ sở hạ tầng AI cơ bản. Một số sáng kiến đang được triển khai, chẳng hạn như Nguồn lực nghiên cứu AI quốc gia tại Hoa Kỳ và Liên doanh điện toán hiệu suất cao của Liên minh châu Âu cùng sự hợp tác của họ với các đối tác châu Phi.
Tuy nhiên, quyền truy cập tới tính toán chỉ là một khía cạnh và đi kèm với các câu hỏi bổ sung liên quan đến việc tài trợ và xây dựng cơ sở hạ tầng máy tính có chủ quyền. Các lớp khác của ngăn xếp công nghệ AI, chẳng hạn như các tập dữ liệu, mô hình và chuẩn mực, cũng phải được giải quyết3. Lý tưởng nhất là thực hiện điều này theo cách nguồn mở để tạo điều kiện tiếp cận và đại diện công bằng. Nếu không có những can thiệp như vậy, hầu hết các quốc gia sẽ tiếp tục phải đối mặt với những rào cản to lớn để phát triển các giải pháp AI vì lợi ích công cộng có tác động cao có thể giải quyết các thách thức phát triển tại địa phương. Do đó, AI vì lợi ích công cộng không chỉ đòi hỏi phải có quy định có ý nghĩa để ngăn ngừa tác hại mà còn phải phân bổ nguồn lực công trên toàn bộ ngăn xếp công nghệ AI để đẩy nhanh lợi ích công cộng vượt ra ngoài lợi ích của thị trường tư nhân. Điều này cũng nằm trong truyền thống của các khoản đầu tư công trước đây vào công nghệ để mang lại lợi ích cho xã hội, chẳng hạn như phát minh ra Internet và các sứ mệnh đầu tiên đi vào không gian.
Một số tổ chức đã làm việc tuyệt vời tại giao điểm của những cuộc tranh luận này, bao gồm nhưng không giới hạn ở Viện AI Now Institute, Dự án An ninh Kinh tế, Tương lai Mở (Open Future), Dự án Trí tuệ Tập thể và Quyền Mã hóa4.
Tuy nhiên, phần lớn điều này đòi hỏi các cuộc thảo luận nhiều sắc thái xung quanh phương tiện và mục đích, hiểu sâu hơn về ngăn xếp công nghệ AI và khả năng khái quát hóa các thành phần của nó, nhưng cũng cần các nguyên tắc chuẩn mực để hướng dẫn bất kỳ khoản đầu tư công nào vào ngăn xếp công nghệ AI vì lợi ích công cộng. Theo quan điểm của Ban thư ký Liên minh hàng hóa công cộng kỹ thuật số và công việc của chúng tôi trong việc hỗ trợ phát triển, triển khai và khả năng khám phá DPG AI, các điểm sau đây nêu bật những cân nhắc chính:
Hiểu được mối quan hệ giữa AI vì lợi ích công cộng và hàng hóa công cộng kỹ thuật số - DPG (Digital Public Goods): DPG AI có thể đóng vai trò thiết yếu trong việc đảm bảo rằng các mô hình hoặc hệ thống AI Nguồn Mở có liên quan đến mục tiêu phát triển bền vững - SDG (Sustainable Development Goals) có sẵn trên toàn cầu. Chúng cung cấp cho khu vực công và tư nhân các công cụ để thúc đẩy lợi ích công cộng bằng cách sử dụng các hệ thống nguồn mở đã được thẩm định dưới dạng DPG AI được công nhận, được thiết kế để giải quyết các thách thức xã hội và môi trường. Tóm lại, tất cả DPG AI đều có thể phục vụ lợi ích công cộng nếu được áp dụng và quản lý có trách nhiệm, nhưng không phải mọi công nghệ AI vì lợi ích công cộng đều sẽ là hàng hóa công cộng kỹ thuật số do những hạn chế về tính mở của chúng (xem điểm tiếp theo).
AI vì lợi ích công cộng không nhất thiết phải là nguồn mở: AI phục vụ lợi ích công cộng lý tưởng nhất phải là mã nguồn mở và tuân thủ Tiêu chuẩn DPG để đảm bảo các hoạt động phát triển có trách nhiệm5. Tuy nhiên, có thể có một số lý do khiến tính mở đầy đủ không được kỳ vọng. Những lý do này bao gồm nhưng không giới hạn ở quyền riêng tư của chủ thể dữ liệu và sự đánh đổi giữa lợi ích công cộng và lợi ích thương mại.
AI vì lợi ích công cộng nên ưu tiên các mô hình nhỏ, cụ thể cho từng nhiệm vụ: Để phục vụ các cộng đồng địa phương bằng cách giải quyết các trường hợp sử dụng cụ thể và cho phép đại diện phù hợp, loại bỏ sự thiên vị bắt nguồn từ các tập dữ liệu lớn, không có cấu trúc và giảm thiểu các thách thức về môi trường phát sinh từ việc đào tạo các mô hình ngày càng lớn hơn hỗ trợ AI tạo sinh, cần tập trung vào các mô hình nhỏ, cụ thể cho từng nhiệm vụ. Do thiếu tính mở trong các mô hình AI tạo sinh, hiện đang là cơ sở cho nhiều ứng dụng, nên cách tiếp cận như vậy cũng sẽ hỗ trợ tăng DPG AI, vì các mô hình nhỏ hơn, được phát triển có trách nhiệm có thể tuân thủ dễ dàng hơn với định nghĩa nguồn mở và Tiêu chuẩn DPG.
Đầu tư vào công nghệ AI để thúc đẩy AI vì lợi ích công cộng nên là hỗ trợ cho AI Nguồn Mở: Đầu tư công nên cho phép truy cập mở vào các tài nguyên phát triển AI mà không hoặc chỉ có rất ít sự kiểm soát, nhắm mục tiêu và mang lại lợi ích cho các cộng đồng, nhà nghiên cứu và doanh nghiệp vừa và nhỏ chưa được phục vụ đầy đủ. Như câu nói dành cho phần mềm: "tiền công, mã công". Điều tương tự cũng đúng đối với bất kỳ sự phát triển các hệ thống AI nào do công chúng tài trợ ở mức độ lớn nhất có thể. Nếu các công ty được xây dựng dựa trên nguồn tài trợ công, công chúng cũng nên nắm giữ cổ phần chi phối.
Đầu tư công vào công nghệ AI nên áp dụng cách tiếp cận về Hạ tầng Công cộng Kỹ thuật số - DPI (Digital Public Infrastructure): Chúng cần mang tính chiến lược và tối đa hóa kết quả đầu ra bằng cách học hỏi từ việc triển khai cơ sở hạ tầng công cộng kỹ thuật số. Điều này có nghĩa là hỗ trợ các nền tảng và khối xây dựng thay vì các giải pháp, trường hợp sử dụng hoặc tổ chức riêng lẻ. Đầu tư công vào cơ sở hạ tầng AI nên xem xét các nguyên tắc kiến trúc DPI như khả năng tương tác, truy cập đa phương thức, cơ sở hạ tầng phi tập trung/liên kết và an toàn và bảo mật theo thiết kế.
Cần có các nguyên tắc và điều kiện để đầu tư nguồn lực công vào AI: Các hướng dẫn này chỉ đạo việc cung cấp và tiếp cận các nguồn lực công khắp toàn bộ công nghệ AI và nên được phát triển trong một quy trình hợp tác, có sự tham gia của nhiều bên liên quan. Điều này bao gồm đảm bảo rằng các nguồn lực có thể tiếp cận được và trao quyền cho các nhóm yếu thế, rằng các kết quả phù hợp với các cân nhắc về tính bền vững, tập trung vào tác động chuyển đổi, v.v.
Đầu tư công vào cơ sở hạ tầng AI có thể trở thành phương tiện cho AI dân chủ: Việc tiếp cận các nguồn lực phát triển AI bằng cách ủng hộ phương pháp tiếp cận nguồn mở chỉ là một chiều hướng của việc dân chủ hóa và định hướng sự phát triển của AI theo hướng vì lợi ích công cộng. Bằng cách liên kết các cộng đồng nguồn mở với các nhà hoạt động dân chủ, nguồn tài trợ cho cơ sở hạ tầng AI công có thể trở thành động lực cho sự phát triển tập thể vượt ra ngoài các cộng đồng nguồn mở và quản trị toàn diện.
--------------------
Các chú thích
1. DPGA đã đồng tổ chức một cộng đồng thực hành với UNICEF để định nghĩa AI DPG và xây dựng các khuyến nghị để cập nhật Tiêu chuẩn DPG. Các khuyến nghị sẽ được công khai vào mùa thu năm 2024, khi Sáng kiến Nguồn Mở công bố định nghĩa AI nguồn mở của mình. Báo cáo tạm thời có thể được tìm thấy tại đây và bài đăng trên blog nêu tóm tắt tiến trình đạt được tại đây.
2. Hiểu rằng chưa có định nghĩa nào được thống nhất cho các hệ thống AI Nguồn Mở, Sáng kiến Nguồn Mở (OSI) hiện đang tạo điều kiện cho một quy trình hợp tác mở để định nghĩa nó. Phiên bản dự thảo mới nhất có thể được tìm thấy tại đây.
3. Các ví dụ bao gồm dự án huy động cộng đồng cho dữ liệu giọng nói “Mozilla Common Voice”, cơ sở hạ tầng lưu trữ dữ liệu bản địa do người Iwi Māori xây dựng, dành cho người Iwi Māori và họ LLM SEA-LION do chính phủ Singapore phát triển.
4. Báo cáo sắp tới của Coding Right có tên “AI Commons (Tài sản chung AI): nuôi dưỡng các giải pháp thay thế cho văn hóa độc quyền của Big Tech” đã xác định hơn 200 tổ chức, nhiều tổ chức trong số đó có trụ sở tại các quốc gia có đa số dân số trên toàn cầu, đang hướng tới một AI Commons (Tài sản chung AI) phi tập trung, ủng hộ một con đường thay thế, công bằng để phát triển AI. Xem thêm: https://codingrights.org/docs/Federated_AI_Commons_ecosystem_T20Policybriefing.pdf
5. Tiêu chuẩn DPG không giám sát việc triển khai hạ nguồn các sản phẩm được công nhận là hàng hóa công cộng kỹ thuật số. Bất kể thế nào, việc triển khai, giám sát và quản lý bất kỳ AI DPG nào cũng phải tuân theo các thông lệ đạo đức và có trách nhiệm để phục vụ lợi ích công cộng.
Tác giả: admin
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Trang Web này được thành lập theo Quyết định số 142/QĐ-HH do Chủ tịch Hiệp hội các trường đại học, cao đẳng Việt Nam – AVU&C (Association of Vietnam Universities and Colleges), GS.TS. Trần Hồng Quân ký ngày 16/09/2019, ngay trước thềm của Hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do 5...