How digital public goods can help unlock the public interest potential of AI
December 12, 2024
Bài được đưa lên Internet ngày: 12/12/2024
Author: Liv Marte Nordhaug, Secretariat CEO, Digital Public Goods Alliance
Trong vài tháng qua, đỉnh điểm là các hội thảo chuyên sâu tại Cuộc họp thường niên của Liên minh Hàng hóa Công cộng Kỹ thuật số - DPGA (Digital Public Goods Alliance) năm 2024 tại Singapore, Ban thư ký DPGA đã dành nhiều thời gian để triệu tập các cuộc thảo luận về trí tuệ nhân tạo (AI), đặc biệt liên quan đến cách hàng hóa công cộng kỹ thuật số có thể thúc đẩy AI vì lợi ích công cộng. Trong suốt các cuộc thảo luận này, những người tham gia đã nêu bật nhiều thách thức đang ngăn cản sự phát triển của AI vì lợi ích công cộng ở quy mô lớn. Đây là lý do tại sao vào năm 2025, chúng tôi muốn giúp tìm nguồn các công cụ nguồn mở có thể giảm bớt những rào cản này và trở thành một phần của các giải pháp cần thiết.
Mặc dù không có sự đồng thuận chính xác về định nghĩa AI vì lợi ích công cộng, nhưng hiểu biết chung được chấp nhận, như đã đề cập trên blog của Ban thư ký DPGA vào tháng 6, bao gồm những điều sau: "các mục tiêu mong muốn như cho phép sử dụng AI tốt hơn để giải quyết các thách thức xã hội và môi trường cấp bách, cải thiện khả năng tiếp cận các năng lực phát triển AI để thúc đẩy đổi mới và thúc đẩy việc tạo ra các giải pháp cục bộ địa phương cho các thách thức cụ thể theo bối cảnh, hỗ trợ nghiên cứu AI cơ bản và nghiên cứu trong các lĩnh vực khác như phát triển thuốc và định hình cấu trúc thị trường để giải quyết tình trạng mất cân bằng thị trường".
Với suy nghĩ này, có vẻ tự nhiên khi hàng hóa công cộng kỹ thuật số (DPG) đóng vai trò quan trọng trong việc theo đuổi AI vì lợi ích công cộng, nhưng điều đó không có nghĩa là mọi việc sẽ đơn giản. Như tôi đã nêu trên một blog DPGA khác trước đây, "việc duy trì một rào cản cao đối với dữ liệu đào tạo có khả năng dẫn đến ít hệ thống AI đáp ứng các tiêu chí Tiêu chuẩn DPG hơn. Tuy nhiên, tính liên quan của SDG, tính độc lập của nền tảng và tính không gây hại theo thiết kế là những tính năng giúp DPG khác biệt với các giải pháp nguồn mở khác—và vì những lý do đó, việc đưa dữ liệu đào tạo vào là cần thiết".
Trên cùng blog đó, tôi cũng đã viết rằng "với DPG, chúng tôi muốn giúp phát triển bối cảnh AI vì lợi ích công cộng khi hệ sinh thái hiểu rõ hơn về cách giải quyết những phức tạp liên quan đến dữ liệu mở và chia sẻ dữ liệu".
Tại Ban thư ký DPGA, chúng tôi tiếp tục tự hỏi bản thân và các chuyên gia có liên quan về cách chúng tôi có thể giúp giải quyết một số phức tạp này. Ở đây, tôi xin nêu bật quan điểm hiện tại của chúng tôi:
DPG là công cụ cho AI vì lợi ích công cộng
Chúng tôi muốn đẩy nhanh việc sử dụng DPG có thể đóng vai trò là công cụ để giải quyết các rào cản trong việc thúc đẩy AI vì lợi ích công cộng. Ví dụ, điều này có thể bao gồm các giải pháp cải thiện quản trị dữ liệu, tính minh bạch và trách nhiệm giải trình; sự đồng ý và cấp phép để đào tạo; tuân thủ quy định và các ưu tiên về chính sách. Chúng tôi sẽ nỗ lực để đưa các công cụ nguồn mở như vậy lên trước trong khi vẫn cam kết hoàn toàn thúc đẩy các hệ thống AI dưới dạng DPG, trong đó mỗi thành phần có liên quan của một hệ thống AI nhất định (bao gồm dữ liệu đào tạo) được công khai và các tiêu chí liên quan đến DPG khác được đáp ứng.
Một số rào cản hoàn toàn mang tính công nghệ, trong khi những rào cản khác liên quan đến các quy trình và chuẩn mực đã được thiết lập, bao gồm nhu cầu xây dựng nhận thức, kiến thức và lòng tin. Trong một số trường hợp, cần phải có những thay đổi về luật pháp hoặc các hình thức thủ tục pháp lý khác trước khi có thể thực hiện hành động có ý nghĩa, trong khi những thách thức khác có thể được giải quyết ngay lập tức - bằng các công cụ phù hợp. Sau đây là một số ví dụ về các thách thức hoặc chủ đề kỹ thuật mà chúng tôi đã nghe đề cập cho đến nay, trong đó DPG có thể hữu ích:
Trích xuất dữ liệu từ các định dạng không thể đọc được bằng máy (như PDF).
Xác định thông tin cấp phép, trạng thái phạm vi công cộng hoặc tín hiệu đồng ý của nội dung/dữ liệu.
Theo dõi nguồn gốc dữ liệu.
Kiểm tra và xác thực tập dữ liệu.
Thu thập và dán nhãn dữ liệu (như dữ liệu đa ngôn ngữ).
Tạo dữ liệu tổng hợp, ẩn danh và che giấu.
DPG, với vai trò là các giải pháp kỹ thuật số mở, có thể thích ứng, có tài liệu hướng dẫn có thể giúp tạo điều kiện tái sử dụng, có thể đóng vai trò quan trọng như các công cụ để giải quyết những thách thức chung đối với việc mở rộng AI vì lợi ích công cộng - cả trong tương lai gần và dài hạn. Đặc biệt, DPG có thể giúp mở khóa nhiều dữ liệu đào tạo mở chất lượng cao hơn và chia sẻ dữ liệu. Chúng cũng có thể giải quyết các thách thức khác về AI vì lợi ích công cộng như thử nghiệm và xác thực các hệ thống AI và có khả năng cung cấp các công cụ, tài nguyên hoặc đóng vai trò là ví dụ về cách giảm yêu cầu về sức mạnh tính toán để phát triển và triển khai AI, giúp AI dễ tiếp cận hơn trong các môi trường hạn chế về tài nguyên và giảm tiêu thụ năng lượng.
Lý tưởng nhất là chúng tôi muốn thấy sự phát triển của một bộ công cụ đồng tiến hóa gồm các công cụ nguồn mở bổ sung mà nhiều bên liên quan có thể sử dụng và điều chỉnh khi cần để giải quyết các thách thức cụ thể hoặc độc đáo của họ. Thành công trong việc xác định và/hoặc xây dựng các DPG có tác động cao nhất như một phần của bộ công cụ sẽ phụ thuộc vào việc huy động các nhóm chuyên gia và bên liên quan đa dạng cam kết thúc đẩy AI vì lợi ích công cộng để hợp tác. Chúng tôi tin rằng việc tập trung vào các trường hợp sử dụng sẽ rất quan trọng đối với những nỗ lực này.
Các trường hợp sử dụng tác động cao
Ban thư ký DPGA đã nhận được những khuyến nghị và hiểu biết hữu ích về nơi có nhiều cơ hội nhất để liên kết trong ba phiên họp AI vì lợi ích công cộng khác nhau tại Cuộc họp thành viên thường niên của DPGA tại Singapore.
Một điểm chung là trong khi có những thách thức cực kỳ phức tạp liên quan đến dữ liệu mở và chia sẻ dữ liệu, đặc biệt là khi liên quan đến những cân nhắc quan trọng về quyền riêng tư và dữ liệu cá nhân nhạy cảm, thì vẫn có những lĩnh vực khác có thể được giải quyết theo cách đơn giản hơn. Ví dụ, các lĩnh vực phần lớn không liên quan đến dữ liệu nhận dạng cá nhân, như hình ảnh vệ tinh, khoa học khí hậu và thiên nhiên mở, và thông tin chuỗi cung ứng có thể dễ dàng phát triển hơn và có giá trị đối với lợi ích công cộng của AI và các mục tiêu phát triển bền vững.
Một suy nghĩ khác được chia sẻ là trong khi nhiều loại thu thập dữ liệu có thể gây ra rủi ro về quyền riêng tư, ví dụ như dữ liệu giọng nói được sử dụng để phát triển các mô hình ngôn ngữ lớn, thì nhiều rủi ro về quyền riêng tư có thể được giải quyết nếu có các quy trình thu thập và quản lý bảo vệ quyền riêng tư được thiết kế tốt.
Cuối cùng, những người tham gia đã đưa ra một số ví dụ về nhu cầu xây dựng lòng tin giữa các viên chức khu vực công về cách AI có thể được sử dụng theo cách an toàn để cải thiện các dịch vụ công của họ. Bắt đầu từ quy mô nhỏ bằng cách sử dụng dữ liệu mở hiện có từ các tổ chức này để đào tạo một mô hình ngôn ngữ nhỏ nhằm giải quyết nhu cầu dịch vụ công cụ thể có thể là một cách giúp giải quyết mối quan tâm này và thúc đẩy sự thay đổi tích cực và lòng tin vào AI.
Dựa trên những thảo luận này và các thảo luận khác, chúng tôi đã đưa ra các trường hợp sử dụng tham chiếu sau đây về nơi DPG nên được xác định và/hoặc xây dựng thành công cụ cho AI vì lợi ích công cộng có tác động cao hơn:
Các mô hình ngôn ngữ lớn (LLM) đa ngôn ngữ bao gồm các ngôn ngữ chưa được phục vụ,
Các mô hình ngôn ngữ nhỏ (SLM) có thể giải quyết các nhu cầu cụ thể hơn, đặc biệt là trong cung cấp dịch vụ công,
Hành động vì khí hậu dựa trên nghiên cứu (giám sát, giảm thiểu, thích ứng).
Chúng tôi tin rằng các trường hợp sử dụng này phù hợp với Tầm nhìn của DPGA về việc thúc đẩy các mục tiêu phát triển bền vững và đóng góp cho một thế giới công bằng hơn. Điều quan trọng là khi chúng tôi tinh chỉnh các chủ đề này hơn nữa, chúng tôi sẽ đảm bảo rằng sự hiểu biết của chúng tôi về các nhu cầu và thách thức cấp bách liên quan đến từng trường hợp sử dụng tiếp tục được các bên liên quan từ các quốc gia có thu nhập thấp và trung bình, bao gồm cả cơ chế thành viên của DPGA, thông báo.
Chúng tôi sẽ khởi chạy quy trình tạo bộ công cụ này vào cuối tháng 2 năm 2025 và hy vọng bạn sẽ tham gia cùng chúng tôi trong hành trình này!
Tác giả: admin
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Trang Web này được thành lập theo Quyết định số 142/QĐ-HH do Chủ tịch Hiệp hội các trường đại học, cao đẳng Việt Nam – AVU&C (Association of Vietnam Universities and Colleges), GS.TS. Trần Hồng Quân ký ngày 16/09/2019, ngay trước thềm của Hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do 5...