 
            How digital public goods can help unlock the public interest potential of AI
December 12, 2024
Bài được đưa lên Internet ngày: 12/12/2024
Author: Liv Marte Nordhaug, Secretariat CEO, Digital Public Goods Alliance
Trong vài tháng qua, đỉnh điểm là các hội thảo chuyên sâu tại Cuộc họp thường niên của Liên minh Hàng hóa Công cộng Kỹ thuật số - DPGA (Digital Public Goods Alliance) năm 2024 tại Singapore, Ban thư ký DPGA đã dành nhiều thời gian để triệu tập các cuộc thảo luận về trí tuệ nhân tạo (AI), đặc biệt liên quan đến cách hàng hóa công cộng kỹ thuật số có thể thúc đẩy AI vì lợi ích công cộng. Trong suốt các cuộc thảo luận này, những người tham gia đã nêu bật nhiều thách thức đang ngăn cản sự phát triển của AI vì lợi ích công cộng ở quy mô lớn. Đây là lý do tại sao vào năm 2025, chúng tôi muốn giúp tìm nguồn các công cụ nguồn mở có thể giảm bớt những rào cản này và trở thành một phần của các giải pháp cần thiết.
Mặc dù không có sự đồng thuận chính xác về định nghĩa AI vì lợi ích công cộng, nhưng hiểu biết chung được chấp nhận, như đã đề cập trên blog của Ban thư ký DPGA vào tháng 6, bao gồm những điều sau: "các mục tiêu mong muốn như cho phép sử dụng AI tốt hơn để giải quyết các thách thức xã hội và môi trường cấp bách, cải thiện khả năng tiếp cận các năng lực phát triển AI để thúc đẩy đổi mới và thúc đẩy việc tạo ra các giải pháp cục bộ địa phương cho các thách thức cụ thể theo bối cảnh, hỗ trợ nghiên cứu AI cơ bản và nghiên cứu trong các lĩnh vực khác như phát triển thuốc và định hình cấu trúc thị trường để giải quyết tình trạng mất cân bằng thị trường".
Với suy nghĩ này, có vẻ tự nhiên khi hàng hóa công cộng kỹ thuật số (DPG) đóng vai trò quan trọng trong việc theo đuổi AI vì lợi ích công cộng, nhưng điều đó không có nghĩa là mọi việc sẽ đơn giản. Như tôi đã nêu trên một blog DPGA khác trước đây, "việc duy trì một rào cản cao đối với dữ liệu đào tạo có khả năng dẫn đến ít hệ thống AI đáp ứng các tiêu chí Tiêu chuẩn DPG hơn. Tuy nhiên, tính liên quan của SDG, tính độc lập của nền tảng và tính không gây hại theo thiết kế là những tính năng giúp DPG khác biệt với các giải pháp nguồn mở khác—và vì những lý do đó, việc đưa dữ liệu đào tạo vào là cần thiết".
Trên cùng blog đó, tôi cũng đã viết rằng "với DPG, chúng tôi muốn giúp phát triển bối cảnh AI vì lợi ích công cộng khi hệ sinh thái hiểu rõ hơn về cách giải quyết những phức tạp liên quan đến dữ liệu mở và chia sẻ dữ liệu".
Tại Ban thư ký DPGA, chúng tôi tiếp tục tự hỏi bản thân và các chuyên gia có liên quan về cách chúng tôi có thể giúp giải quyết một số phức tạp này. Ở đây, tôi xin nêu bật quan điểm hiện tại của chúng tôi:
DPG là công cụ cho AI vì lợi ích công cộng
Chúng tôi muốn đẩy nhanh việc sử dụng DPG có thể đóng vai trò là công cụ để giải quyết các rào cản trong việc thúc đẩy AI vì lợi ích công cộng. Ví dụ, điều này có thể bao gồm các giải pháp cải thiện quản trị dữ liệu, tính minh bạch và trách nhiệm giải trình; sự đồng ý và cấp phép để đào tạo; tuân thủ quy định và các ưu tiên về chính sách. Chúng tôi sẽ nỗ lực để đưa các công cụ nguồn mở như vậy lên trước trong khi vẫn cam kết hoàn toàn thúc đẩy các hệ thống AI dưới dạng DPG, trong đó mỗi thành phần có liên quan của một hệ thống AI nhất định (bao gồm dữ liệu đào tạo) được công khai và các tiêu chí liên quan đến DPG khác được đáp ứng.
Một số rào cản hoàn toàn mang tính công nghệ, trong khi những rào cản khác liên quan đến các quy trình và chuẩn mực đã được thiết lập, bao gồm nhu cầu xây dựng nhận thức, kiến thức và lòng tin. Trong một số trường hợp, cần phải có những thay đổi về luật pháp hoặc các hình thức thủ tục pháp lý khác trước khi có thể thực hiện hành động có ý nghĩa, trong khi những thách thức khác có thể được giải quyết ngay lập tức - bằng các công cụ phù hợp. Sau đây là một số ví dụ về các thách thức hoặc chủ đề kỹ thuật mà chúng tôi đã nghe đề cập cho đến nay, trong đó DPG có thể hữu ích:
Trích xuất dữ liệu từ các định dạng không thể đọc được bằng máy (như PDF).
Xác định thông tin cấp phép, trạng thái phạm vi công cộng hoặc tín hiệu đồng ý của nội dung/dữ liệu.
Theo dõi nguồn gốc dữ liệu.
Kiểm tra và xác thực tập dữ liệu.
Thu thập và dán nhãn dữ liệu (như dữ liệu đa ngôn ngữ).
Tạo dữ liệu tổng hợp, ẩn danh và che giấu.
DPG, với vai trò là các giải pháp kỹ thuật số mở, có thể thích ứng, có tài liệu hướng dẫn có thể giúp tạo điều kiện tái sử dụng, có thể đóng vai trò quan trọng như các công cụ để giải quyết những thách thức chung đối với việc mở rộng AI vì lợi ích công cộng - cả trong tương lai gần và dài hạn. Đặc biệt, DPG có thể giúp mở khóa nhiều dữ liệu đào tạo mở chất lượng cao hơn và chia sẻ dữ liệu. Chúng cũng có thể giải quyết các thách thức khác về AI vì lợi ích công cộng như thử nghiệm và xác thực các hệ thống AI và có khả năng cung cấp các công cụ, tài nguyên hoặc đóng vai trò là ví dụ về cách giảm yêu cầu về sức mạnh tính toán để phát triển và triển khai AI, giúp AI dễ tiếp cận hơn trong các môi trường hạn chế về tài nguyên và giảm tiêu thụ năng lượng.
Lý tưởng nhất là chúng tôi muốn thấy sự phát triển của một bộ công cụ đồng tiến hóa gồm các công cụ nguồn mở bổ sung mà nhiều bên liên quan có thể sử dụng và điều chỉnh khi cần để giải quyết các thách thức cụ thể hoặc độc đáo của họ. Thành công trong việc xác định và/hoặc xây dựng các DPG có tác động cao nhất như một phần của bộ công cụ sẽ phụ thuộc vào việc huy động các nhóm chuyên gia và bên liên quan đa dạng cam kết thúc đẩy AI vì lợi ích công cộng để hợp tác. Chúng tôi tin rằng việc tập trung vào các trường hợp sử dụng sẽ rất quan trọng đối với những nỗ lực này.
Các trường hợp sử dụng tác động cao
Ban thư ký DPGA đã nhận được những khuyến nghị và hiểu biết hữu ích về nơi có nhiều cơ hội nhất để liên kết trong ba phiên họp AI vì lợi ích công cộng khác nhau tại Cuộc họp thành viên thường niên của DPGA tại Singapore.
Một điểm chung là trong khi có những thách thức cực kỳ phức tạp liên quan đến dữ liệu mở và chia sẻ dữ liệu, đặc biệt là khi liên quan đến những cân nhắc quan trọng về quyền riêng tư và dữ liệu cá nhân nhạy cảm, thì vẫn có những lĩnh vực khác có thể được giải quyết theo cách đơn giản hơn. Ví dụ, các lĩnh vực phần lớn không liên quan đến dữ liệu nhận dạng cá nhân, như hình ảnh vệ tinh, khoa học khí hậu và thiên nhiên mở, và thông tin chuỗi cung ứng có thể dễ dàng phát triển hơn và có giá trị đối với lợi ích công cộng của AI và các mục tiêu phát triển bền vững.
Một suy nghĩ khác được chia sẻ là trong khi nhiều loại thu thập dữ liệu có thể gây ra rủi ro về quyền riêng tư, ví dụ như dữ liệu giọng nói được sử dụng để phát triển các mô hình ngôn ngữ lớn, thì nhiều rủi ro về quyền riêng tư có thể được giải quyết nếu có các quy trình thu thập và quản lý bảo vệ quyền riêng tư được thiết kế tốt.
Cuối cùng, những người tham gia đã đưa ra một số ví dụ về nhu cầu xây dựng lòng tin giữa các viên chức khu vực công về cách AI có thể được sử dụng theo cách an toàn để cải thiện các dịch vụ công của họ. Bắt đầu từ quy mô nhỏ bằng cách sử dụng dữ liệu mở hiện có từ các tổ chức này để đào tạo một mô hình ngôn ngữ nhỏ nhằm giải quyết nhu cầu dịch vụ công cụ thể có thể là một cách giúp giải quyết mối quan tâm này và thúc đẩy sự thay đổi tích cực và lòng tin vào AI.
Dựa trên những thảo luận này và các thảo luận khác, chúng tôi đã đưa ra các trường hợp sử dụng tham chiếu sau đây về nơi DPG nên được xác định và/hoặc xây dựng thành công cụ cho AI vì lợi ích công cộng có tác động cao hơn:
Các mô hình ngôn ngữ lớn (LLM) đa ngôn ngữ bao gồm các ngôn ngữ chưa được phục vụ,
Các mô hình ngôn ngữ nhỏ (SLM) có thể giải quyết các nhu cầu cụ thể hơn, đặc biệt là trong cung cấp dịch vụ công,
Hành động vì khí hậu dựa trên nghiên cứu (giám sát, giảm thiểu, thích ứng).
Chúng tôi tin rằng các trường hợp sử dụng này phù hợp với Tầm nhìn của DPGA về việc thúc đẩy các mục tiêu phát triển bền vững và đóng góp cho một thế giới công bằng hơn. Điều quan trọng là khi chúng tôi tinh chỉnh các chủ đề này hơn nữa, chúng tôi sẽ đảm bảo rằng sự hiểu biết của chúng tôi về các nhu cầu và thách thức cấp bách liên quan đến từng trường hợp sử dụng tiếp tục được các bên liên quan từ các quốc gia có thu nhập thấp và trung bình, bao gồm cả cơ chế thành viên của DPGA, thông báo.
Chúng tôi sẽ khởi chạy quy trình tạo bộ công cụ này vào cuối tháng 2 năm 2025 và hy vọng bạn sẽ tham gia cùng chúng tôi trong hành trình này!
Tác giả: admin
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Trang Web này được thành lập theo Quyết định số 142/QĐ-HH do Chủ tịch Hiệp hội các trường đại học, cao đẳng Việt Nam – AVU&C (Association of Vietnam Universities and Colleges), GS.TS. Trần Hồng Quân ký ngày 16/09/2019, ngay trước thềm của Hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do 5...
 Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc. Lời nhắc với vài ví dụ/minh họa (Few-Shot Prompting)
        Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc. Lời nhắc với vài ví dụ/minh họa (Few-Shot Prompting)
     Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc. Lời nhắc không có ví dụ/minh họa (Zero-Shot Prompting)
        Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc. Lời nhắc không có ví dụ/minh họa (Zero-Shot Prompting)
     Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc
        Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc
     Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Ví dụ về lời nhắc
        Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Ví dụ về lời nhắc
     Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Mẹo chung cho việc thiết kế lời nhắc
        Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Mẹo chung cho việc thiết kế lời nhắc
     Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Các thành phần của lời nhắc
        Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Các thành phần của lời nhắc
     Tài nguyên Giáo dục Mở trong kỷ nguyên AI
        Tài nguyên Giáo dục Mở trong kỷ nguyên AI
     50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
        50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
     Các bài toàn văn cho tới hết năm 2024
        Các bài toàn văn cho tới hết năm 2024
     Các bài trình chiếu trong năm 2024
        Các bài trình chiếu trong năm 2024
     Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
        Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
     Các tài liệu dịch sang tiếng Việt tới hết năm 2024
        Các tài liệu dịch sang tiếng Việt tới hết năm 2024
     Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
        Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
     Bộ các tài liệu hướng dẫn của UNESCO cho các chính phủ và cơ sở để triển khai Khuyến nghị Tài nguyên Giáo dục Mở
        Bộ các tài liệu hướng dẫn của UNESCO cho các chính phủ và cơ sở để triển khai Khuyến nghị Tài nguyên Giáo dục Mở
     Hướng dẫn thực hành về Giáo dục Mở cho các học giả: Hiện đại hóa giáo dục đại học thông qua các thực hành Giáo dục Mở (dựa trên Khung OpenEdu)
        Hướng dẫn thực hành về Giáo dục Mở cho các học giả: Hiện đại hóa giáo dục đại học thông qua các thực hành Giáo dục Mở (dựa trên Khung OpenEdu)
     Chứng chỉ Creative Commons cho các nhà giáo dục, thủ thư hàn lâm, và văn hóa mở
        Chứng chỉ Creative Commons cho các nhà giáo dục, thủ thư hàn lâm, và văn hóa mở
     Các mô hình bền vững Tài nguyên Giáo dục Mở (TNGDM) - Tổng hợp
        Các mô hình bền vững Tài nguyên Giáo dục Mở (TNGDM) - Tổng hợp
     ORCID - Quy trình làm việc
        ORCID - Quy trình làm việc
     Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
        Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
     Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
        Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
     Europeana - mô hình mẫu về hệ thống liên thông, Dữ liệu Mở (Liên kết) và dữ liệu FAIR của OpenGLAM/Văn hóa Mở
        Europeana - mô hình mẫu về hệ thống liên thông, Dữ liệu Mở (Liên kết) và dữ liệu FAIR của OpenGLAM/Văn hóa Mở
     Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
        Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
     ‘Bộ công cụ Khoa học Mở của UNESCO’ - Các bản dịch sang tiếng Việt
        ‘Bộ công cụ Khoa học Mở của UNESCO’ - Các bản dịch sang tiếng Việt
     Định nghĩa các khái niệm liên quan tới Khoa học Mở
        Định nghĩa các khái niệm liên quan tới Khoa học Mở
     ‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
        ‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
     ‘ĐÁNH DẤU KHÓA HỌC MỞ VÀ KHAM ĐƯỢC: CÁC THỰC HÀNH TỐT NHẤT VÀ CÁC TRƯỜNG HỢP ĐIỂN HÌNH’ - VÀI THÔNG TIN HỮU ÍCH
        ‘ĐÁNH DẤU KHÓA HỌC MỞ VÀ KHAM ĐƯỢC: CÁC THỰC HÀNH TỐT NHẤT VÀ CÁC TRƯỜNG HỢP ĐIỂN HÌNH’ - VÀI THÔNG TIN HỮU ÍCH
     Khóa học cơ bản về Dữ liệu Mở trong chương trình học tập điện tử trên Cổng Dữ liệu châu Âu
        Khóa học cơ bản về Dữ liệu Mở trong chương trình học tập điện tử trên Cổng Dữ liệu châu Âu