CC Signals Implementation
Theo: https://creativecommons.org/ai-and-the-commons/cc-signals/implementation/
Hãy cùng tìm hiểu những suy nghĩ ban đầu của chúng tôi dưới đây, sau đó giúp định hình những gì sẽ diễn ra tiếp theo! Chúng tôi đang tìm kiếm ý tưởng, phản hồi và câu hỏi của bạn về các khía cạnh pháp lý, kỹ thuật và xã hội của công việc này.
Chúng tôi đặc biệt muốn thu thập ý kiến đóng góp cho các câu hỏi sau:
Các tín hiệu CC hướng đến việc yêu cầu các nhà phát triển AI hành động có đi có lại. Bạn thấy tính có đi có lại trong hệ sinh thái AI như thế nào? Làm thế nào chúng ta có thể cải thiện các tín hiệu được đề xuất để đạt được tính có đi có lại tốt hơn?
Quản trị cộng đồng sẽ là chìa khóa để xác định thời điểm và cách thức áp dụng các tín hiệu CC. Bạn nghĩ các quyết định của người quản lý nội dung nên được đưa ra như thế nào? Ưu tiên của ai là quan trọng trong những quyết định này?
Các tín hiệu CC ưu tiên việc chuẩn hóa và khả năng đọc máy để tăng tính hữu ích của chúng, nhưng điều này đi kèm với chi phí. Bạn nghĩ chúng ta nên cân nhắc sự đánh đổi giữa các cân nhắc cụ thể theo ngữ cảnh và mục tiêu của hành động tập thể nhằm thúc đẩy thay đổi hành vi của những người tái sử dụng hoạt động ở quy mô lớn như thế nào?
Hãy tham gia bằng cách chia sẻ phản hồi của bạn.
Các tín hiệu CC
Bắt đầu tại đây: Nếu bạn chưa đọc, hãy đọc qua bối cảnh và những cân nhắc đang định hình sự phát triển của tín hiệu CC. Bạn cũng có thể tải xuống báo cáo của chúng tôi.
Giờ bạn đã có kiến thức nền, hãy cùng tìm hiểu chi tiết.
Ý tưởng đằng sau tín hiệu CC rất đơn giản. Sử dụng tín hiệu CC, người quản lý một bộ sưu tập nội dung lớn có thể thể hiện một tập hợp các tiêu chí mà các nhà phát triển AI phải đáp ứng. Các tiêu chí được tổ chức xung quanh các khía cạnh khác nhau của tính có đi có lại và nhằm mục đích thúc đẩy hành động thiết thực và có ý nghĩa.
Tín hiệu CC được thiết kế để cả máy móc và con người đều có thể hiểu được.
Bộ tín hiệu CC
Dự án này lấy cảm hứng từ các khái niệm cơ bản thường được nhắc đến trong các cuộc tranh luận về AI—sự đồng thuận, đền bù và ghi công trạng—nhưng theo một góc nhìn cụ thể. Cách tiếp cận của chúng tôi được thúc đẩy bởi mục tiêu tăng cường và duy trì khả năng tiếp cận tri thức của công chúng.
Mỗi tín hiệu bao gồm các điều kiện mà nội dung có thể được sử dụng để máy móc sử dụng lại được. Đây là những tiêu chí mà các nhà phát triển AI phải đáp ứng để sử dụng nội dung cho mục đích phát triển AI. Tất cả các tiêu chí được thiết kế để thúc đẩy tính có đi có lại theo những cách vừa có ý nghĩa vừa thiết thực, xét đến quy mô máy móc sử dụng lại được. Đề xuất ban đầu của chúng tôi bao gồm các yếu tố tín hiệu sau:
Credit — Ghi công trạng: Bạn phải ghi nhận công trạng phù hợp dựa trên phương pháp, phương tiện và bối cảnh sử dụng của bạn.
Direct Contribution — Đóng góp trực tiếp: Bạn phải hỗ trợ bằng tiền hoặc hiện vật cho Bên khai báo để họ phát triển và duy trì tài sản, dựa trên định giá thiện chí, có tính đến việc bạn sử dụng tài sản đó và khả năng tài chính của bạn.
Ecosystem Contribution — Đóng góp cho hệ sinh thái: Bạn phải hỗ trợ bằng tiền hoặc hiện vật cho hệ sinh thái mà bạn được hưởng lợi, dựa trên định giá thiện chí, có tính đến việc bạn sử dụng tài sản đó và khả năng tài chính của bạn.
Open — Mở: Hệ thống AI được sử dụng phải là mở. Ví dụ: các hệ thống AI phải đáp ứng Khung Mô hình Mở (MOF) Loại II, MOF Loại I hoặc Định nghĩa AI Nguồn Mở (OSAID).
Lưu ý: Việc ghi công trạng được đưa vào trong mỗi tín hiệu vì chúng tôi tin rằng đây là một hình thức có đi có lại cơ bản, mang lại lợi ích cho chu trình tri thức rộng hơn. Trong đề xuất này, các tín hiệu khác loại trừ lẫn nhau. Danh sách các tín hiệu được giới hạn một cách có chủ ý để tập thể các nhà quản lý dữ liệu và cộng đồng nắm giữ dữ liệu của họ có thể thống nhất trong việc kêu gọi áp dụng chúng với các nhà phát triển AI. Điều này cuối cùng sẽ xây dựng các mạng lưới cho hành động tập thể, đòi hỏi sự có đi có lại trong hệ sinh thái AI.
Cách thức hoạt động của Tín hiệu CC
Ai đang áp dụng tín hiệu:
Bên Khai báo là người chỉ định cách thức máy móc nên sử dụng bộ sưu tập nội dung. Đôi khi, Bên Khai báo sẽ nắm giữ bản quyền hoặc có thẩm quyền đại diện cho chủ sở hữu quyền đối với nội dung đó. Trong những trường hợp này, tín hiệu CC có thể có hiệu lực pháp lý tùy thuộc vào khu vực pháp lý cụ thể. Trong trường hợp bộ sưu tập nội dung bao gồm nội dung từ nhiều tác giả, Bên Khai báo có trách nhiệm phối hợp với cộng đồng của mình để xác định tín hiệu phù hợp.
Phạm vi sử dụng máy móc được tín hiệu đề cập:
Bên Khai báo (Declaring Party) áp dụng tín hiệu CC cho một tập hợp các danh mục tiêu chuẩn bao gồm việc sử dụng máy móc, từ các danh mục chung đến các danh mục cụ thể hơn, chẳng hạn như Khai thác Văn bản và Dữ liệu, Đào tạo AI, Đào tạo AI Tạo sinh và Suy luận AI. Để tối đa hóa khả năng tương tác toàn cầu, các danh mục này sẽ không được Creative Commons định nghĩa. Thay vào đó, chúng sẽ dựa trên các tiêu chuẩn toàn cầu đang được Lực lượng Đặc nhiệm Kỹ thuật Internet (IETF) phát triển. Khung tín hiệu CC được thiết kế để phát triển khi các danh mục tiêu chuẩn được hoàn thiện. Danh mục được chọn sẽ tạo nên phạm vi hoạt động mà công cụ dự định giải quyết.
Tín hiệu nào được áp dụng:
Bên Khai báo lựa chọn trong số các tín hiệu CC khả dụng. Sau khi được chọn, tín hiệu phản ánh sở thích của Bên Khai báo về việc sử dụng lại của máy móc. Điều này có nghĩa là Bên Khai báo tuyên bố rằng hạng mục máy móc sử dụng lại đã chọn được cho phép theo các điều khoản của các yếu tố tín hiệu cụ thể. Bốn tổ hợp tín hiệu được đề xuất là:
Ghi công trạng
Ghi công trạng + Đóng góp Trực tiếp
Ghi công trạng + Đóng góp Hệ sinh thái
Ghi công trạng + Mở
Tương tự như giấy phép CC, tín hiệu CC sẽ có thể đọc được bằng máy và người. Phần giải thích dễ hiểu về những gì xảy ra khi một tín hiệu được áp dụng sẽ được gọi là một tuyên bố (declaration). Sẽ có một tuyên bố cho mỗi tín hiệu, với các biến thể dựa trên việc Bên Tuyên bố có thẩm quyền bản quyền hay không và phạm vi sử dụng lại của máy móc cụ thể được chọn. Chuỗi mã được sử dụng để áp dụng tín hiệu CC cho một tập dữ liệu sẽ được gọi là biểu thức sử dụng nội dung (content usage expression).
Cân nhắc về mặt pháp lý
Tín hiệu CC được thiết kế như các công cụ toàn cầu, có nghĩa là chúng hoạt động trên các hệ thống pháp lý hoạt động khác nhau. Trong bối cảnh máy móc sử dụng lại, luật bản quyền bị hạn chế, không chắc chắn và không nhất quán giữa các khu vực pháp lý. Do đó, việc áp dụng tín hiệu CC có thể có hiệu lực pháp lý khác nhau tùy thuộc vào người áp dụng và trong bối cảnh nào.
Khi bản quyền tồn tại và được áp dụng, tín hiệu CC nhằm mục đích tận dụng sức mạnh của bản quyền mà không làm tăng thêm sức mạnh của nó.
Vấn đề không phải là tạo ra các quyền sở hữu mới; mà giống như việc xác định các quy tắc ứng xử cho máy móc hơn.
Để biết thêm chi tiết, vui lòng xem báo cáo. Nghiên cứu và phân tích sâu hơn về các tác động pháp lý của tín hiệu CC sẽ là trọng tâm chính trong nỗ lực của chúng tôi trong những tháng tới.
Cân nhắc kỹ thuật
Tín hiệu CC được thiết kế dựa trên các tiêu chuẩn kỹ thuật đang được Lực lượng Đặc nhiệm Kỹ thuật Internet (IETF) phát triển. Chúng tôi đã đưa các cân nhắc kỹ thuật và thành phần của tín hiệu CC trên GitHub.
Tuân thủ Tín hiệu CC
Tín hiệu Tín dụng
Việc ghi nhận và xác định nguồn gốc trong bối cảnh các mô hình AI lớn rất phức tạp, khó khăn và phát triển nhanh chóng khi công nghệ phát triển. Tuy nhiên, điều này không có nghĩa là khái niệm ghi công trạng nên bị coi là không liên quan hoặc bất khả thi trong bối cảnh AI. Chúng tôi tìm cách thiết lập các chuẩn mực xung quanh những gì có thể, không để sự hoàn hảo trở thành kẻ thù của điều tốt. Giống như điều kiện ghi nhận trong giấy phép CC, chúng tôi hình dung yếu tố tín hiệu ghi công trạng được ban hành theo bất kỳ cách thức hợp lý nào. Chúng tôi dự định phát triển hướng dẫn và các phương pháp hay nhất về ghi công trạng trong các giai đoạn tiếp theo của công việc này, dựa trên tiến độ mà những người khác trong lĩnh vực này đang đạt được. Hiện tại, ở mức tối thiểu, chúng tôi kỳ vọng tín hiệu này yêu cầu người dùng lại trích dẫn tập dữ liệu đào tạo. Đối với các kỹ thuật cho phép mô hình truy xuất thông tin để trả lời các truy vấn, chẳng hạn như thế hệ tăng cường truy xuất (RAG) và các trường hợp sử dụng khác mà về mặt kỹ thuật có thể kết nối nội dung với các đầu ra cụ thể, đầu ra phải trích dẫn bộ sưu tập dưới dạng nguồn có liên kết.
Đóng góp trực tiếp
Đây không phải là một giao dịch thương mại. Nó được thiết kế để tạo ra một cơ cấu cho sự đóng góp tài chính hoặc hiện vật nhằm hỗ trợ tính bền vững của Bên Tuyên bố. Việc áp dụng tín hiệu CC không nên được xem như một mô hình kinh doanh, hay thậm chí là một cách để thu hồi chi phí một cách đáng tin cậy. Các khoản đóng góp được dự định sẽ tương xứng, cả với loại hình và quy mô cụ thể máy móc sử dụng lại, cũng như với khả năng tài chính của bên thực hiện. Cũng như với việc ghi công trạng, chúng tôi dự định sẽ đưa ra hướng dẫn và các phương pháp hay nhất cho việc đóng góp trực tiếp khi tín hiệu CC được phát triển.
Tín hiệu Đóng góp cho Hệ sinh thái
Điều này được thiết kế để thúc đẩy những đóng góp hỗ trợ cho cộng đồng nói chung. Mặc dù cách diễn đạt ban đầu còn rất mở, chúng tôi hy vọng và kỳ vọng rằng các chuẩn mực, phương pháp hay nhất, và thậm chí cả những cấu trúc mới, mang tính tập thể, có thể phát triển xung quanh khái niệm này trong các lĩnh vực khác nhau và cho các loại hình tái sử dụng khác nhau. Mục tiêu là khuyến khích việc cho đi, truyền tải chuẩn mực có đi có lại theo những cách giúp duy trì hệ sinh thái cho tất cả mọi người.
Tín hiệu Mở
Yếu tố tín hiệu này phản ánh thực tế rằng việc tạo ra các mô hình AI mở - bằng cách công bố trọng số mô hình, mã hoặc tập dữ liệu để người khác sử dụng và xây dựng - là một hình thức có đi có lại. Với những tiến bộ mà các bên khác trong lĩnh vực này đã đạt được trong việc cung cấp các định nghĩa có ý nghĩa về tính mở, đề xuất của chúng tôi cho tín hiệu này cụ thể hơn về những gì cần thiết để tuân thủ nó.
Khuyến khích sự tuân thủ của các nhà phát triển AI
Chúng tôi nhận thấy rằng các tín hiệu CC sẽ dựa vào sự tham gia tự nguyện của các nhà phát triển AI để tuân thủ nó. Có nhiều lý do để hoài nghi về việc tuân thủ, đặc biệt là khi nó không phải là yêu cầu pháp lý, và luôn có và sẽ luôn có những tác nhân xấu. Tuy nhiên, chúng tôi thấy nhiều lý do để tin rằng việc áp dụng là có khả năng.
Thứ nhất, đã có tiền lệ. Mặc dù việc tuân thủ không phải lúc nào cũng hoàn hảo, robots.txt đã hoạt động trong nhiều năm như một cách để mã hóa các kỳ vọng chuẩn mực về - và giúp duy trì khế ước xã hội cho - việc máy móc tái sử dụng nội dung trên web. Chúng tôi cũng thấy sự thành công của việc cấp phép CC là bằng chứng cho thấy sự tham gia tự nguyện là khả thi. Mặc dù giấy phép CC được xây dựng dựa trên luật bản quyền và do đó mang theo rủi ro vi phạm bản quyền, nhưng trên thực tế, chúng hoạt động hiệu quả vì mọi người đã lựa chọn tuân thủ chúng. Các vụ kiện tụng liên quan đến việc thực thi giấy phép CC rất hiếm, và phần lớn liên quan đến những người kiện tụng không hành động một cách thiện chí. Thay vào đó, hiện nay có hàng chục tỷ tác phẩm được cấp phép CC có sẵn trong cộng đồng vì chúng dựa trên những quan niệm trực quan về sự công bằng và mang tính xã hội khi nói đến việc chia sẻ và tái sử dụng kiến thức.
Cũng có những lý do rõ ràng tại sao các tác nhân có lý trí nên tôn trọng và tuân thủ các tín hiệu ưu tiên. Như chúng tôi đã viết trước đó trong báo cáo này, dữ liệu từ khắp các trang web công cộng là một thành phần quan trọng trong việc phát triển các mô hình AI quy mô lớn. Nếu những người phát triển AI không tôn trọng mong muốn của người sáng tạo, họ có nguy cơ loại bỏ động lực chia sẻ và phân phối rộng rãi các tác phẩm của mình. Theo thời gian, điều này sẽ làm giảm tính chính xác, an toàn và tính phổ biến của các mô hình và dịch vụ mà họ xây dựng. Điều này sẽ đặc biệt nghiêm trọng đối với các công ty nhỏ, công ty khởi nghiệp, tổ chức phi lợi nhuận và các nhà nghiên cứu học thuật, những người không có đủ nguồn lực để dựa vào các thỏa thuận cấp phép tốn kém.
Hãy chia sẻ phản hồi của bạn ngay bây giờ trên GitHub.
Tác giả: admin
Ý kiến bạn đọc
Những tin cũ hơn
Trang Web này được thành lập theo Quyết định số 142/QĐ-HH do Chủ tịch Hiệp hội các trường đại học, cao đẳng Việt Nam – AVU&C (Association of Vietnam Universities and Colleges), GS.TS. Trần Hồng Quân ký ngày 16/09/2019, ngay trước thềm của Hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do 5...