AI tạo sinh ảnh hưởng đến Tài nguyên Giáo dục Mở như thế nào

Thứ năm - 19/06/2025 19:08

How Generative AI Affects Open Educational Resources

September 4, 2024 by opencontent

Theo: https://opencontent.org/blog/archives/7568

Bài được đưa lên Internet ngày: 04/09/2024

Đây là phần giữa của bài thuyết trình ngày 19 tháng 9 năm 2024 của tôi, Tại sao Giáo dục Mở sẽ Trở thành Giáo dục AI Tạo sinh. Tôi đang đăng trước một số nội dung bài thuyết trình do cuộc trò chuyện rất sôi nổi mà thông báo về bài thuyết trình đã tạo ra. Tuần tới, tôi hy vọng sẽ đăng phần đầu tiên của bài thuyết trình, trong đó nêu ra lý do tại sao những người quan tâm sâu sắc đến khả năng chi trả, khả năng tiếp cận và cải thiện kết quả nên cân nhắc chuyển trọng tâm của họ khỏi OER (như chúng ta đã hiểu trong hơn 25 năm qua) và hướng tới AI tạo sinh. Hoặc, sử dụng ngôn ngữ mà tôi giới thiệu bên dưới, từ "OER truyền thống" sang "OER tạo sinh".

Giống như Internet trước đây, AI tạo sinh đang biến đổi mạnh mẽ nhiều khía cạnh của xã hội. AI tạo sinh đã có tác động sâu sắc đến cách thức OER được biên soạn, sửa đổi và phối lại. Và có thể có những tác động mạnh mẽ hơn đáng kể nếu chúng ta tiếp cận chúng.

OER truyền thống

Chúng ta đều quen thuộc với những gì tôi gọi là "OER truyền thống". OER truyền thống bao gồm sách giáo khoa, chương, giáo trình, đánh giá, hình ảnh, video, mô phỏng, tương tác, v.v. được cấp phép mở. Trong suốt bài thuyết trình này, khi tôi nói "OER", tôi đang sử dụng thuật ngữ theo định nghĩa của Creative Commons, The William and Flora Hewlett Foundation và nhiều tổ chức khác. Định nghĩa đó là:

“Tài nguyên giáo dục mở (OER) là tài liệu giảng dạy, học tập và nghiên cứu nằm trong phạm vi công cộng hoặc đã được phát hành theo giấy phép mở cho phép người khác sử dụng và tái sử dụng miễn phí”.

AI tạo sinh ảnh hưởng sâu sắc đến cách thức OER truyền thống được (1) biên soạn và (2) sửa đổi và phối lại.

Biên soạn OER truyền thống

Trước khi ChatGPT được phát hành, OER truyền thống hoàn toàn được “làm thủ công”, nghĩa là không sử dụng AI tạo sinh nào trong quá trình tạo ra chúng. Kể từ khi ChatGPT được phát hành, nhiều OER truyền thống đã được “AI soạn thảo”, nghĩa là mọi người đã sử dụng AI tạo sinh để tạo ra bản thảo đầu tiên của OER. (Và sau đó, hy vọng là sẽ đưa các bản thảo này vào quá trình xem xét và chỉnh sửa nghiêm ngặt khi cần thiết.)

Trong phương pháp thủ công để biên soạn OER, việc tạo bản thảo đầu tiên có thể mất nhiều ngày, nhiều tuần, nhiều tháng hoặc thậm chí nhiều năm tùy thuộc vào phạm vi và tham vọng của dự án. Trong phương pháp biên soạn OER do AI soạn thảo, việc tạo bản thảo đầu tiên có thể mất vài phút, vài giờ, nhiều ngày hoặc nhiều tuần tùy thuộc vào phạm vi và tham vọng của dự án. AI tạo ra giúp giảm thời gian và công sức cần thiết để tạo ra bản thảo đầu tiên ít nhất là một cấp độ (chia thời gian biên soạn trước đó cho 10) và đôi khi thậm chí là hai cấp độ (chia thời gian biên soạn trước đó cho 100) đối với các nhiệm vụ lặp đi lặp lại, chẳng hạn như biên soạn một ngân hàng lớn các mục đánh giá. Các quy trình đảm bảo chất lượng như đánh giá ngang hàng và biên tập kỹ thuật vẫn cực kỳ quan trọng, nhưng quá trình hoàn thành bản thảo đầu tiên thường chiếm phần lớn thời gian dành cho việc biên soạn OER.

Vì thời gian luôn là một trong những rào cản lớn nhất đối với việc tạo ra OER, nên không khó để tưởng tượng ra một tương lai mà phần lớn các OER mới đều được AI soạn thảo thay vì hoàn toàn được biên soạn thủ công. Và có vẻ như hoạt động từ thiện, vốn tìm cách tối đa hóa số lượng điều tốt đẹp mà nó có thể làm được trên thế giới trên mỗi đô la chi tiêu, sẽ khuyến khích mạnh mẽ (nếu không muốn nói là yêu cầu) những người nhận tài trợ áp dụng phương pháp do AI soạn thảo để tạo ra OER mới trong tương lai.

Sửa đổi và phối lại OER truyền thống

Nhưng tác động của phương pháp do AI soạn thảo đối với việc sửa đổi và phối lại OER có lẽ còn có tác động lớn hơn tác động đối với việc biên soạn. Mặc dù giấy phép mở khiến việc sửa đổi và phối lại OER trở nên hợp pháp, nhưng quyền đó không kỳ diệu cấp cho giáo viên, người học hoặc những người dùng khác thời gian và chuyên môn cần thiết để thực sự sửa đổi và phối lại.

Ví dụ, việc tạo ra một phiên bản đơn giản hóa của một văn bản hiện có cho người học tiếng Anh như ngôn ngữ thứ hai là một ví dụ phổ biến về việc sửa đổi OER. Khi thực hiện thủ công, việc hoàn thành bản thảo đầu tiên có thể mất hàng giờ. Khi thực hiện bằng AI tạo sinh, việc hoàn thành bản thảo đầu tiên chỉ mất vài phút. Và nghiên cứu đã chứng minh rằng mức độ tham gia của giảng viên vào các hành vi sửa đổi và phối lại có mối tương quan trực tiếp với lượng thời gian và công sức cần thiết để hoàn thành các nhiệm vụ sửa đổi hoặc phối lại (xem Hilton và cộng sự, 2012). Nếu lượng thời gian và công sức cần thiết để sửa đổi và phối lại có mối tương quan nghịch với mức độ tham gia vào các hoạt động sửa đổi và phối lại, và các phương pháp do AI soạn thảo làm giảm đáng kể lượng thời gian và công sức cần thiết để sửa đổi và phối lại OER, thì chúng ta sẽ thấy sự gia tăng đáng kể trong việc sửa đổi và phối lại OER trong tương lai.

Và việc thiếu thời gian không phải là trở ngại duy nhất đối với việc sửa đổi và phối lại OER. Hầu hết giáo viên, người học và những người dùng khác không có chuyên môn hoặc chuyên môn rất hạn chế về các kỹ năng cần thiết để thực hiện các hình thức hiệu đính và phối lại theo yêu cầu, như dịch OER từ ngôn ngữ này sang ngôn ngữ khác. Nghiên cứu cho thấy mức tăng năng suất của AI tạo sinh cao nhất ở những người lao động có kỹ năng thấp (Brynjolfsson, 2023; Dell’Acqua, 2023). Áp dụng phát hiện này vào ví dụ của chúng tôi về việc dịch một văn bản sang ngôn ngữ khác, AI tạo sinh sẽ hữu ích hơn nhiều đối với một người không nói một trong hai ngôn ngữ liên quan so với một người nói cả hai ngôn ngữ. Do đó, các phương pháp do AI soạn thảo sẽ mở khóa các hoạt động hiệu đính và phối lại vốn trước đây là không thể hoặc không thực tế. Điều này sẽ vừa làm tăng các loại hiệu đính và phối lại diễn ra trong tương lai, vừa cải thiện chất lượng của nó.

Nhờ AI tạo sinh, cuối cùng chúng ta có thể bước vào thời kỳ hoàng kim được mong đợi từ lâu của việc sửa đổi và phối lại.

OER tạo sinh

AI tạo sinh giúp tạo ra một loại OER mới mà tôi sẽ gọi là "OER tạo sinh". Đây là OER có mục đích không phải để người học nghiên cứu trực tiếp hoặc giáo viên sử dụng trực tiếp (như OER truyền thống). OER tạo sinh là OER có mục đích giúp người học, giáo viên và những người dùng khác tạo ra OER khác. OER tạo sinh bao gồm các lời nhắc được cấp phép mở và trọng số mô hình được cấp phép mở.

Lời nhắc mở

Nhiều lời nhắc do người dùng AI tạo sinh lần đầu viết tương đối đơn giản. Chúng có thể bao gồm một cụm từ ngắn hoặc một vài câu. Những lời nhắc cơ bản này không đủ điều kiện để được bảo vệ bản quyền.

Tuy nhiên, các lời nhắc gợi ra hành vi phức tạp hơn từ mô hình AI tạo ra có thể dài hàng trăm hoặc hàng nghìn từ. Những lời nhắc sáng tạo hơn này có khả năng phải tuân theo cùng một bản quyền tự động như các tác phẩm sáng tạo khác. Điều này có nghĩa là để giáo viên, người học và những người dùng khác có thể tham gia vào các hoạt động 5R với những lời nhắc mạnh mẽ hơn nhiều về mặt sư phạm này, thì những lời nhắc đó sẽ phải được cấp phép mở.

Người dùng cần có khả năng sửa đổi và phối lại các lời nhắc vì hai lý do. Thứ nhất, phong trào giáo dục mở đã nhận ra trong nhiều thập kỷ rằng việc người dùng có thể bản địa hóa OER để phù hợp với ngôn ngữ, văn hóa và hoàn cảnh địa phương của họ là quan trọng như thế nào. Về mặt này, lời nhắc cũng không khác gì. Người dùng phải có khả năng sửa đổi và phối lại các lời nhắc để kết quả của họ hữu ích và phù hợp với ngôn ngữ, văn hóa và hoàn cảnh cụ thể của người dùng.

Thứ hai, người dùng cần có khả năng bản địa hóa các lời nhắc để chúng có thể "hoạt động" trong bối cảnh của các mô hình AI tạo ra khác nhau. Các mô hình khác nhau phản hồi khác nhau với cùng một lời nhắc, và một lời nhắc tinh vi được tối ưu hóa cho Claude 3.5 Sonnet có thể cần phải được điều chỉnh để thực hiện tương tự với Llama 3.1 405B. Và trong khi hành vi của các mô hình khác nhau có thể chỉ khác một chút, thì hành vi của chúng lại khác đáng kể so với các mô hình lượng tử đã được điều chỉnh để chạy trên phần cứng cục bộ như máy tính xách tay không có kết nối internet. Các mô hình có thể chạy cục bộ này sẽ là một trong những chìa khóa để phân phối lợi ích của AI tạo sinh cho mọi người trên toàn cầu và người dùng phải có khả năng điều chỉnh các lời nhắc phức tạp được thiết kế cho các mô hình khác nhau để hoạt động với các mô hình ngoại tuyến này.

Việc sửa đổi và phối lại các lời nhắc hiện có để tối ưu hóa hiệu suất của chúng trong bối cảnh người dùng mới và bối cảnh mô hình mới là một hình thức kỹ thuật nhắc. Vì nhiều lời nhắc sẽ được giữ bản quyền theo mặc định, nên sự cho phép hợp pháp để sửa đổi và phối lại chúng (để tham gia vào kỹ thuật nhắc cần thiết) sẽ rất quan trọng để đảm bảo tác động và lợi ích rộng rãi của AI tạo sinh cho mọi người.

Trọng số mở (Open Weights)

Có nhiều nỗ lực đang được tiến hành để xác định những gì cấu thành nên một mô hình AI tạo sinh "mở" (White, et al., 2024; OSI, 2024). Thay vì cố gắng đóng góp vào cuộc trò chuyện đó, ở đây tôi áp dụng định nghĩa mẫu số chung thấp nhất chỉ tập trung vào trọng số mô hình. "Trọng số mở" là trọng số mô hình AI tạo ra được cấp phép theo cách cấp cho người dùng quyền tham gia vào các hoạt động 5R.

Trong khi các mô hình nền tảng như GPT-4o, Claude, Gemini và Llama có khả năng kiến thức chung thực sự ấn tượng, thì các giai đoạn tinh chỉnh của chúng thường được thiết kế để giúp chúng tuân theo các hướng dẫn một cách chính xác (ví dụ: tính khả dụng của các phiên bản "cơ sở" và "hướng dẫn" của các mô hình trên HuggingFace). Các mô hình nền tảng không được thiết kế để có kiến thức sư phạm hoặc hoạt động theo phương pháp sư phạm. Chúng cũng có thể thiếu kiến thức chuyên môn cần thiết cho người học, giáo viên và những người dùng khác trong một số lĩnh vực. Ngay từ đầu, các mô hình này không được tối ưu hóa để hỗ trợ việc dạy và học. Do đó, nếu AI tạo sinh muốn đạt được tiềm năng hỗ trợ việc dạy và học, người dùng phải có khả năng sửa đổi và phối lại trực tiếp các trọng số của mô hình.

Các thực hành cụ thể được thể hiện bởi một số trong 5R thay đổi trong bối cảnh của các trọng số mô hình. Trong bối cảnh của các trọng số mở, "sửa đổi" có thể đề cập đến các kỹ thuật như tinh chỉnh, trong đó các trọng số của mô hình được cập nhật thông qua đào tạo bổ sung trên các tập dữ liệu được quản lý. Tinh chỉnh cho phép thực hiện các điều chỉnh có mục tiêu đối với hành vi của mô hình, cho phép mô hình thực hiện các tác vụ chuyên biệt. Ví dụ, mô hình trọng số mở có thể được tinh chỉnh trên một tập dữ liệu lớn về các tương tác giữa người học và gia sư chuyên gia, để mô hình hoạt động giống như một gia sư chuyên gia hơn.

Trong bối cảnh của trọng số mở, "phối lại" có thể liên quan đến các kỹ thuật như hợp nhất mô hình hoặc chưng cất mô hình. Trong chưng cất mô hình, một mô hình "học sinh" nhỏ hơn được đào tạo bằng cách sử dụng đầu ra của một mô hình "giáo viên" lớn hơn. Quá trình này về cơ bản nén kiến thức và khả năng của mô hình lớn hơn vào mô hình nhỏ hơn. Một trong những ví dụ nổi tiếng nhất ở đây là DistilBERT, được tạo ra bởi HuggingFace. Nhóm HuggingFace đã chưng cất mô hình BERT của Google (mô hình "giáo viên") thành DistilBERT (mô hình "học sinh"), giảm kích thước của nó xuống 40% trong khi vẫn giữ nguyên 97% khả năng hiểu ngôn ngữ và làm cho nó nhanh hơn 60%. Mô hình DistilBERT nhỏ hơn có thể chạy trên thiết bị cục bộ mà không cần truy cập internet. (Một lần nữa, khả năng chạy các mô hình AI tạo ra cục bộ là rất quan trọng vì một số lý do, bao gồm thúc đẩy khả năng truy cập ở những khu vực có kết nối thấp, bảo vệ quyền riêng tư của người dùng và phân cấp và giảm mức tiêu thụ năng lượng.)

Lời cảm ơn

Tôi muốn thừa nhận rằng chắc chắn phải có một bước nhảy vọt về mặt kỹ thuật để một người có thể chuyển từ việc chỉnh sửa một đoạn văn trong trang Pressbooks sang việc tinh chỉnh một mô hình trọng số mở. Điều đó khiến tôi nhớ lại thời điểm Javascript lần đầu tiên được giới thiệu vào hệ sinh thái web (vâng, tôi già như vậy đấy)…

Ngày xửa ngày xưa, chỉ có HTML. Ngôn ngữ đánh dấu của nó khá dễ học và rất nhiều người đã viết HTML. Sau đó là Javascript. Nó không phải là ngôn ngữ đánh dấu – mà là ngôn ngữ lập trình. Và việc viết mã bằng Javascript đòi hỏi nhiều chuyên môn kỹ thuật hơn đáng kể so với việc viết HTML. Nhưng rắc rối là xứng đáng – HTML và Javascript kết hợp theo cách hiệp lực để làm cho web tương tác hơn, hữu ích hơn và mạnh mẽ hơn.

Phải thừa nhận rằng, sẽ cần nhiều chuyên môn kỹ thuật hơn để sửa đổi và phối lại OER tạo ra như các mô hình trọng số mở so với việc sửa đổi và phối lại OER truyền thống trong quá khứ. Nhưng điều đó sẽ đáng công sức - OER truyền thống và OER tạo sinh sẽ kết hợp để tạo ra những trải nghiệm học tập tương tác hơn, hữu ích hơn và mạnh mẽ hơn.

Suy nghĩ kết luận

Để tận dụng đầy đủ hơn tiềm năng của AI tạo sinh nhằm giúp cơ hội giáo dục dễ tiếp cận hơn và hiệu quả hơn cho người học ở mọi nơi, chúng ta cần áp dụng những bài học kinh nghiệm trong hơn 25 năm làm việc với OER. Và bài học đầu tiên là: cấp phép mở - cấp cho mọi người quyền sử dụng khả năng tự quyết, sự nhiệt tình và khả năng sáng tạo của họ để tham gia vào các hoạt động 5R - sẽ giải phóng tiềm năng của con người. Và vì vậy, chúng ta phải vượt ra ngoài suy nghĩ hạn hẹp về cách AI tạo sinh tác động đến công việc của chúng ta với OER truyền thống và bắt đầu suy nghĩ rộng hơn về sức mạnh của "OER tạo sinh", trong đó chúng ta coi bản thân AI tạo sinh là một OER. Khi chúng ta sử dụng các gợi ý và trọng số mở để phục vụ cho việc học, chúng ta sẽ mở ra những viễn cảnh hoàn toàn mới về khả năng giảng dạy và học tập - cả chính quy và không chính quy.

Chủng loại artificial intelligence, open content, open education, open source, student success