‘Chúng ta có ý gì khi nói “không có dữ liệu, không có AI”’ - bản dịch sang tiếng Việt

Thứ sáu - 09/08/2024 19:23
‘Chúng ta có ý gì khi nói “không có dữ liệu, không có AI”’ - bản dịch sang tiếng Việt

Là bản dịch sang tiếng Việt tài liệu tóm tắt của Ben Snaith - Nghiên cứu viên cao cấp, Viện Dữ liệu Mở, xuất bản ngày 21/12/2023.

Giới thiệu

“Không có dữ liệu, không có AI” đã trở thành câu thần chú đối với Viện Dữ liệu Mở - ODI (Open Data Institute), được nêu bật trong quá trình chuẩn bị cho sự kiện Hội nghị thượng đỉnh ODI vào tháng 11 năm 2023. Tuy nhiên, đây là khái niệm được lưu thông từ lâu trong lãnh địa trí tuệ nhân tạo - AI (Artificial Intelligence). Đối với chúng tôi, nó tham chiếu tới cơ sở hạ tầng dữ liệu của AI - bao gồm các tập dữ liệu, các công cụ, tiêu chuẩn, thực hành, và cộng đồng. Đây là lời kêu gọi nhìn vào dữ liệu và nền tảng xã hội - kỹ thuật khác của AI để hiểu tốt hơn thiết kế, kết quả và ý nghĩa của chúng.

Tài liệu tóm tắt này được thiết kế để mở ra cụm từ này và câu trả lời cho câu hỏi có liên quan về làm thế nào và vì sao nhóm nghiên cứu của ODI sẽ nghiên cứu AI lấy dữ liệu làm trung tâm (Data-centric AI) trong một chương trình công việc mới.

Dữ liệu và vòng đời AI

Nếu chúng ta nhìn vào vòng đời AI - ngay cả trong sơ đồ trừu tượng dưới đây - nhiều phần tập trung vào dữ liệu! Dữ liệu là nền tảng cho các mô hình AI. Dữ liệu cung cấp thông tin mà một mô hình máy học được đào tạo và học từ đó. Dữ liệu được thu thập, xử lý, giám tuyển, tổng hợp và sau đó được sử dụng trong mô hình. Dữ liệu được sử dụng để kiểm thử và kiểm chuẩn sự thành công của mô hình. Và dữ liệu được nhập vào để sử dụng sau khi mô hình đi vào hoạt động.

Việc xây dựng một hệ thống AI thường liên quan đến việc xác định nguồn cho lượng lớn dữ liệu và việc tạo lập các tập dữ liệu cho đào tạo, kiểm thử, thẩm định, và triển khai. Quá trình này là lặp đi lặp lại theo đó nó có thể đòi hỏi vài vòng đào tạo, kiểm thử và đánh giá cho tới khi kết quả mong muốn đạt được và dữ liệu đóng vai trò quan trọng trong từng bước.

Hình 1. Vòng đời trí tuệ nhân tạo: Từ khái niệm hóa tới sản xuất – ScienceDirect

Tự do tải về bản dịch sang tiếng Việt của tài liệu có 11 trang tại địa chỉ: https://www.dropbox.com/scl/fi/4un643ygfuksd28fm2v1c/20231221_-_Data-centric_AI_Short_Paper_-_What_do_we_mean_by_without_data_there_3AEHdDW_Vi-08082024.pdf?rlkey=bgkh73tdcn26d3cak5sw8pcbl&st=4v3edaqe&dl=0

Xem thêm:

 

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Những tin mới hơn

Những tin cũ hơn

GIÁO DỤC MỞ - TÀI NGUYÊN GIÁO DỤC MỞ: ỨNG DỤNG VÀ PHÁT TRIỂN

Trang Web này được thành lập theo Quyết định số 142/QĐ-HH do Chủ tịch Hiệp hội các trường đại học, cao đẳng Việt Nam – AVU&C (Association of Vietnam Universities and Colleges), GS.TS. Trần Hồng Quân ký ngày 16/09/2019, ngay trước thềm của Hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do 5...

Thống kê truy cập
  • Đang truy cập42
  • Máy chủ tìm kiếm5
  • Khách viếng thăm37
  • Hôm nay7,264
  • Tháng hiện tại26,729
  • Tổng lượt truy cập6,904,758
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây