Viện Dữ liệu Mở (ODI) sẽ giúp phát triển một tiêu chuẩn siêu dữ liệu mở cho dữ liệu máy học

Thứ hai - 26/08/2024 18:29
Viện Dữ liệu Mở (ODI) sẽ giúp phát triển một tiêu chuẩn siêu dữ liệu mở cho dữ liệu máy học

The ODI to help develop an open metadata standard for machine learning data

Wed Mar 6, 2024

Theo: https://theodi.org/news-and-events/blog/the-odi-to-help-develop-an-open-metadata-standard-for-machine-learning-data/

Bài được đưa lên Internet ngày: 06/03/2024

MLCommons đã công bố phát hành Croissant, một định dạng siêu dữ liệu để giúp tiêu chuẩn hóa tài liệu của các tập dữ liệu máy học - ML (Machine Learning). Croissant được thiết lập để tạo ra sự khác biệt lớn đối với hoạt động xử lý dữ liệu trong AI - khi những người thực hành AI áp dụng nó để mô tả các tập dữ liệu của họ và nhiều nền tảng AI hơn hỗ trợ các tập dữ liệu có chú thích Croissant. Điều này hứa hẹn trở thành người thay đổi cuộc chơi trong AI an toàn và có đạo đức, nơi các tập dữ liệu chất lượng cao, được ghi thành tài liệu tốt là thiết yếu.

Hiện hành, nhiều tập dữ liệu ML không có đủ tài liệu máy đọc được để cho phép mọi người sử dụng chúng có trách nhiệm. Không có thông tin này, việc tìm kiếm, hiểu, và sử dụng các tập dữ liệu đó một cách an toàn và có đạo đức có thể rất mất thời gian.

Croissant có mục đích làm cho dữ liệu truy cập được và có khả năng khám phá được dễ dàng hơn. Nó cho phép các tập dữ liệu được tải lên các nền tảng AI khác nhau mà không cần định dạng lại. Người dùng xuất bản một tập dữ liệu ở định dạng Croissant hưởng lợi từ ‘trình biên tập Croissant’ (Croissant Editor), nó cho phép họ dễ dàng kiểm tra, tạo lập, hoặc sửa đổi các mô tả Croissant cho các tập dữ liệu của họ. Cũng có Thư viện Python MLCroissant để hỗ trợ lập trình.

ODI từng là một người ủng hộ sớm sáng kiến này, với Giám đốc Nghiên cứu của chúng tôi GS. Elena Simperl đồng chủ tịch nhóm công tác Croissant. Hướng về tương lại, ODI sẽ giúp thúc đẩy Croissant theo vài cách thức, bao gồm việc thí điểm và đánh giá tiêu chuẩn này trong các tập dữ liệu ML chính, và quảng bá Croissant tới cộng đồng AI/ML rộng lớn hơn, đặc biệt ở Vương quốc Anh và châu Âu.

ODI có hồ sơ theo dõi mở rộng việc thiết kế, đánh giá, và thúc đẩy các tiêu chuẩn dữ liệu mở trong nhiều lĩnh vực, bao gồm cả tiêu chuẩn Ngân hàng Mở của Vương quốc Anh, tiêu chuẩn OpenAcitve, và Deutsche Gesellschaft für Internationale Zusammenarbeit (GIZ) Data4Policy. Các tiêu chuẩn mở và hạ tầng dữ liệu tương hợp được là cốt lõi của kế hoạch 15 điểm cho chương trình AI lấy dữ liệu làm trung tâm (data-centric AI) của chúng tôi. Cùng với công việc của chúng tôi về hạ tầng dữ liệu, quản trị và điều hành dữ liệu, chúng tôi hướng tới việc xây dựng cộng đồng toàn cầu và thúc đẩy áp dụng Croissant.

Dữ liệu là yếu tố rất quan trọng đối với hiệu suất của bất kỳ mô hình nào và như một số chuyên gia đề xuất, dữ liệu sẽ cạn kiệt, khiến nhu cầu khai thác dữ liệu càng trở nên quan trọng hơn. Croissant cho phép nhiều người hơn làm được nhiều việc hơn với dữ liệu. Với tư cách là đồng chủ tịch của nhóm làm việc, tôi rất vinh dự được cộng tác với các nhà khoa học và kỹ sư máy học đẳng cấp thế giới trên toàn cầu, đóng góp to lớn cho hệ sinh thái dữ liệu AI.”

Giáo sư Elena Simperl

Giám đốc Nghiên cứu tại ODI, Giáo sư Khoa học Máy tính tại Cao đẳng Hoàng gia Luân Đôn và đồng chủ trì nhóm công tác Croissant

Croissant được làm cho có thể nhờ các nỗ lực của nhóm công tác Croissant MLCommons bao gồm những người đóng góp từ các tổ chức: Bayer, cTuning Foundation, DANS-KNAW, Dotphoton, Google, Harvard, Hugging Face, Kaggle, King's College London, the ODI, Meta, NASA, Open University of Catalonia - Luxembourg Institute of Science and Technology, và TU Eindhoven.

Bạn có thể ra nhập Nhóm Công tác Croissant, đóng góp cho kho GitHub, và tải về Croissant Editor để triển khai từ vựng Croissant trong các tập dữ liệu hiện có của bạn.

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Những tin mới hơn

Những tin cũ hơn

GIÁO DỤC MỞ - TÀI NGUYÊN GIÁO DỤC MỞ: ỨNG DỤNG VÀ PHÁT TRIỂN

Trang Web này được thành lập theo Quyết định số 142/QĐ-HH do Chủ tịch Hiệp hội các trường đại học, cao đẳng Việt Nam – AVU&C (Association of Vietnam Universities and Colleges), GS.TS. Trần Hồng Quân ký ngày 16/09/2019, ngay trước thềm của Hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do 5...

Thống kê truy cập
  • Đang truy cập48
  • Máy chủ tìm kiếm25
  • Khách viếng thăm23
  • Hôm nay12,926
  • Tháng hiện tại173,457
  • Tổng lượt truy cập6,808,323
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây