Alibaba releases AI model it says surpasses DeepSeek
January 29, 202511:21 PM GMT+7
Bài được đưa lên Internet ngày: 29/01/2025
BẮC KINH, 29/01 (Theo Reuters) - Hôm thứ Tư, công ty công nghệ Trung Quốc Alibaba (9988.HK) đã phát hành phiên bản mới của mô hình trí tuệ nhân tạo Qwen 2.5 mà họ tuyên bố là vượt trội hơn so với DeepSeek-V3 vốn được đánh giá cao.
Thời điểm phát hành Qwen 2.5-Max bất thường, vào ngày đầu tiên của Tết Nguyên đán khi hầu hết người dân Trung Quốc nghỉ làm và ở bên gia đình, cho thấy áp lực mà công ty khởi nghiệp AI Trung Quốc DeepSeek phải chịu trong ba tuần qua không chỉ đối với các đối thủ nước ngoài mà còn đối với cả đối thủ trong nước.
"Qwen 2.5-Max vượt trội hơn ... hầu như trên mọi phương diện so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B", đơn vị đám mây của Alibaba cho biết trong một thông báo được đăng trên tài khoản WeChat chính thức của mình, đề cập đến các mô hình AI nguồn mở tiên tiến nhất của OpenAI và Meta.
Việc phát hành trợ lý AI của DeepSeek vào ngày 10 tháng 1, được hỗ trợ bởi mô hình DeepSeek-V3, cũng như việc phát hành mô hình R1 vào ngày 20 tháng 1, đã gây sốc cho Thung lũng Silicon và khiến cổ phiếu công nghệ lao dốc, với chi phí phát triển và sử dụng được cho là thấp của công ty khởi nghiệp Trung Quốc này khiến các nhà đầu tư đặt câu hỏi về kế hoạch chi tiêu khổng lồ của các công ty AI hàng đầu tại Hoa Kỳ.
Nhưng thành công của DeepSeek cũng dẫn đến một cuộc chạy đua giữa các đối thủ cạnh tranh trong nước để nâng cấp các mô hình AI của riêng họ.
Hai ngày sau khi phát hành DeepSeek-R1, chủ sở hữu TikTok là ByteDance đã phát hành bản cập nhật cho mô hình AI hàng đầu của mình, được cho là vượt trội hơn o1 của OpenAI do Microsoft hậu thuẫn trong AIME, một bài kiểm tra chuẩn mực đo lường mức độ hiểu và phản hồi của các mô hình AI đối với các hướng dẫn phức tạp.
Điều này lặp lại tuyên bố của DeepSeek rằng mô hình R1 của họ đã cạnh tranh với o1 của OpenAI trên một số chuẩn mực hiệu suất.
Tiền thân của mô hình V3 của DeepSeek, DeepSeek-V2, đã gây ra một cuộc chiến giá thành mô hình AI ở Trung Quốc sau khi được phát hành vào tháng 5 năm ngoái.
Thực tế là DeepSeek-V2 là mã nguồn mở và rẻ chưa từng có, chỉ 1 nhân dân tệ (0,14 đô la) cho 1 triệu mã thông báo - hoặc các đơn vị dữ liệu được mô hình AI xử lý - đã khiến đơn vị đám mây của Alibaba tuyên bố giảm giá tới 97% cho một loạt các mô hình.
Các công ty công nghệ Trung Quốc khác cũng làm theo, bao gồm Baidu (9888.HK), công ty đã phát hành phiên bản tương đương đầu tiên của Trung Quốc với ChatGPT vào tháng 3 năm 2023 và công ty internet có giá trị nhất của đất nước này là Tencent (0700.HK).
Liang Wenfeng, người sáng lập bí ẩn của DeepSeek, cho biết trong một cuộc phỏng vấn hiếm hoi với hãng truyền thông Trung Quốc Waves vào tháng 7 rằng công ty khởi nghiệp này "không quan tâm" đến cuộc chiến giá cả và mục tiêu chính của họ là đạt được trí tuệ nhân tạo tổng quát - AGI (Artificial General Intelligence).
OpenAI định nghĩa AGI là các hệ thống tự động vượt qua con người trong hầu hết các nhiệm vụ có giá trị kinh tế.
Trong khi các công ty công nghệ lớn của Trung Quốc như Alibaba có hàng trăm nghìn nhân viên, DeepSeek hoạt động như một phòng thí nghiệm nghiên cứu, chủ yếu có nhân viên là những sinh viên mới tốt nghiệp và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu Trung Quốc.
Liang cho biết trong cuộc phỏng vấn vào tháng 7 rằng ông tin rằng các công ty công nghệ lớn nhất Trung Quốc có thể không phù hợp với tương lai của ngành công nghiệp AI, đối lập với chi phí cao và cấu trúc theo chiều từ trên xuống (top-down) của họ so với hoạt động tinh gọn và phong cách quản lý lỏng lẻo của DeepSeek.
"Các mô hình nền tảng lớn đòi hỏi sự đổi mới liên tục, khả năng của các công ty công nghệ khổng lồ có giới hạn của chúng", ông nói.
Bản tin tóm tắt hàng ngày của Reuters cung cấp mọi tin tức bạn cần để bắt đầu ngày mới. Đăng ký tại đây.
Báo cáo của Eduardo Baptista; Biên tập bởi Christian Schmollinger
Tiêu chuẩn của chúng tôi: Nguyên tắc tin cậy của Thomson Reuters.
Tác giả: admin
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Trang Web này được thành lập theo Quyết định số 142/QĐ-HH do Chủ tịch Hiệp hội các trường đại học, cao đẳng Việt Nam – AVU&C (Association of Vietnam Universities and Colleges), GS.TS. Trần Hồng Quân ký ngày 16/09/2019, ngay trước thềm của Hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do 5...
Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc
Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Ví dụ về lời nhắc
Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Mẹo chung cho việc thiết kế lời nhắc
Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Các thành phần của lời nhắc
Tài nguyên Giáo dục Mở trong kỷ nguyên AI
Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Cơ bản về lời nhắc
Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Thiết lập LLM
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
Các bài toàn văn cho tới hết năm 2024
Các bài trình chiếu trong năm 2024
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Bộ các tài liệu hướng dẫn của UNESCO cho các chính phủ và cơ sở để triển khai Khuyến nghị Tài nguyên Giáo dục Mở
Hướng dẫn thực hành về Giáo dục Mở cho các học giả: Hiện đại hóa giáo dục đại học thông qua các thực hành Giáo dục Mở (dựa trên Khung OpenEdu)
Chứng chỉ Creative Commons cho các nhà giáo dục, thủ thư hàn lâm, và văn hóa mở
Các mô hình bền vững Tài nguyên Giáo dục Mở (TNGDM) - Tổng hợp
ORCID - Quy trình làm việc
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Europeana - mô hình mẫu về hệ thống liên thông, Dữ liệu Mở (Liên kết) và dữ liệu FAIR của OpenGLAM/Văn hóa Mở
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
‘Bộ công cụ Khoa học Mở của UNESCO’ - Các bản dịch sang tiếng Việt
Định nghĩa các khái niệm liên quan tới Khoa học Mở
‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
‘ĐÁNH DẤU KHÓA HỌC MỞ VÀ KHAM ĐƯỢC: CÁC THỰC HÀNH TỐT NHẤT VÀ CÁC TRƯỜNG HỢP ĐIỂN HÌNH’ - VÀI THÔNG TIN HỮU ÍCH
Khóa học cơ bản về Dữ liệu Mở trong chương trình học tập điện tử trên Cổng Dữ liệu châu Âu