 
                How DeepSeek will upend the AI industry — and open it to competition
News Analysis; Jan 30, 20256 mins
Bài được đưa lên Internet ngày: 30/01/2025
Các kỹ thuật tiết kiệm chi phí của công ty khởi nghiệp Trung Quốc DeepSeek để đào tạo và cung cấp các mô hình AI tạo sinh (genAI) có thể dân chủ hóa toàn bộ ngành bằng cách hạ thấp rào cản lối vào cho các công ty AI mới.
DeepSeek đã tạo nên làn sóng trong tuần này khi chatbot của công ty đã vượt qua lượt tải xuống ChatGPT trên Apple và Google App Store. Tác động của mô hình AI nguồn mở này nằm ở việc phù hợp với hiệu suất của các mô hình hàng đầu của Hoa Kỳ với chi phí chỉ bằng một phần nhỏ bằng cách sử dụng tài nguyên tính toán và bộ nhớ hiệu quả hơn.
DeepSeek không chỉ là "ChatGPT" của Trung Quốc; mà còn là một bước tiến lớn cho AI toàn cầu bằng cách giúp việc xây dựng mô hình rẻ hơn, nhanh hơn và dễ tiếp cận hơn, theo Forrester Research. Mặc dù các mô hình ngôn ngữ lớn (LLM) không phải là con đường duy nhất dẫn đến AI tiên tiến, nhưng những đổi mới của DeepSeek nên được "tôn vinh như một cột mốc cho sự tiến bộ của AI", công ty nghiên cứu cho biết.
Hiệu quả của phương pháp luận AI của DeepSeek có nghĩa là nó yêu cầu ít năng lực tính toán hơn nhiều để chạy; điều đó có nghĩa là nó cũng có thể ảnh hưởng đến ngành công nghiệp chip, vốn đang tận dụng làn sóng mua phần cứng tăng tốc GPU và AI của các công ty đang xây dựng các trung tâm dữ liệu khổng lồ.
Ví dụ, Meta đang có kế hoạch chi 65 tỷ đô la để xây dựng một trung tâm dữ liệu có diện tích gần bằng Manhattan. Dự kiến sẽ đi vào hoạt động vào cuối năm nay, trung tâm dữ liệu này sẽ chứa 1,3 triệu GPU để cung cấp năng lượng cho công nghệ AI được Facebook và các liên doanh khác của Meta sử dụng.
Rita Sallam, phó chủ tịch phân tích nổi tiếng tại Gartner Research cho biết: "Chi phí của nhà cung cấp hàng đầu hiện tại và các mô hình định giá kết quả chuyển chi phí đổi mới và phát triển, đào tạo và vận hành LLM cao đã khiến chỉ những công ty lớn nhất, được tài trợ tốt nhất và có nhiều tiền nhất mới có thể phát triển LLM".
Sallam cho biết chi phí cao đã cản trở việc áp dụng GenAI, dẫn đến lợi nhuận đầu tư âm cho nhiều trường hợp sử dụng của tổ chức ở quy mô lớn. Điều đó, đến lượt nó, đã kìm hãm sự đổi mới, ngay cả khi có trợ cấp của nhà cung cấp. Bà cho biết cách tiếp cận của DeepSeek cắt giảm chi phí phần cứng và tính toán, cho phép các công ty nhỏ hơn cạnh tranh trong quá trình phát triển LLM và thúc đẩy đổi mới GenAI mới.
Bây giờ khi các kỹ thuật của DeepSeek đã được biết đến, các nhà xây dựng mô hình khác, bao gồm cả những người dẫn đầu, sẽ nhanh chóng làm theo, giảm chi phí LLM trong ngắn hạn đến trung hạn. Tuy nhiên, các bộ xử lý và bộ tăng tốc mạnh mẽ vẫn sẽ thúc đẩy chi phí R&D và tính toán cao cho các mô hình tiên tiến, sẽ được chuyển cho những người áp dụng sớm. Sallam lưu ý rằng việc giảm chi phí ban đầu đó sẽ thúc đẩy việc áp dụng và đổi mới GenAI rộng rãi hơn.
Brendan Englot, giáo sư và chuyên gia AI tại Viện Công nghệ Stevens ở New Jersey, cho biết thực tế là các mô hình của DeepSeek cũng là mã nguồn mở cũng sẽ giúp các công ty khởi nghiệp AI khác dễ dàng cạnh tranh hơn với các công ty công nghệ lớn. Englot, cũng là giám đốc của Viện Trí tuệ nhân tạo Stevens (SIAI), cho biết: "Công nghệ của DeepSeek là một ví dụ tuyệt vời về cách các công cụ mới mang tính đột phá và sáng tạo có thể được xây dựng nhanh hơn với sự hỗ trợ của phần mềm nguồn mở".
Sự xuất hiện của DeepSeek đã làm giảm giá cổ phiếu của nhà cung cấp GPU hàng đầu Nvidia, vì các nhà đầu tư nhận ra tác động của các quy trình hiệu quả hơn đối với doanh số bán bộ xử lý và bộ tăng tốc AI.
"DeepThink" là một tính năng trong chatbot AI DeepSeek tận dụng mô hình R1 để cung cấp khả năng suy luận nâng cao, sử dụng các kỹ thuật tiên tiến để chia nhỏ các truy vấn phức tạp thành các tác vụ nhỏ hơn, dễ quản lý hơn.
Nhờ những loại tối ưu hóa đó, DeepThink (R1) chỉ tốn khoảng 5,5 triệu đô la để đào tạo — ít hơn hàng chục triệu đô la so với các mô hình tương tự. Mặc dù điều này có thể làm giảm nhu cầu ngắn hạn đối với Nvidia, nhưng chi phí thấp hơn có thể sẽ thúc đẩy nhiều công ty khởi nghiệp và doanh nghiệp tạo ra các mô hình hơn, thúc đẩy nhu cầu dài hạn, Forrester Research cho biết.
Và, trong khi chi phí đào tạo các mô hình AI vừa giảm đáng kể với DeepThink, chi phí để hỗ trợ suy luận vẫn sẽ đòi hỏi khả năng tính toán và lưu trữ đáng kể, Forrester cho biết. "Sự thay đổi này cho thấy các nhà cung cấp mô hình AI cốt lõi sẽ không đủ, mở rộng hơn nữa thị trường AI", công ty cho biết trong một lưu ý nghiên cứu. "Đừng khóc cho Nvidia và các công ty siêu quy mô ngay bây giờ. Ngoài ra, có thể có cơ hội để Intel giành lại vị thế của mình".
Englot đồng ý, nói rằng hiện tại có rất nhiều sự cạnh tranh và đầu tư để sản xuất phần mềm và phần cứng AI hữu ích, "và điều đó có khả năng mang lại nhiều đột phá hơn nữa trong tương lai rất gần".
Công nghệ cơ sở DeepSeek không phải là công nghệ tiên phong. Ngược lại, bài báo nghiên cứu mới công bố của công ty cho thấy mô hình Llama của Meta và Qwen của Alibaba đóng vai trò quan trọng trong việc phát triển DeepSeek-R1 và DeepSeek-R1-Zero — hai mô hình đầu tiên của công ty, Englot lưu ý.
Trên thực tế, Englot không tin rằng bước tiến của DeepSeek gây ra nhiều mối đe dọa cho ngành công nghiệp bán dẫn như sự sụt giảm cổ phiếu trong tuần này cho thấy. Các công cụ GenAI vẫn sẽ dựa vào GPU và bước đột phá của DeepSeek chỉ cho thấy một số tính toán có thể được thực hiện hiệu quả hơn.
"Nếu có bất kỳ điều gì, thì sự tiến bộ này là tin tốt mà tất cả các nhà phát triển công nghệ AI đều có thể tận dụng", Englot cho biết. "Những gì chúng ta thấy vào đầu tuần này chỉ là một dấu hiệu cho thấy cần ít phần cứng máy tính hơn để đào tạo và triển khai một mô hình ngôn ngữ mạnh mẽ hơn so với chúng ta đã nghĩ ban đầu. Điều này có thể cho phép những người đổi mới AI tiến lên phía trước và dành nhiều sự chú ý hơn cho các nguồn lực cần thiết cho AI đa phương thức và các ứng dụng tiên tiến ngoài các bot trò chuyện".
Những người khác đồng ý.
Mel Morris, Giám đốc điều hành của công ty khởi nghiệp Corpora.ai, cho biết khả năng chi trả và mô hình nguồn mở của DeepSeek cho phép các nhà phát triển tùy chỉnh và đổi mới một cách rẻ và tự do. Ông cho biết nó cũng sẽ thách thức bối cảnh cạnh tranh và thúc đẩy các công ty lớn như OpenAI — nhà phát triển ChatGPT — thích ứng nhanh chóng.
Morris cho biết: “Ý tưởng về sự cạnh tranh thúc đẩy đổi mới đặc biệt có liên quan ở đây, vì sự hiện diện của DeepSeek có khả năng thúc đẩy những tiến bộ nhanh hơn trong công nghệ AI, dẫn đến các giải pháp hiệu quả và dễ tiếp cận hơn để đáp ứng nhu cầu ngày càng tăng”. “Ngoài ra, mô hình nguồn mở trao quyền cho các nhà phát triển tinh chỉnh và thử nghiệm hệ thống, thúc đẩy tính linh hoạt và đổi mới cao hơn”.
Forrester cảnh báo rằng, theo chính sách bảo mật của mình, DeepSeek nêu rõ rằng họ có thể thu thập “văn bản hoặc đầu vào âm thanh, lời nhắc, tệp đã tải lên, phản hồi, lịch sử trò chuyện hoặc nội dung khác của bạn” và sử dụng cho mục đích đào tạo. Họ cũng nêu rõ rằng họ có thể chia sẻ thông tin này với các cơ quan thực thi pháp luật [và] các cơ quan công quyền theo quyết định của mình.
Những cảnh báo đó có thể gây lo ngại cho các doanh nghiệp đã vội vàng áp dụng các công cụ genAI nhưng lại lo ngại về quyền riêng tư dữ liệu, đặc biệt là khi liên quan đến thông tin nhạy cảm của công ty.
Forrester cho biết: “Hãy giáo dục và thông báo cho nhân viên của bạn về hậu quả của việc sử dụng công nghệ này và nhập thông tin cá nhân và công ty vào đó”. “Đồng ý với các nhà lãnh đạo sản phẩm về việc liệu các nhà phát triển có nên thử nghiệm tính năng này hay không và liệu sản phẩm có nên hỗ trợ việc triển khai tính năng này mà không cần các yêu cầu về quyền riêng tư chặt chẽ hơn hay không.”
--------------------------
Phóng viên cao cấp
1. Theo dõi Lucas Mearian trên X
Phóng viên cao cấp Lucas Mearian đưa tin về AI trong doanh nghiệp, các vấn đề về Tương lai của công việc, CNTT chăm sóc sức khỏe và FinTech.
Tác giả: admin
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Trang Web này được thành lập theo Quyết định số 142/QĐ-HH do Chủ tịch Hiệp hội các trường đại học, cao đẳng Việt Nam – AVU&C (Association of Vietnam Universities and Colleges), GS.TS. Trần Hồng Quân ký ngày 16/09/2019, ngay trước thềm của Hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do 5...
 Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc. Lời nhắc với vài ví dụ/minh họa (Few-Shot Prompting)
        Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc. Lời nhắc với vài ví dụ/minh họa (Few-Shot Prompting)
     Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc. Lời nhắc không có ví dụ/minh họa (Zero-Shot Prompting)
        Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc. Lời nhắc không có ví dụ/minh họa (Zero-Shot Prompting)
     Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc
        Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc
     Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Ví dụ về lời nhắc
        Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Ví dụ về lời nhắc
     Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Mẹo chung cho việc thiết kế lời nhắc
        Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Mẹo chung cho việc thiết kế lời nhắc
     Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Các thành phần của lời nhắc
        Hướng dẫn kỹ thuật lời nhắc. Giới thiệu. Các thành phần của lời nhắc
     Tài nguyên Giáo dục Mở trong kỷ nguyên AI
        Tài nguyên Giáo dục Mở trong kỷ nguyên AI
     50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
        50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
     Các bài toàn văn cho tới hết năm 2024
        Các bài toàn văn cho tới hết năm 2024
     Các bài trình chiếu trong năm 2024
        Các bài trình chiếu trong năm 2024
     Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
        Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
     Các tài liệu dịch sang tiếng Việt tới hết năm 2024
        Các tài liệu dịch sang tiếng Việt tới hết năm 2024
     Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
        Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
     Bộ các tài liệu hướng dẫn của UNESCO cho các chính phủ và cơ sở để triển khai Khuyến nghị Tài nguyên Giáo dục Mở
        Bộ các tài liệu hướng dẫn của UNESCO cho các chính phủ và cơ sở để triển khai Khuyến nghị Tài nguyên Giáo dục Mở
     Hướng dẫn thực hành về Giáo dục Mở cho các học giả: Hiện đại hóa giáo dục đại học thông qua các thực hành Giáo dục Mở (dựa trên Khung OpenEdu)
        Hướng dẫn thực hành về Giáo dục Mở cho các học giả: Hiện đại hóa giáo dục đại học thông qua các thực hành Giáo dục Mở (dựa trên Khung OpenEdu)
     Chứng chỉ Creative Commons cho các nhà giáo dục, thủ thư hàn lâm, và văn hóa mở
        Chứng chỉ Creative Commons cho các nhà giáo dục, thủ thư hàn lâm, và văn hóa mở
     Các mô hình bền vững Tài nguyên Giáo dục Mở (TNGDM) - Tổng hợp
        Các mô hình bền vững Tài nguyên Giáo dục Mở (TNGDM) - Tổng hợp
     ORCID - Quy trình làm việc
        ORCID - Quy trình làm việc
     Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
        Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
     Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
        Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
     Europeana - mô hình mẫu về hệ thống liên thông, Dữ liệu Mở (Liên kết) và dữ liệu FAIR của OpenGLAM/Văn hóa Mở
        Europeana - mô hình mẫu về hệ thống liên thông, Dữ liệu Mở (Liên kết) và dữ liệu FAIR của OpenGLAM/Văn hóa Mở
     Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
        Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
     ‘Bộ công cụ Khoa học Mở của UNESCO’ - Các bản dịch sang tiếng Việt
        ‘Bộ công cụ Khoa học Mở của UNESCO’ - Các bản dịch sang tiếng Việt
     Định nghĩa các khái niệm liên quan tới Khoa học Mở
        Định nghĩa các khái niệm liên quan tới Khoa học Mở
     ‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
        ‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
     ‘ĐÁNH DẤU KHÓA HỌC MỞ VÀ KHAM ĐƯỢC: CÁC THỰC HÀNH TỐT NHẤT VÀ CÁC TRƯỜNG HỢP ĐIỂN HÌNH’ - VÀI THÔNG TIN HỮU ÍCH
        ‘ĐÁNH DẤU KHÓA HỌC MỞ VÀ KHAM ĐƯỢC: CÁC THỰC HÀNH TỐT NHẤT VÀ CÁC TRƯỜNG HỢP ĐIỂN HÌNH’ - VÀI THÔNG TIN HỮU ÍCH
     Khóa học cơ bản về Dữ liệu Mở trong chương trình học tập điện tử trên Cổng Dữ liệu châu Âu
        Khóa học cơ bản về Dữ liệu Mở trong chương trình học tập điện tử trên Cổng Dữ liệu châu Âu