How DeepSeek will upend the AI industry — and open it to competition
News Analysis; Jan 30, 20256 mins
Bài được đưa lên Internet ngày: 30/01/2025
Các kỹ thuật tiết kiệm chi phí của công ty khởi nghiệp Trung Quốc DeepSeek để đào tạo và cung cấp các mô hình AI tạo sinh (genAI) có thể dân chủ hóa toàn bộ ngành bằng cách hạ thấp rào cản lối vào cho các công ty AI mới.
DeepSeek đã tạo nên làn sóng trong tuần này khi chatbot của công ty đã vượt qua lượt tải xuống ChatGPT trên Apple và Google App Store. Tác động của mô hình AI nguồn mở này nằm ở việc phù hợp với hiệu suất của các mô hình hàng đầu của Hoa Kỳ với chi phí chỉ bằng một phần nhỏ bằng cách sử dụng tài nguyên tính toán và bộ nhớ hiệu quả hơn.
DeepSeek không chỉ là "ChatGPT" của Trung Quốc; mà còn là một bước tiến lớn cho AI toàn cầu bằng cách giúp việc xây dựng mô hình rẻ hơn, nhanh hơn và dễ tiếp cận hơn, theo Forrester Research. Mặc dù các mô hình ngôn ngữ lớn (LLM) không phải là con đường duy nhất dẫn đến AI tiên tiến, nhưng những đổi mới của DeepSeek nên được "tôn vinh như một cột mốc cho sự tiến bộ của AI", công ty nghiên cứu cho biết.
Hiệu quả của phương pháp luận AI của DeepSeek có nghĩa là nó yêu cầu ít năng lực tính toán hơn nhiều để chạy; điều đó có nghĩa là nó cũng có thể ảnh hưởng đến ngành công nghiệp chip, vốn đang tận dụng làn sóng mua phần cứng tăng tốc GPU và AI của các công ty đang xây dựng các trung tâm dữ liệu khổng lồ.
Ví dụ, Meta đang có kế hoạch chi 65 tỷ đô la để xây dựng một trung tâm dữ liệu có diện tích gần bằng Manhattan. Dự kiến sẽ đi vào hoạt động vào cuối năm nay, trung tâm dữ liệu này sẽ chứa 1,3 triệu GPU để cung cấp năng lượng cho công nghệ AI được Facebook và các liên doanh khác của Meta sử dụng.
Rita Sallam, phó chủ tịch phân tích nổi tiếng tại Gartner Research cho biết: "Chi phí của nhà cung cấp hàng đầu hiện tại và các mô hình định giá kết quả chuyển chi phí đổi mới và phát triển, đào tạo và vận hành LLM cao đã khiến chỉ những công ty lớn nhất, được tài trợ tốt nhất và có nhiều tiền nhất mới có thể phát triển LLM".
Sallam cho biết chi phí cao đã cản trở việc áp dụng GenAI, dẫn đến lợi nhuận đầu tư âm cho nhiều trường hợp sử dụng của tổ chức ở quy mô lớn. Điều đó, đến lượt nó, đã kìm hãm sự đổi mới, ngay cả khi có trợ cấp của nhà cung cấp. Bà cho biết cách tiếp cận của DeepSeek cắt giảm chi phí phần cứng và tính toán, cho phép các công ty nhỏ hơn cạnh tranh trong quá trình phát triển LLM và thúc đẩy đổi mới GenAI mới.
Bây giờ khi các kỹ thuật của DeepSeek đã được biết đến, các nhà xây dựng mô hình khác, bao gồm cả những người dẫn đầu, sẽ nhanh chóng làm theo, giảm chi phí LLM trong ngắn hạn đến trung hạn. Tuy nhiên, các bộ xử lý và bộ tăng tốc mạnh mẽ vẫn sẽ thúc đẩy chi phí R&D và tính toán cao cho các mô hình tiên tiến, sẽ được chuyển cho những người áp dụng sớm. Sallam lưu ý rằng việc giảm chi phí ban đầu đó sẽ thúc đẩy việc áp dụng và đổi mới GenAI rộng rãi hơn.
Brendan Englot, giáo sư và chuyên gia AI tại Viện Công nghệ Stevens ở New Jersey, cho biết thực tế là các mô hình của DeepSeek cũng là mã nguồn mở cũng sẽ giúp các công ty khởi nghiệp AI khác dễ dàng cạnh tranh hơn với các công ty công nghệ lớn. Englot, cũng là giám đốc của Viện Trí tuệ nhân tạo Stevens (SIAI), cho biết: "Công nghệ của DeepSeek là một ví dụ tuyệt vời về cách các công cụ mới mang tính đột phá và sáng tạo có thể được xây dựng nhanh hơn với sự hỗ trợ của phần mềm nguồn mở".
Sự xuất hiện của DeepSeek đã làm giảm giá cổ phiếu của nhà cung cấp GPU hàng đầu Nvidia, vì các nhà đầu tư nhận ra tác động của các quy trình hiệu quả hơn đối với doanh số bán bộ xử lý và bộ tăng tốc AI.
"DeepThink" là một tính năng trong chatbot AI DeepSeek tận dụng mô hình R1 để cung cấp khả năng suy luận nâng cao, sử dụng các kỹ thuật tiên tiến để chia nhỏ các truy vấn phức tạp thành các tác vụ nhỏ hơn, dễ quản lý hơn.
Nhờ những loại tối ưu hóa đó, DeepThink (R1) chỉ tốn khoảng 5,5 triệu đô la để đào tạo — ít hơn hàng chục triệu đô la so với các mô hình tương tự. Mặc dù điều này có thể làm giảm nhu cầu ngắn hạn đối với Nvidia, nhưng chi phí thấp hơn có thể sẽ thúc đẩy nhiều công ty khởi nghiệp và doanh nghiệp tạo ra các mô hình hơn, thúc đẩy nhu cầu dài hạn, Forrester Research cho biết.
Và, trong khi chi phí đào tạo các mô hình AI vừa giảm đáng kể với DeepThink, chi phí để hỗ trợ suy luận vẫn sẽ đòi hỏi khả năng tính toán và lưu trữ đáng kể, Forrester cho biết. "Sự thay đổi này cho thấy các nhà cung cấp mô hình AI cốt lõi sẽ không đủ, mở rộng hơn nữa thị trường AI", công ty cho biết trong một lưu ý nghiên cứu. "Đừng khóc cho Nvidia và các công ty siêu quy mô ngay bây giờ. Ngoài ra, có thể có cơ hội để Intel giành lại vị thế của mình".
Englot đồng ý, nói rằng hiện tại có rất nhiều sự cạnh tranh và đầu tư để sản xuất phần mềm và phần cứng AI hữu ích, "và điều đó có khả năng mang lại nhiều đột phá hơn nữa trong tương lai rất gần".
Công nghệ cơ sở DeepSeek không phải là công nghệ tiên phong. Ngược lại, bài báo nghiên cứu mới công bố của công ty cho thấy mô hình Llama của Meta và Qwen của Alibaba đóng vai trò quan trọng trong việc phát triển DeepSeek-R1 và DeepSeek-R1-Zero — hai mô hình đầu tiên của công ty, Englot lưu ý.
Trên thực tế, Englot không tin rằng bước tiến của DeepSeek gây ra nhiều mối đe dọa cho ngành công nghiệp bán dẫn như sự sụt giảm cổ phiếu trong tuần này cho thấy. Các công cụ GenAI vẫn sẽ dựa vào GPU và bước đột phá của DeepSeek chỉ cho thấy một số tính toán có thể được thực hiện hiệu quả hơn.
"Nếu có bất kỳ điều gì, thì sự tiến bộ này là tin tốt mà tất cả các nhà phát triển công nghệ AI đều có thể tận dụng", Englot cho biết. "Những gì chúng ta thấy vào đầu tuần này chỉ là một dấu hiệu cho thấy cần ít phần cứng máy tính hơn để đào tạo và triển khai một mô hình ngôn ngữ mạnh mẽ hơn so với chúng ta đã nghĩ ban đầu. Điều này có thể cho phép những người đổi mới AI tiến lên phía trước và dành nhiều sự chú ý hơn cho các nguồn lực cần thiết cho AI đa phương thức và các ứng dụng tiên tiến ngoài các bot trò chuyện".
Những người khác đồng ý.
Mel Morris, Giám đốc điều hành của công ty khởi nghiệp Corpora.ai, cho biết khả năng chi trả và mô hình nguồn mở của DeepSeek cho phép các nhà phát triển tùy chỉnh và đổi mới một cách rẻ và tự do. Ông cho biết nó cũng sẽ thách thức bối cảnh cạnh tranh và thúc đẩy các công ty lớn như OpenAI — nhà phát triển ChatGPT — thích ứng nhanh chóng.
Morris cho biết: “Ý tưởng về sự cạnh tranh thúc đẩy đổi mới đặc biệt có liên quan ở đây, vì sự hiện diện của DeepSeek có khả năng thúc đẩy những tiến bộ nhanh hơn trong công nghệ AI, dẫn đến các giải pháp hiệu quả và dễ tiếp cận hơn để đáp ứng nhu cầu ngày càng tăng”. “Ngoài ra, mô hình nguồn mở trao quyền cho các nhà phát triển tinh chỉnh và thử nghiệm hệ thống, thúc đẩy tính linh hoạt và đổi mới cao hơn”.
Forrester cảnh báo rằng, theo chính sách bảo mật của mình, DeepSeek nêu rõ rằng họ có thể thu thập “văn bản hoặc đầu vào âm thanh, lời nhắc, tệp đã tải lên, phản hồi, lịch sử trò chuyện hoặc nội dung khác của bạn” và sử dụng cho mục đích đào tạo. Họ cũng nêu rõ rằng họ có thể chia sẻ thông tin này với các cơ quan thực thi pháp luật [và] các cơ quan công quyền theo quyết định của mình.
Những cảnh báo đó có thể gây lo ngại cho các doanh nghiệp đã vội vàng áp dụng các công cụ genAI nhưng lại lo ngại về quyền riêng tư dữ liệu, đặc biệt là khi liên quan đến thông tin nhạy cảm của công ty.
Forrester cho biết: “Hãy giáo dục và thông báo cho nhân viên của bạn về hậu quả của việc sử dụng công nghệ này và nhập thông tin cá nhân và công ty vào đó”. “Đồng ý với các nhà lãnh đạo sản phẩm về việc liệu các nhà phát triển có nên thử nghiệm tính năng này hay không và liệu sản phẩm có nên hỗ trợ việc triển khai tính năng này mà không cần các yêu cầu về quyền riêng tư chặt chẽ hơn hay không.”
--------------------------
Phóng viên cao cấp
1. Theo dõi Lucas Mearian trên X
Phóng viên cao cấp Lucas Mearian đưa tin về AI trong doanh nghiệp, các vấn đề về Tương lai của công việc, CNTT chăm sóc sức khỏe và FinTech.
Tác giả: admin
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Trang Web này được thành lập theo Quyết định số 142/QĐ-HH do Chủ tịch Hiệp hội các trường đại học, cao đẳng Việt Nam – AVU&C (Association of Vietnam Universities and Colleges), GS.TS. Trần Hồng Quân ký ngày 16/09/2019, ngay trước thềm của Hội thảo ‘Xây dựng và khai thác tài nguyên giáo dục mở’ do 5...