![]() |
| Startup AI DeepSeek của Trung Quốc đang thu hút sự quan tâm của giới công nghệ toàn cầu. (Nguồn: Sipa) |
Trả lời CNBC, người phát ngôn Nvidia gọi mô hình R1 của DeepSeek là “tiến bộ AI xuất sắc”. Công trình của DeepSeek cho thấy, các mô hình mới có thể được tạo ra bằng kỹ thuật Test Time Scaling như thế nào.
| Tin liên quan |
Trong kỹ thuật Test Time Scaling mà Nvidia đề xuất, một mô hình AI được đào tạo đầy đủ khi dành nhiều thời gian hơn để “suy luận” trong quá trình đưa ra dự đoán hoặc tạo ảnh, văn bản, nó sẽ cung cấp câu trả lời tốt hơn.
Bình luận được Nvidia đưa ra sau khi DeepSeek phát hành R1, mô hình suy luận nguồn mở được đánh giá là vượt trội so với các mô hình tốt nhất của Mỹ. Chi phí đào tạo R1 theo DeepSeek là chưa tới 6 triệu USD, chỉ bằng một phần rất nhỏ so với hàng tỷ USD mà Silicon Valley bỏ ra để phát triển các mô hình AI của mình.
"Cú sốc" DeepSeek đã khiến cổ phiếu công nghệ khắp thế giới sụp đổ. Ngày 27/1, cổ phiếu Nvidia giảm 17% giá trị, tương đương 600 tỷ USD vốn hóa bị "thổi bay", mức thiệt hại lớn nhất trong lịch sử doanh nghiệp Mỹ.
Một nhân vật máu mặt khác trong giới AI – Yann LeCun, nhà khoa học AI trưởng của Meta - cũng dành lời khen ngợi cho DeepSeek. Ông cho rằng nó đã chứng minh “các mô hình nguồn mở đang vượt qua mô hình độc quyền”.
“Họ nảy ra ý tưởng mới và xây dựng dựa trên công trình của người khác. Vì công trình của họ được công khai và là nguồn mở, mọi người có thể hưởng lợi từ nó. Đó chính là sức mạnh của nghiên cứu mở và nguồn mở”, ông viết trên Threads.
Tuyên bố của Nvidia có thể được hiểu theo cách đột phá của DeepSeek đang tạo ra nhiều việc làm hơn cho các bộ xử lý đồ họa (GPU) của hãng. Phát ngôn viên Nvidia giải thích, việc suy luận đòi hỏi số lượng GPU khổng lồ. Ngoài ra, người này khẳng định GPU mà DeepSeek sử dụng hoàn toàn tuân thủ quy định kiểm soát xuất khẩu của Mỹ.
Các nhà phân tích đang đặt câu hỏi liệu chi phí đầu tư hàng tỷ USD từ các công ty như Microsoft, Google và Meta dành cho hạ tầng AI có đang lãng phí hay không khi có thể đạt kết quả tương tự với chi phí rẻ hơn.
Đầu tháng 1, Microsoft cho biết sẽ chi 80 tỷ USD cho hạ tầng AI riêng năm 2025, còn CEO Meta Mark Zuckerberg gần đây nói dự định đầu tư từ 60 đến 65 tỷ USD chi phí vốn năm nay như một phần của chiến lược AI lớn hơn. Bản thân Zuckerberg là người ủng hộ các mô hình nguồn mở.
Tháng 9/2024, ông từng nói, mục tiêu trong 10-15 năm tới là tạo ra thế hệ các nền tảng mở mới và giúp các nền tảng mở “chiến thắng”, dẫn đến ngành công nghệ năng động hơn.
| Gặp gỡ chuyên gia, trí thức công nghệ Việt kiều: Tương lai của ngành công nghệ Việt Nam sáng lạn hơn bao giờ hết Sự kiện "Gặp gỡ chuyên gia, trí thức công nghệ Việt kiều" không chỉ là một hoạt động mang tính kết nối mà còn là ... |
| Không chỉ thương mại, quốc phòng, Mỹ 'dồn dập tấn công' Trung Quốc trong lĩnh vực đầu tư công nghệ cao Trong một vài ngày tới, Quốc hội Mỹ sẽ bỏ phiếu các hạn chế mới trong dự luật cấm đầu tư vào ngành công nghệ ... |
| Tin thế giới 30/12: Ukraine có hành động bất ngờ ở Syria, Trung Quốc lập kỷ lục thế giới, tấn công khủng bố ở Iran Báo Thế giới và Việt Nam điểm một số sự kiện quốc tế nổi bật trong 24h. |
| Lụa, áo dài và thủ công mỹ nghệ: Kết nối tinh hoa văn hóa Việt với thế giới từ San Francisco Tối 16/1, tại San Francisco, Hoa Kỳ, Tổng lãnh sự quán Việt Nam đã phối hợp với Viện Nghiên cứu tài chính, đầu tư và ... |
| Thời tiết đêm Giao thừa Tết Ất Tỵ 2025: Không khí lạnh tăng cường, Bắc Bộ trời rét đậm, rét hại, có mưa; Nam Trung Bộ và Nam Bộ ngày nắng Dịp Tết Nguyên đán, nhất là đêm Giao thừa, do không khí lạnh tăng cường, khu vực Bắc Bộ trời rét đậm, vùng núi Bắc ... |
