Huawei ra mắt Atlas 350: chip AI suy luận mới tuyên bố vượt H20 của NVIDIA 2,8 lần
Huawei ra mắt bộ tăng tốc AI Atlas 350 với chip Ascend 950PR, tuyên bố hiệu năng suy luận vượt H20 của NVIDIA tới 2,8 lần.
Huawei vừa giới thiệu Atlas 350, bộ tăng tốc AI mới được thiết kế tập trung vào suy luận (inference) thay vì huấn luyện (training), tức giai đoạn mà các mô hình AI đã được huấn luyện xong sẽ được triển khai vào ứng dụng thực tế như công cụ đề xuất nội dung, mô hình ngôn ngữ lớn và các hệ thống đa phương thức.
Trái tim của Atlas 350 là chip Ascend 950PR do Huawei tự phát triển, đạt khoảng 1,56 petaflops sức mạnh tính toán FP4. Hãng tuyên bố Atlas 350 mang lại hiệu năng cao hơn tới 2,8 lần so với H20 của NVIDIA trong một số tác vụ suy luận nhất định. Việc dùng độ chính xác FP4 cho phép xử lý nhanh hơn và tiêu thụ bộ nhớ ít hơn, phù hợp đặc biệt với triển khai quy mô lớn nơi tốc độ và hiệu quả quan trọng hơn độ chính xác cao.
Về bộ nhớ, Huawei chuyển sang tự sản xuất bộ nhớ băng thông cao (HBM) với cấu hình được báo cáo lên tới 128 GB và băng thông 1,6 TB/s. Việc tự sản xuất HBM giúp giảm phụ thuộc vào nhà cung cấp bên ngoài và củng cố năng lực bán dẫn nội địa của Trung Quốc. Bên cạnh đó, chip được tối ưu hóa cho giai đoạn "prefill" trong quá trình suy luận, tức khâu xử lý dữ liệu đầu vào, yếu tố then chốt với các ứng dụng AI thời gian thực và các hệ thống dạng agent đang ngày càng phổ biến.
Trong bối cảnh căng thẳng công nghệ Mỹ - Trung, các lệnh hạn chế xuất khẩu của Mỹ đã cắt đứt khả năng tiếp cận chip tiên tiến của Trung Quốc, trong khi Huawei tự phát triển được chip AI cạnh tranh để thay thế.
NỔI BẬT TRANG CHỦ
-
MacBook Neo giá 16 triệu đồng, Apple vẫn lời lớn nhờ bán thứ mà người dùng không nhìn thấy
Doanh thu dịch vụ đang hướng tới mốc 100 tỷ USD mỗi năm, và MacBook Neo chính là cánh cổng đưa hàng triệu người bước vào hệ sinh thái đó.
-
Tin vui cho game thủ: OpenAI cắt siêu dự án, Google nén RAM AI xuống 6 lần - Giá DDR5 giảm mạnh nhất trong một tuần