biểu ngữ trường hợp

Tin tức ngành: Jim Keller đã ra mắt chip RISC-V mới

Tin tức ngành: Jim Keller đã ra mắt chip RISC-V mới

Công ty sản xuất chip Tenstorrent do Jim Keller đứng đầu đã phát hành bộ xử lý Wormhole thế hệ tiếp theo dành cho khối lượng công việc AI, dự kiến ​​sẽ mang lại hiệu suất tốt với mức giá phải chăng.Hiện tại, công ty cung cấp thêm hai card PCIe có thể chứa một hoặc hai bộ xử lý Wormhole, cũng như các máy trạm TT-LoudBox và TT-QuietBox dành cho các nhà phát triển phần mềm. Tất cả các thông báo hôm nay đều hướng đến các nhà phát triển, không phải những người sử dụng bo mạch Wormhole cho khối lượng công việc thương mại.

Jim Keller, CEO của Tenstorrent cho biết: "Luôn vui mừng khi đưa nhiều sản phẩm của chúng tôi hơn vào tay các nhà phát triển. Các hệ thống phát triển bản phát hành sử dụng thẻ Wormhole™ của chúng tôi có thể giúp các nhà phát triển mở rộng quy mô và phát triển phần mềm AI đa chip".Ngoài lần ra mắt này, chúng tôi rất vui mừng khi thấy được tiến triển trong việc phát hành băng và tăng cường sức mạnh cho sản phẩm thế hệ thứ hai của chúng tôi, Blackhole.”

1

Mỗi bộ xử lý Wormhole chứa 72 lõi Tensix (năm lõi trong số đó hỗ trợ lõi RISC-V ở nhiều định dạng dữ liệu khác nhau) và 108 MB SRAM, cung cấp 262 FP8 TFLOPS ở tốc độ 1 GHz với công suất thiết kế nhiệt là 160W. Thẻ Wormhole n150 một chip được trang bị bộ nhớ video GDDR6 12 GB và có băng thông 288 GB/giây.

Bộ xử lý Wormhole cung cấp khả năng mở rộng linh hoạt để đáp ứng các nhu cầu đa dạng của khối lượng công việc. Trong thiết lập máy trạm tiêu chuẩn với bốn thẻ Wormhole n300, các bộ xử lý có thể được kết hợp thành một đơn vị duy nhất xuất hiện trong phần mềm dưới dạng mạng lõi Tensix rộng, thống nhất. Cấu hình này cho phép bộ tăng tốc xử lý cùng một khối lượng công việc, chia cho bốn nhà phát triển hoặc chạy tối đa tám mô hình AI khác nhau cùng lúc. Một tính năng chính của khả năng mở rộng này là nó có thể chạy cục bộ mà không cần ảo hóa. Trong môi trường trung tâm dữ liệu, bộ xử lý Wormhole sẽ sử dụng PCIe để mở rộng bên trong máy hoặc Ethernet để mở rộng bên ngoài.

Về hiệu suất, card Wormhole n150 chip đơn của Tenstorrent (72 lõi Tensix, tần số 1 GHz, 108 MB SRAM, 12 GB GDDR6, băng thông 288 GB/giây) đạt 262 FP8 TFLOPS ở mức 160W, trong khi bo mạch Wormhole n300 chip kép (128 lõi Tensix, tần số 1 GHz, 192 MB SRAM, tổng cộng 24 GB GDDR6, băng thông 576 GB/giây) mang lại tới 466 FP8 TFLOPS ở mức 300W.

Để đưa 300W của 466 FP8 TFLOPS vào bối cảnh, chúng ta sẽ so sánh nó với những gì mà Nvidia, công ty dẫn đầu thị trường AI, cung cấp ở mức công suất thiết kế nhiệt này. A100 của Nvidia không hỗ trợ FP8, nhưng nó hỗ trợ INT8, với hiệu suất tối đa là 624 TOPS (1.248 TOPS khi thưa thớt). Để so sánh, H100 của Nvidia hỗ trợ FP8 và đạt hiệu suất tối đa là 1.670 TFLOPS ở 300W (3.341 TFLOPS khi thưa thớt), khác biệt đáng kể so với Wormhole n300 của Tenstorrent.

Tuy nhiên, có một vấn đề lớn. Wormhole n150 của Tenstorrent được bán lẻ với giá 999 đô la, trong khi n300 được bán với giá 1.399 đô la. Để so sánh, một card đồ họa Nvidia H100 bán lẻ với giá 30.000 đô la, tùy thuộc vào số lượng. Tất nhiên, chúng ta không biết liệu bốn hay tám bộ xử lý Wormhole có thực sự mang lại hiệu suất của một H300 hay không, nhưng TDP của chúng lần lượt là 600W và 1200W.

Ngoài các card, Tenstorrent còn cung cấp các máy trạm được dựng sẵn cho các nhà phát triển, bao gồm 4 card n300 trong TT-LoudBox chạy trên nền tảng Xeon giá cả phải chăng hơn với chức năng làm mát chủ động và TT-QuietBox tiên tiến với chức năng làm mát bằng chất lỏng Xiaolong chạy trên nền tảng EPYC).


Thời gian đăng: 29-07-2024