Jimo Kellerio vadovaujama lustų įmonė „Tenstorrent“ išleido naujos kartos „Wormhole“ procesorių, skirtą dirbtinio intelekto apkrovoms, kuris tikisi pasiūlyti gerą našumą už prieinamą kainą.Šiuo metu įmonė siūlo dvi papildomas PCIe korteles, kuriose gali tilpti vienas arba du „Wormhole“ procesoriai, taip pat programinės įrangos kūrėjams skirtas TT-LoudBox ir TT-QuietBox darbo stotis. Visi šiandieniniai pranešimai yra skirti kūrėjams, o ne tiems, kurie naudoja Wormhole plokštes komerciniam darbo krūviui.
„Visada džiugu, kad daugiau mūsų produktų patenka į kūrėjų rankas. Išleisdami kūrimo sistemas, kuriose naudojamos mūsų „Wormhole™“ kortelės, kūrėjai gali išplėsti ir kurti kelių lustų AI programinę įrangą“, – sakė „Tenstorrent“ generalinis direktorius Jimas Kelleris.Be šio pristatymo, džiaugiamės matydami pažangą, kurią darome išleidžiant juostą ir įjungiant antrosios kartos produktą „Blackhole“.
Kiekviename „Wormhole“ procesoriuje yra 72 Tensix branduoliai (iš kurių penki palaiko RISC-V branduolius įvairiais duomenų formatais) ir 108 MB SRAM, užtikrinantys 262 FP8 TFLOPS 1 GHz dažniu ir 160 W šiluminę galią. Vieno lusto Wormhole n150 kortelė aprūpinta 12 GB GDDR6 vaizdo atmintimi, jos pralaidumas siekia 288 GB/s.
„Wormhole“ procesoriai suteikia lankstų mastelio keitimą, kad atitiktų įvairius darbo krūvio poreikius. Standartinėje darbo vietoje su keturiomis Wormhole n300 kortelėmis procesoriai gali būti sujungti į vieną įrenginį, kuris programinėje įrangoje rodomas kaip vieningas platus Tensix pagrindinis tinklas. Ši konfigūracija leidžia greitintuvui valdyti tą patį darbo krūvį, padalinti keturiems kūrėjams arba vienu metu paleisti iki aštuonių skirtingų AI modelių. Pagrindinė šio mastelio ypatybė yra ta, kad jis gali veikti vietoje be virtualizacijos. Duomenų centro aplinkoje „Wormhole“ procesoriai naudos PCIe, kad išplėstų įrenginio viduje, arba Ethernet, kad išskleistų išorę.
Kalbant apie našumą, „Tenstorrent“ vieno lusto „Wormhole n150“ kortelė (72 „Tensix“ branduoliai, 1 GHz dažnis, 108 MB SRAM, 12 GB GDDR6, 288 GB/s pralaidumas) pasiekė 262 FP8 TFLOPS esant 160 W, o dvigubos plokštės W3mholepn. (128 Tensix branduoliai, 1 GHz dažnis, 192 MB SRAM, bendras 24 GB GDDR6, 576 GB/s pralaidumas) užtikrina iki 466 FP8 TFLOPS esant 300 W.
Norėdami į kontekstą įtraukti 300 W iš 466 FP8 TFLOPS, palyginsime ją su tuo, ką AI rinkos lyderė „Nvidia“ siūlo tokia šiluminio dizaino galia. Nvidia A100 nepalaiko FP8, bet palaiko INT8, kurio didžiausias našumas yra 624 TOPS (1 248 TOPS, kai retai). Palyginimui, „Nvidia H100“ palaiko FP8 ir pasiekia didžiausią našumą – 1 670 TFLOPS esant 300 W (3 341 TFLOPS esant retai), o tai žymiai skiriasi nuo „Tenstorrent“ Wormhole n300.
Tačiau yra viena didelė problema. „Tenstorrent“ „Wormhole n150“ parduodama už 999 USD, o „n300“ – už 1 399 USD. Palyginimui, viena Nvidia H100 vaizdo plokštė kainuoja 30 000 USD, priklausomai nuo kiekio. Žinoma, mes nežinome, ar keturi ar aštuoni „Wormhole“ procesoriai iš tikrųjų gali užtikrinti vieno H300 našumą, tačiau jų TDP yra atitinkamai 600 W ir 1200 W.
Be kortelių, „Tenstorrent“ siūlo kūrėjams iš anksto sukurtas darbo vietas, įskaitant 4 n300 korteles pigesniame „Xeon“ pagrindu sukurtame „TT-LoudBox“ su aktyviu aušinimu ir pažangią „TT-QuietBox“ su EPYC pagrindu veikiančia „Xiaolong“ skysčio aušinimo funkcija).
Paskelbimo laikas: 2024-07-29