បដាករណី

ព័ត៌មានឧស្សាហកម្ម៖ លោក Jim Keller បានចាប់ផ្តើមបន្ទះឈីប RISC-V ថ្មី។

ព័ត៌មានឧស្សាហកម្ម៖ លោក Jim Keller បានចាប់ផ្តើមបន្ទះឈីប RISC-V ថ្មី។

ក្រុមហ៊ុនបន្ទះឈីបដែលដឹកនាំដោយលោក Jim Keller Tenstorrent បានបញ្ចេញប្រព័ន្ធដំណើរការ Wormhole ជំនាន់ក្រោយរបស់ខ្លួនសម្រាប់បន្ទុកការងារ AI ដែលវារំពឹងថានឹងផ្តល់នូវដំណើរការល្អក្នុងតម្លៃសមរម្យ។បច្ចុប្បន្នក្រុមហ៊ុនផ្តល់ជូននូវកាត PCIe ពីរបន្ថែមទៀតដែលអាចផ្ទុកដំណើរការ Wormhole មួយឬពីរ ក៏ដូចជាស្ថានីយការងារ TT-LoudBox និង TT-QuietBox សម្រាប់អ្នកអភិវឌ្ឍន៍កម្មវិធី។ រាល់ការប្រកាសនៅថ្ងៃនេះគឺសំដៅលើអ្នកអភិវឌ្ឍន៍ មិនមែនអ្នកដែលប្រើបន្ទះ Wormhole សម្រាប់បន្ទុកការងារពាណិជ្ជកម្មនោះទេ។

“វាតែងតែរីករាយក្នុងការទទួលបានផលិតផលរបស់យើងកាន់តែច្រើនទៅក្នុងដៃអ្នកអភិវឌ្ឍន៍។ ការចេញផ្សាយប្រព័ន្ធអភិវឌ្ឍន៍ដោយប្រើកាត Wormhole™ របស់យើងអាចជួយអ្នកអភិវឌ្ឍន៍ទំហំ និងបង្កើតកម្មវិធី AI ច្រើនបន្ទះឈីប" លោក Jim Keller នាយកប្រតិបត្តិនៃ Tenstorrent បាននិយាយ។បន្ថែមពីលើការបើកដំណើរការនេះ យើងពិតជារំភើបណាស់ដែលឃើញការរីកចំរើនដែលយើងកំពុងធ្វើជាមួយនឹងការចាក់ផ្សាយ និងការបង្កើនថាមពលនៃផលិតផល Blackhole ជំនាន់ទីពីររបស់យើង»។

១

ខួរក្បាល Wormhole នីមួយៗមាន 72 Tensix cores (ប្រាំដែលគាំទ្រ RISC-V cores ក្នុងទម្រង់ទិន្នន័យផ្សេងៗ) និង 108 MB នៃ SRAM ដែលផ្តល់ 262 FP8 TFLOPS នៅ 1 GHz ជាមួយនឹងថាមពលរចនាកម្ដៅ 160W ។ កាត Wormhole n150 បន្ទះឈីបតែមួយត្រូវបានបំពាក់ដោយអង្គចងចាំវីដេអូ 12 GB GDDR6 និងមានកម្រិតបញ្ជូន 288 GB/s ។

ឧបករណ៍ដំណើរការ Wormhole ផ្តល់នូវភាពបត់បែនដែលអាចបត់បែនបាន ដើម្បីបំពេញតម្រូវការចម្រុះនៃបន្ទុកការងារ។ នៅក្នុងការដំឡើងស្ថានីយការងារស្តង់ដារជាមួយនឹងកាត Wormhole n300 ចំនួនបួន អង្គដំណើរការអាចត្រូវបានរួមបញ្ចូលគ្នាទៅជាឯកតាតែមួយដែលលេចឡើងក្នុងកម្មវិធីជាបណ្តាញស្នូល Tensix ដ៏ទូលំទូលាយ។ ការកំណត់រចនាសម្ព័ន្ធនេះអនុញ្ញាតឱ្យឧបករណ៍បង្កើនល្បឿនគ្រប់គ្រងបន្ទុកការងារដូចគ្នា បំបែករវាងអ្នកអភិវឌ្ឍន៍បួននាក់ ឬដំណើរការរហូតដល់ប្រាំបីម៉ូដែល AI ផ្សេងគ្នាក្នុងពេលដំណាលគ្នា។ លក្ខណៈសំខាន់នៃសមត្ថភាពធ្វើមាត្រដ្ឋាននេះគឺថាវាអាចដំណើរការក្នុងមូលដ្ឋានដោយមិនចាំបាច់មាននិម្មិត។ នៅក្នុងបរិយាកាសមជ្ឈមណ្ឌលទិន្នន័យ ឧបករណ៍ដំណើរការ Wormhole នឹងប្រើ PCIe សម្រាប់ពង្រីកខាងក្នុងម៉ាស៊ីន ឬ Ethernet សម្រាប់ពង្រីកខាងក្រៅ។

នៅក្នុងលក្ខខណ្ឌនៃដំណើរការ កាត Wormhole n150 បន្ទះឈីបតែមួយរបស់ Tenstorrent (72 Tensix cores, 1 GHz frequency, 108 MB SRAM, 12 GB GDDR6, 288 GB/s bandwidth) សម្រេចបាន 262 FP8 TFLOPS នៅ 160W ខណៈពេលដែលបន្ទះក្តារពីរប្រភេទ Wormhole-000 (128 Tensix cores, 1 GHz frequency, 192 MB SRAM, aggregated 24 GB GDDR6, 576 GB/s bandwidth) ផ្តល់រហូតដល់ 466 FP8 TFLOPS នៅ 300W ។

ដើម្បីដាក់ 300W នៃ 466 FP8 TFLOPS ទៅក្នុងបរិបទ យើងនឹងប្រៀបធៀបវាទៅនឹងអ្វីដែលអ្នកដឹកនាំទីផ្សារ AI ដែល Nvidia កំពុងផ្តល់ជូននៅថាមពលនៃការរចនាកម្ដៅនេះ។ A100 របស់ Nvidia មិនគាំទ្រ FP8 ទេ ប៉ុន្តែវាគាំទ្រ INT8 ជាមួយនឹងដំណើរការខ្ពស់បំផុតនៃ 624 TOPS (1,248 TOPS នៅពេលតូច) ។ នៅក្នុងការប្រៀបធៀប H100 របស់ Nvidia គាំទ្រ FP8 និងឈានដល់ដំណើរការខ្ពស់បំផុតនៃ 1,670 TFLOPS នៅ 300W (3,341 TFLOPS នៅតូច) ដែលខុសពី Tenstorrent's Wormhole n300 ។

ទោះយ៉ាងណាក៏ដោយមានបញ្ហាធំមួយ។ Wormhole n150 របស់ Tenstorrent លក់ក្នុងតម្លៃ 999 ដុល្លារ ខណៈពេលដែល n300 លក់ក្នុងតម្លៃ 1,399 ដុល្លារ។ តាមការប្រៀបធៀប កាតក្រាហ្វិក Nvidia H100 តែមួយមានតម្លៃ 30,000 ដុល្លារ អាស្រ័យលើបរិមាណ។ ជាការពិតណាស់ យើងមិនដឹងថា តើប្រព័ន្ធដំណើរការ Wormhole បួន ឬប្រាំបី ពិតជាអាចផ្តល់នូវដំណើរការនៃ H300 តែមួយបានដែរឬទេ ប៉ុន្តែ TDPs របស់ពួកគេគឺ 600W និង 1200W រៀងគ្នា។

បន្ថែមពីលើសន្លឹកបៀ Tenstorrent ផ្តល់នូវស្ថានីយការងារដែលបានសាងសង់ជាមុនសម្រាប់អ្នកអភិវឌ្ឍន៍ រួមទាំងកាត 4 n300 នៅក្នុង TT-LoudBox ដែលមានតម្លៃសមរម្យជាង Xeon ជាមួយនឹងភាពត្រជាក់សកម្ម និង TT-QuietBox កម្រិតខ្ពស់ជាមួយនឹងមុខងារ Xiaolong ដែលមានមូលដ្ឋានលើ EPYC) ។


ពេលវេលាបង្ហោះ៖ ថ្ងៃទី២៩ ខែកក្កដា ឆ្នាំ២០២៤