បដាករណី

ព័ត៌មានឧស្សាហកម្ម៖ លោក Jim Keller បានដាក់ឱ្យដំណើរការបន្ទះឈីប RISC-V ថ្មីមួយ

ព័ត៌មានឧស្សាហកម្ម៖ លោក Jim Keller បានដាក់ឱ្យដំណើរការបន្ទះឈីប RISC-V ថ្មីមួយ

ក្រុមហ៊ុន​ផលិត​បន្ទះ​ឈីប Tenstorrent ដែល​ដឹកនាំ​ដោយ​លោក Jim Keller បាន​ចេញ​ផ្សាយ​ប្រព័ន្ធ​ដំណើរការ Wormhole ជំនាន់​ក្រោយ​របស់​ខ្លួន​សម្រាប់​បន្ទុក​ការងារ AI ដែល​ខ្លួន​រំពឹង​ថា​នឹង​ផ្តល់​នូវ​ដំណើរការ​ល្អ​ក្នុង​តម្លៃ​សមរម្យ។បច្ចុប្បន្នក្រុមហ៊ុនផ្តល់ជូននូវកាត PCIe ពីរបន្ថែមទៀតដែលអាចផ្ទុកប្រព័ន្ធដំណើរការ Wormhole មួយឬពីរ ក៏ដូចជាស្ថានីយការងារ TT-LoudBox និង TT-QuietBox សម្រាប់អ្នកអភិវឌ្ឍន៍កម្មវិធី។ ការប្រកាសទាំងអស់នៅថ្ងៃនេះគឺសំដៅលើអ្នកអភិវឌ្ឍន៍ មិនមែនអ្នកដែលប្រើប្រាស់ក្តារ Wormhole សម្រាប់បន្ទុកការងារពាណិជ្ជកម្មនោះទេ។

លោក Jim Keller នាយកប្រតិបត្តិក្រុមហ៊ុន Tenstorrent បានមានប្រសាសន៍ថា “វាតែងតែជាការពេញចិត្តក្នុងការនាំយកផលិតផលរបស់យើងកាន់តែច្រើនទៅឱ្យដៃអ្នកអភិវឌ្ឍន៍។ ការចេញផ្សាយប្រព័ន្ធអភិវឌ្ឍន៍ដោយប្រើកាត Wormhole™ របស់យើងអាចជួយអ្នកអភិវឌ្ឍន៍ធ្វើមាត្រដ្ឋាន និងអភិវឌ្ឍកម្មវិធី AI ពហុបន្ទះឈីប”។បន្ថែមពីលើការដាក់ឱ្យដំណើរការនេះ យើងមានការរំភើបរីករាយដែលបានឃើញវឌ្ឍនភាពដែលយើងកំពុងសម្រេចបានជាមួយនឹងការចេញខ្សែអាត់ និងការដំឡើងថាមពលដល់ផលិតផលជំនាន់ទីពីររបស់យើងគឺ Blackhole។

១

ប្រព័ន្ធដំណើរការ Wormhole នីមួយៗមានស្នូល Tensix ចំនួន 72 (ដែលប្រាំគាំទ្រស្នូល RISC-V ក្នុងទម្រង់ទិន្នន័យផ្សេងៗ) និង SRAM ទំហំ 108 MB ដែលផ្តល់ 262 FP8 TFLOPS ក្នុងល្បឿន 1 GHz ជាមួយនឹងថាមពលរចនាកម្ដៅ 160W។ កាត Wormhole n150 ដែលមានបន្ទះឈីបតែមួយត្រូវបានបំពាក់ដោយអង្គចងចាំវីដេអូ GDDR6 ទំហំ 12 GB និងមានកម្រិតបញ្ជូន 288 GB/វិនាទី។

ប្រព័ន្ធដំណើរការ Wormhole ផ្តល់នូវសមត្ថភាពធ្វើមាត្រដ្ឋានដែលអាចបត់បែនបាន ដើម្បីបំពេញតម្រូវការចម្រុះនៃបន្ទុកការងារ។ នៅក្នុងការរៀបចំស្ថានីយការងារស្តង់ដារជាមួយនឹងកាត Wormhole n300 ចំនួនបួន ប្រព័ន្ធដំណើរការអាចត្រូវបានផ្សំទៅជាឯកតាតែមួយ ដែលលេចឡើងនៅក្នុងកម្មវិធីជាបណ្តាញស្នូល Tensix ដ៏ទូលំទូលាយ និងបង្រួបបង្រួម។ ការកំណត់រចនាសម្ព័ន្ធនេះអនុញ្ញាតឱ្យឧបករណ៍បង្កើនល្បឿនដោះស្រាយបន្ទុកការងារដូចគ្នា បំបែករវាងអ្នកអភិវឌ្ឍន៍បួននាក់ ឬដំណើរការម៉ូដែល AI ផ្សេងៗគ្នារហូតដល់ប្រាំបីក្នុងពេលដំណាលគ្នា។ លក្ខណៈពិសេសសំខាន់នៃសមត្ថភាពធ្វើមាត្រដ្ឋាននេះគឺថា វាអាចដំណើរការក្នុងស្រុកដោយមិនចាំបាច់មាននិម្មិតកម្ម។ នៅក្នុងបរិយាកាសមជ្ឈមណ្ឌលទិន្នន័យ ប្រព័ន្ធដំណើរការ Wormhole នឹងប្រើ PCIe សម្រាប់ការពង្រីកនៅខាងក្នុងម៉ាស៊ីន ឬ Ethernet សម្រាប់ការពង្រីកខាងក្រៅ។

ទាក់ទងនឹងដំណើរការ កាត Wormhole n150 ដែលមានបន្ទះឈីបតែមួយរបស់ Tenstorrent (ស្នូល Tensix ចំនួន 72, ប្រេកង់ 1 GHz, SRAM ចំនួន 108 MB, GDDR6 ចំនួន 12 GB, កម្រិតបញ្ជូន 288 GB/s) សម្រេចបាន 262 FP8 TFLOPS នៅកម្លាំង 160W ខណៈដែលបន្ទះ Wormhole n300 ដែលមានបន្ទះឈីបពីរ (ស្នូល Tensix ចំនួន 128, ប្រេកង់ 1 GHz, SRAM ចំនួន 192 MB, GDDR6 ចំនួន 24 GB, កម្រិតបញ្ជូន 576 GB/s) ផ្តល់នូវ FP8 TFLOPS រហូតដល់ 466 នៅកម្លាំង 300W។

ដើម្បីដាក់ 300W នៃ 466 FP8 TFLOPS ទៅក្នុងបរិបទ យើងនឹងប្រៀបធៀបវាទៅនឹងអ្វីដែលក្រុមហ៊ុននាំមុខគេក្នុងទីផ្សារ AI Nvidia កំពុងផ្តល់ជូននៅក្នុងថាមពលរចនាកម្ដៅនេះ។ A100 របស់ Nvidia មិនគាំទ្រ FP8 ទេ ប៉ុន្តែវាគាំទ្រ INT8 ជាមួយនឹងដំណើរការកំពូល 624 TOPS (1,248 TOPS នៅពេលមានកម្រិតទាប)។ បើប្រៀបធៀប Nvidia H100 គាំទ្រ FP8 និងឈានដល់ដំណើរការកំពូល 1,670 TFLOPS នៅ 300W (3,341 TFLOPS នៅពេលមានកម្រិតទាប) ដែលខុសគ្នាយ៉ាងខ្លាំងពី Wormhole n300 របស់ Tenstorrent។

ទោះជាយ៉ាងណាក៏ដោយ មានបញ្ហាធំមួយ។ Wormhole n150 របស់ Tenstorrent មានតម្លៃលក់រាយ 999 ដុល្លារ ខណៈដែល n300 មានតម្លៃ 1,399 ដុល្លារ។ បើប្រៀបធៀប កាតក្រាហ្វិក Nvidia H100 តែមួយមានតម្លៃលក់រាយ 30,000 ដុល្លារ អាស្រ័យលើបរិមាណ។ ជាការពិតណាស់ យើងមិនដឹងថាតើប្រព័ន្ធដំណើរការ Wormhole ចំនួនបួន ឬប្រាំបីពិតជាអាចផ្តល់នូវដំណើរការដូច H300 តែមួយឬអត់នោះទេ ប៉ុន្តែ TDP របស់វាមាន 600W និង 1200W រៀងៗខ្លួន។

បន្ថែមពីលើកាតទាំងនេះ Tenstorrent ផ្តល់ជូននូវស្ថានីយការងារដែលបានបង្កើតជាមុនសម្រាប់អ្នកអភិវឌ្ឍន៍ រួមទាំងកាត n300 ចំនួន 4 នៅក្នុង TT-LoudBox ដែលមានមូលដ្ឋានលើ Xeon ដែលមានតម្លៃសមរម្យជាងជាមួយនឹងការត្រជាក់សកម្ម និង TT-QuietBox កម្រិតខ្ពស់ជាមួយនឹងមុខងារត្រជាក់រាវ Xiaolong ដែលមានមូលដ្ឋានលើ EPYC។


ពេលវេលាបង្ហោះ៖ ថ្ងៃទី ២៩ ខែកក្កដា ឆ្នាំ ២០២៤