تراشه RISC-V biz SiFive میگوید که پردازندههای آن برای مدیریت بارهای کاری هوش مصنوعی تا حدی در مراکز داده گوگل استفاده میشوند.
طبق گفته SiFive، پردازنده مورد بحث Intelligence آن است X280، یک طراحی چند هسته ای RISC-V با پسوندهای برداری، بهینه سازی شده برای برنامه های AI/ML در مرکز داده. هنگامی که با واحدهای ضرب ماتریس (MXU) از واحدهای پردازش تانسور Google ترکیب می شود (TPU ها، ادعا می شود که این انعطاف پذیری بیشتری را برای برنامه نویسی بارهای کاری یادگیری ماشین ارائه می دهد.
اساساً، هستههای RV280 همه منظوره X64 در پردازنده کد اجرا میکنند که دستگاه را مدیریت میکند و محاسبات یادگیری ماشینی را در صورت نیاز برای تکمیل کارها به MXUهای Google تغذیه میکند. X280 همچنین شامل واحد ریاضی برداری خود است که می تواند عملیاتی را انجام دهد که واحدهای شتاب دهنده نمی توانند.
SiFive و Google، شاید به دلایل تجاری، در مورد نحوه بسته بندی و استفاده دقیق از آن کمی خجالت زده بودند، اگرچه به نظر ما به نظر می رسد که گوگل واحدهای شتاب سفارشی خود را در یک سیستم چند هسته ای X280 روی تراشه قرار داده است، و MXU طراحی شده توسط گوگل مستقیماً به مجموعه هسته RISC-V مسدود می شود. طبق گفته SiFive، این تراشهها در مراکز داده گوگل، در «میزبانهای محاسباتی هوش مصنوعی» برای سرعت بخشیدن به کار یادگیری ماشینی استفاده میشوند.
ما تصور می کنیم که اگر این تراشه ها در تولید استفاده شوند، این تراشه ها وظایفی را در خدمات انجام می دهند. توجه داریم که نمیتوانید این سختافزار را مستقیماً در Google Cloud کرایه کنید، زیرا ماشینهای مجازی بهینهشده با هوش مصنوعی مجهز به فناوریهای x86، Arm، TPU و GPU سنتی را ارائه میدهد.
جزئیات در نشست سختافزار هوش مصنوعی در سیلیکون ولی در اوایل این ماه، در صحبتهای کرسته آسانوویچ، بنیانگذار و معمار ارشد SiFive و کلیف یانگ معمار Google TPU، افشا شد. پست وبلاگ SiFive این هفته است.
به گفته SiFive، متوجه شد که پس از معرفی X280، برخی از مشتریان شروع به استفاده از آن به عنوان یک هسته همراه در کنار یک شتاب دهنده کردند تا بتوانند تمام کارهای خانه داری و پردازش همه منظوره را که شتاب دهنده برای انجام آنها طراحی نشده بود، انجام دهند.
تراشهبیز میگوید، بسیاری دریافتند که برای مدیریت شتابدهنده به یک پشته نرمافزاری با امکانات کامل نیاز است، و مشتریان متوجه شدند که میتوانند این مشکل را با یک مجتمع هستهای X280 در کنار شتابدهنده بزرگ خود حل کنند، هستههای CPU RISC-V که تمام امور نگهداری و تعمیرات را انجام میدهند. کد عملیات، انجام عملیات ریاضی که شتاب دهنده بزرگ نمی تواند، و ارائه توابع مختلف دیگر. در اصل، X280 می تواند به عنوان نوعی گره مدیریتی برای شتاب دهنده عمل کند.
برای بهرهبرداری از این موضوع، SiFive با مشتریانی مانند Google کار کرد تا آنچه را که Vector Coprocessor Interface Extension (VCIX) مینامد توسعه دهد، که به مشتریان اجازه میدهد مستقیماً یک شتابدهنده را مستقیماً به فایل ثبت برداری X280 پیوند دهند و عملکرد و دادههای بیشتری را ارائه دهند. پهنای باند
به گفته آسانوویچ، مزیت این کار این است که مشتریان می توانند پردازنده مشترک خود را به اکوسیستم RISC-V بیاورند و یک پشته نرم افزاری کامل و محیط برنامه نویسی را با قابلیت راه اندازی لینوکس با حافظه مجازی کامل و پشتیبانی منسجم کش، روی تراشه ای که حاوی ترکیبی از هسته های CPU همه منظوره و واحدهای شتاب.
از دیدگاه گوگل، این شرکت میخواست بر روی بهبود خانواده فناوریهای TPU تمرکز کند و زمان خود را برای ساختن پردازنده برنامههای کاربردی خود از ابتدا تلف نکند، بنابراین جفت کردن این عملکردهای شتاب با یک پردازنده همه منظوره آماده راه درستی به نظر میرسید. به گفته یانگ رفتن.
VCIX اساساً MXUها را به هستههای RISC-V با تأخیر کم میچسباند و نیاز به صرف چرخههای زیادی را در انتظار انتقال دادهها بین CPU و واحد شتاب از طریق حافظه، حافظه پنهان یا PCIe نادیده میگیرد. در عوض، به ما گفته می شود، این فقط ده ها چرخه از طریق دسترسی ثبت برداری است. این همچنین نشان میدهد که همه چیز - مجتمع RISC-V CPU و شتابدهندههای سفارشی - همگی روی یک قالب هستند و به عنوان یک سیستم روی تراشه بستهبندی شدهاند.
کد برنامه روی هسته های همه منظوره RISC-V اجرا می شود و هر کاری که می تواند توسط MXU تسریع شود از طریق VCIX منتقل می شود. به گفته یانگ، این رویکرد علاوه بر کارایی، مزایای دیگری نیز دارد. مدل برنامه نویسی ساده شده است و منجر به ایجاد یک برنامه واحد با دستورات اسکالر، برداری و کمک پردازشگر می شود و به یک زنجیره ابزار نرم افزاری اجازه می دهد که در آن توسعه دهندگان می توانند به صورت ترجیحی در C/C++ یا اسمبلر کدنویسی کنند.
با هستههای هدف عمومی مبتنی بر SiFive VCIX که با MXUهای Google ترکیب شدهاند، میتوانید ماشینی بسازید که به شما امکان میدهد کیک خود را بخورید و آن را هم بخورید، و از تمام عملکرد MXU و قابلیت برنامهریزی یک دستگاه کلی بهره ببرید. یانگ گفت: CPU و همچنین عملکرد برداری پردازنده X280.
توانایی ساخت یک تراشه سفارشی مانند این احتمالاً در حوزه ابر مقیاسکنندههایی مانند گوگل یا آنهایی که نیازمندیهای خاص و جیبهای عمیق هستند باقی میماند، اما نشان میدهد که به لطف انعطافپذیری مدل اکوسیستم باز RISC-V چه چیزی میتوان به دست آورد. .
به نظر میرسد که این انعطافپذیری و گشودگی برای فریب دادن گوگل -یکی از حامیان دیرینه RISC-V، با هستههای RV مورد استفاده در برخی از محصولات دیگرش- کافی باشد تا از معماری جدید استفاده کند، نه اینکه پردازندههای سفارشی خود را به تراشههای x86 یا Arm تبدیل کند. -طرح های دارای مجوز ®
PS: به یاد داشته باشید زمانی که گوگل بود toying با استفاده از معماری POWER CPU در دیتاسنترهای خود؟