Xlera8

SiFive هسته RISC-V برای گره های محاسباتی هوش مصنوعی گوگل انتخاب شده است

تراشه RISC-V biz SiFive می‌گوید که پردازنده‌های آن برای مدیریت بارهای کاری هوش مصنوعی تا حدی در مراکز داده گوگل استفاده می‌شوند.

طبق گفته SiFive، پردازنده مورد بحث Intelligence آن است X280، یک طراحی چند هسته ای RISC-V با پسوندهای برداری، بهینه سازی شده برای برنامه های AI/ML در مرکز داده. هنگامی که با واحدهای ضرب ماتریس (MXU) از واحدهای پردازش تانسور Google ترکیب می شود (TPU ها، ادعا می شود که این انعطاف پذیری بیشتری را برای برنامه نویسی بارهای کاری یادگیری ماشین ارائه می دهد.

اساساً، هسته‌های RV280 همه منظوره X64 در پردازنده کد اجرا می‌کنند که دستگاه را مدیریت می‌کند و محاسبات یادگیری ماشینی را در صورت نیاز برای تکمیل کارها به MXUهای Google تغذیه می‌کند. X280 همچنین شامل واحد ریاضی برداری خود است که می تواند عملیاتی را انجام دهد که واحدهای شتاب دهنده نمی توانند.

SiFive و Google، شاید به دلایل تجاری، در مورد نحوه بسته بندی و استفاده دقیق از آن کمی خجالت زده بودند، اگرچه به نظر ما به نظر می رسد که گوگل واحدهای شتاب سفارشی خود را در یک سیستم چند هسته ای X280 روی تراشه قرار داده است، و MXU طراحی شده توسط گوگل مستقیماً به مجموعه هسته RISC-V مسدود می شود. طبق گفته SiFive، این تراشه‌ها در مراکز داده گوگل، در «میزبان‌های محاسباتی هوش مصنوعی» برای سرعت بخشیدن به کار یادگیری ماشینی استفاده می‌شوند.

ما تصور می کنیم که اگر این تراشه ها در تولید استفاده شوند، این تراشه ها وظایفی را در خدمات انجام می دهند. توجه داریم که نمی‌توانید این سخت‌افزار را مستقیماً در Google Cloud کرایه کنید، زیرا ماشین‌های مجازی بهینه‌شده با هوش مصنوعی مجهز به فناوری‌های x86، Arm، TPU و GPU سنتی را ارائه می‌دهد.

جزئیات در نشست سخت‌افزار هوش مصنوعی در سیلیکون ولی در اوایل این ماه، در صحبت‌های کرسته آسانوویچ، بنیانگذار و معمار ارشد SiFive و کلیف یانگ معمار Google TPU، افشا شد. پست وبلاگ SiFive این هفته است.

به گفته SiFive، متوجه شد که پس از معرفی X280، برخی از مشتریان شروع به استفاده از آن به عنوان یک هسته همراه در کنار یک شتاب دهنده کردند تا بتوانند تمام کارهای خانه داری و پردازش همه منظوره را که شتاب دهنده برای انجام آنها طراحی نشده بود، انجام دهند.

تراشه‌بیز می‌گوید، بسیاری دریافتند که برای مدیریت شتاب‌دهنده به یک پشته نرم‌افزاری با امکانات کامل نیاز است، و مشتریان متوجه شدند که می‌توانند این مشکل را با یک مجتمع هسته‌ای X280 در کنار شتاب‌دهنده بزرگ خود حل کنند، هسته‌های CPU RISC-V که تمام امور نگهداری و تعمیرات را انجام می‌دهند. کد عملیات، انجام عملیات ریاضی که شتاب دهنده بزرگ نمی تواند، و ارائه توابع مختلف دیگر. در اصل، X280 می تواند به عنوان نوعی گره مدیریتی برای شتاب دهنده عمل کند.

برای بهره‌برداری از این موضوع، SiFive با مشتریانی مانند Google کار کرد تا آنچه را که Vector Coprocessor Interface Extension (VCIX) می‌نامد توسعه دهد، که به مشتریان اجازه می‌دهد مستقیماً یک شتاب‌دهنده را مستقیماً به فایل ثبت برداری X280 پیوند دهند و عملکرد و داده‌های بیشتری را ارائه دهند. پهنای باند

به گفته آسانوویچ، مزیت این کار این است که مشتریان می توانند پردازنده مشترک خود را به اکوسیستم RISC-V بیاورند و یک پشته نرم افزاری کامل و محیط برنامه نویسی را با قابلیت راه اندازی لینوکس با حافظه مجازی کامل و پشتیبانی منسجم کش، روی تراشه ای که حاوی ترکیبی از هسته های CPU همه منظوره و واحدهای شتاب.

از دیدگاه گوگل، این شرکت می‌خواست بر روی بهبود خانواده فناوری‌های TPU تمرکز کند و زمان خود را برای ساختن پردازنده برنامه‌های کاربردی خود از ابتدا تلف نکند، بنابراین جفت کردن این عملکردهای شتاب با یک پردازنده همه منظوره آماده راه درستی به نظر می‌رسید. به گفته یانگ رفتن.

VCIX اساساً MXUها را به هسته‌های RISC-V با تأخیر کم می‌چسباند و نیاز به صرف چرخه‌های زیادی را در انتظار انتقال داده‌ها بین CPU و واحد شتاب از طریق حافظه، حافظه پنهان یا PCIe نادیده می‌گیرد. در عوض، به ما گفته می شود، این فقط ده ها چرخه از طریق دسترسی ثبت برداری است. این همچنین نشان می‌دهد که همه چیز - مجتمع RISC-V CPU و شتاب‌دهنده‌های سفارشی - همگی روی یک قالب هستند و به عنوان یک سیستم روی تراشه بسته‌بندی شده‌اند.

کد برنامه روی هسته های همه منظوره RISC-V اجرا می شود و هر کاری که می تواند توسط MXU تسریع شود از طریق VCIX منتقل می شود. به گفته یانگ، این رویکرد علاوه بر کارایی، مزایای دیگری نیز دارد. مدل برنامه نویسی ساده شده است و منجر به ایجاد یک برنامه واحد با دستورات اسکالر، برداری و کمک پردازشگر می شود و به یک زنجیره ابزار نرم افزاری اجازه می دهد که در آن توسعه دهندگان می توانند به صورت ترجیحی در C/C++ یا اسمبلر کدنویسی کنند.

با هسته‌های هدف عمومی مبتنی بر SiFive VCIX که با MXUهای Google ترکیب شده‌اند، می‌توانید ماشینی بسازید که به شما امکان می‌دهد کیک خود را بخورید و آن را هم بخورید، و از تمام عملکرد MXU و قابلیت برنامه‌ریزی یک دستگاه کلی بهره ببرید. یانگ گفت: CPU و همچنین عملکرد برداری پردازنده X280.

توانایی ساخت یک تراشه سفارشی مانند این احتمالاً در حوزه ابر مقیاس‌کننده‌هایی مانند گوگل یا آنهایی که نیازمندی‌های خاص و جیب‌های عمیق هستند باقی می‌ماند، اما نشان می‌دهد که به لطف انعطاف‌پذیری مدل اکوسیستم باز RISC-V چه چیزی می‌توان به دست آورد. .

به نظر می‌رسد که این انعطاف‌پذیری و گشودگی برای فریب دادن گوگل -یکی از حامیان دیرینه RISC-V، با هسته‌های RV مورد استفاده در برخی از محصولات دیگرش- کافی باشد تا از معماری جدید استفاده کند، نه اینکه پردازنده‌های سفارشی خود را به تراشه‌های x86 یا Arm تبدیل کند. -طرح های دارای مجوز ®

PS: به یاد داشته باشید زمانی که گوگل بود toying با استفاده از معماری POWER CPU در دیتاسنترهای خود؟

چت با ما

سلام! چگونه می توانم به شما کمک کنم؟