Xlera8

Google AI hesaplama düğümleri için seçilen SiFive RISC-V çekirdeği

RISC-V chip biz SiFive, işlemcilerinin Google veri merkezlerinde bir dereceye kadar AI iş yüklerini yönetmek için kullanıldığını söylüyor.

SiFive'a göre, söz konusu işlemci onun Zekası X280, veri merkezindeki AI/ML uygulamaları için optimize edilmiş vektör uzantılarına sahip çok çekirdekli bir RISC-V tasarımı. Google'ın Tensör İşleme Birimlerinden kaldırılan matris çarpma birimleri (MXU) ile birleştirildiğinde (TPU'lar), bunun makine öğrenimi iş yüklerini programlamak için daha fazla esneklik sağladığı iddia ediliyor.

Esasen, X280'in işlemci çalıştırma kodundaki genel amaçlı RV64 çekirdekleri, cihazı yönetir ve işleri tamamlamak için gerektiği gibi makine öğrenimi hesaplamalarını Google'ın MXU'larına besler. X280, hızlandırıcı birimlerin yapamayacağı işlemleri gerçekleştirebilen kendi vektör matematik birimini de içerir.

SiFive ve Google, bunun tam olarak nasıl paketlendiği ve kullanıldığı konusunda belki ticari nedenlerle biraz çekingen davrandılar, ancak bize sanki Google özel hızlandırma birimlerini çip üzerinde çok çekirdekli bir X280 sistemine yerleştirmiş gibi görünüyor. Google tarafından tasarlanan MXU, doğrudan RISC-V çekirdek kompleksine bloklar. Bu çipler, makine öğrenimi çalışmalarını hızlandırmak için Google'ın veri merkezlerinde, SiFive'a göre “AI hesaplama ana bilgisayarlarında” kullanılır.

Bunlar üretimde kullanılıyorsa, bu çiplerin hizmetler içindeki görevleri yerine getirdiğini hayal ediyoruz. Bu donanımı, geleneksel x86, Arm, TPU ve GPU teknolojisiyle desteklenen AI için optimize edilmiş sanal makineler sunan Google Cloud'da doğrudan kiralayamayacağınızı unutmayın.

Ayrıntılar, bu ayın başlarında SiFive kurucu ortağı ve baş mimar Krste Asanović ve Google TPU Mimarı Cliff Young tarafından yapılan bir konuşmada Silikon Vadisi'ndeki Yapay Zeka Donanım Zirvesi'nde açıklandı. SiFive blog yazısı bu hafta.

SiFive'a göre, X280'in piyasaya sürülmesinin ardından bazı müşterilerin, hızlandırıcının gerçekleştirmek üzere tasarlanmamış olduğu tüm temizlik ve genel amaçlı işleme görevlerini yerine getirmek için bir hızlandırıcının yanında yardımcı bir çekirdek olarak kullanmaya başladığını fark etti.

Pek çoğu, hızlandırıcıyı yönetmek için tam özellikli bir yazılım yığınına ihtiyaç olduğunu keşfetti ve müşteriler, büyük hızlandırıcılarının yanında bir X280 çekirdek kompleksi ile bunu çözebileceklerini fark ettiler; RISC-V CPU çekirdekleri tüm bakım ve işlem kodu, büyük hızlandırıcının yapamayacağı matematik işlemleri gerçekleştirme ve diğer çeşitli işlevleri sağlama. Esasen, X280, hızlandırıcı için bir tür yönetim düğümü olarak hizmet edebilir.

SiFive bundan yararlanmak için Google gibi müşterilerle çalışarak, müşterilerin bir hızlandırıcıyı doğrudan X280'in vektör kayıt dosyasına sıkı bir şekilde bağlamasına olanak tanıyarak artan performans ve daha fazla veri sağlayan Vektör Yardımcı İşlemci Arayüzü eXtension (VCIX) adını verdiği şeyi geliştirdi. Bant genişliği.

Asanović'e göre bunun faydası, müşterilerin RISC-V ekosistemine kendi yardımcı işlemcilerini getirebilmeleri ve Linux'u tam sanal bellek ve önbellek uyumlu desteği ile başlatma yeteneği ile eksiksiz bir yazılım yığını ve programlama ortamı çalıştırabilmeleridir. genel amaçlı CPU çekirdekleri ve hızlandırma birimlerinin karışımı.

Google'ın bakış açısından, TPU teknolojileri ailesini geliştirmeye odaklanmak ve sıfırdan kendi uygulama işlemcisini oluşturmak için zaman kaybetmemek istedi ve bu nedenle bu hızlandırma işlevlerini hazır bir genel amaçlı işlemci ile eşleştirmek doğru yol gibi görünüyordu. Young'a göre gitmek.

VCIX, temel olarak MXU'ları düşük gecikmeyle RISC-V çekirdeklerine yapıştırır ve bellek, önbellek veya PCIe aracılığıyla CPU ve hızlandırma birimi arasında veri aktarımı için bekleyen birçok döngü harcama ihtiyacını atlar. Bunun yerine, bize bunun vektör kayıt erişimi yoluyla sadece onlarca döngü olduğu söylendi. Bu aynı zamanda her şeyin - RISC-V CPU kompleksi ve özel hızlandırıcıların - çip üzerinde sistem olarak paketlenmiş aynı kalıpta olduğunu gösteriyor.

Uygulama kodu, genel amaçlı RISC-V çekirdekleri üzerinde çalışır ve MXU tarafından hızlandırılabilen herhangi bir çalışma VCIX aracılığıyla aktarılır. Young'a göre, bu yaklaşımın verimliliğin yanı sıra başka avantajları da var. Programlama modeli basitleştirilmiştir, bu da skaler, vektör ve yardımcı işlemci talimatlarının araya eklendiği tek bir programla sonuçlanır ve geliştiricilerin tercih edildiği gibi C/C++ veya assembler ile kodlayabileceği tek bir yazılım araç zincirine izin verir.

“Google MXU'larla 'hibritleştirilmiş' SiFive VCIX tabanlı genel amaçlı çekirdeklerle, MXU'nun tüm performansından ve genel Young, X280 işlemcinin vektör performansının yanı sıra CPU'yu da etkiledi.

Bunun gibi özel bir çip yapma yeteneği, Google gibi hiper ölçekleyicilerin veya niş gereksinimleri ve derin cepleri olanların etki alanı olarak kalmaya devam edecek, ancak açık ekosistem RISC-V modelinin esnekliği sayesinde neler başarılabileceğini gösteriyor. .

Bu esneklik ve açıklık, diğer bazı ürünlerinde kullanılan RV çekirdekleri ile RISC-V'nin uzun süredir destekçisi olan Google'ı, özel yardımcı işlemcilerini x86 yongalarına veya Arm'a dönüştürmek yerine yeni başlayan mimariyi kullanmaya çekmek için yeterli görünüyor. -lisanslı tasarımlar. ®

Not: Google'ın ne zaman olduğunu hatırla oynuyor veri merkezlerinde POWER CPU mimarisini kullanarak mı?

Bizimle sohbet

Merhaba! Size nasıl yardım edebilirim?