Microsoft, Phi-3 Mini ile yapay zekayı cep boyutuna küçültüyor

Zaman Damgası: 23 Nisan 2024 11: 01 AM
Kaynak Düğümü: 2735513

Plato tarafından yeniden yayınlandı

Microsoft, hafif Phi-3 Mini AI modelinin en son versiyonunun, bir telefona kurulabilecek kadar küçük olmasına rağmen GPT-3.5 gibi rakiplerle rekabet ettiğini iddia ediyor.

Phi-3 Mini, 3.8 trilyon token üzerinde eğitilmiş 3.3 milyar parametreli bir dil modelidir. Bu rakam, Microsoft'un belirlediği 2.7 milyar Phi-2 parametresinden yüksektir. tanıttı Aralık 2023 içinde.

Eğitim modellerine mümkün olduğu kadar çok şey katmak yerine, akıl yürütmeye odaklanıldı. Microsoft şunları söyledi: "Örneğin, Premier Lig'de belirli bir günde oynanan bir maçın sonucu, ileri seviye modeller için iyi bir antrenman verisi olabilir, ancak mini boyutlu modeller için 'akıl yürütme' için daha fazla model kapasitesi bırakmak amacıyla bu tür bilgileri kaldırmamız gerekiyor. .”

Hedeflenen yaklaşım, Phi-3'ün rakipleri kadar geniş bir bilgi birikimine sahip olmasa da, konu muhakeme söz konusu olduğunda en azından onlar kadar iyi olduğu anlamına geliyor; Microsoft bunu iddia ediyor. İçinde Araştırma kağıdı [PDF] Microsoft, bunun küçük dil modelinin "yalnızca 3.5 milyar toplam parametreyle (örneğin Mixtral'da 3.8 milyar toplam parametre varken) GPT-45 veya Mixtral gibi son derece yetenekli modellerin düzeyine ulaşmasına" olanak tanıdığını belirtiyor.

Araştırma ayrıca, kullanılan eğitim verilerinin "çeşitli açık internet kaynaklarından yoğun şekilde filtrelenmiş web verileri" ve LLM tarafından oluşturulan verilerden oluştuğunu belirtiyor. Yüksek Lisans'ları eğitmek için kullanılan veri kaynakları birkaç dava.

Bize Phi-3 Mini'nin küçük boyutunun akıllı telefonda çevrimdışı çalışabileceği anlamına geldiği söylendi. Araştırmacılar, bunun yaklaşık 1.8 GB bellek kaplayacak şekilde yapılabileceğini söyledi ve bunu bir cihazda yerel olarak çalışan A14 Bionic çipli bir iPhone 16 üzerinde çevrimdışı olarak denedi. Makalede araştırmacılar, Phi-3 Mini'nin şiir yazdığını ve Houston'da yapılacak şeyleri önerdiğini gösteren ekran görüntülerini gösteriyor.

Araştırmacılar ayrıca dili anlama ve akıl yürütmeye odaklanmanın doğasında olan olumsuzlukları da vurguluyor. "Modelin çok fazla 'olgusal bilgi' depolama kapasitesi yok", bu da bir arama motoruyla güçlendirilerek bir dereceye kadar hafifletilebilir. Ancak bu, onu çevrimdışı çalıştırabilmenin amacını ortadan kaldırır.

Dil şu anda çoğunlukla İngilizce ile sınırlıdır ve çoğu LLM'nin doğasında olan halüsinasyonlar, önyargının güçlendirilmesi ve uygunsuz içerik üretimi gibi sorunlar Phi-3 Mini'de de bulunabilir.

Araştırmacılar makalede şunları söylüyor: "Bu zorlukları tam olarak ele almak için önümüzde önemli çalışmalar var."

Göreceli olarak daha büyük modeller de sırasıyla 3 ve 3 milyar parametreli Phi-7 Small ve Phi-14 Medium şeklinde duyuruldu.

Victor Botev, CTO ve kurucu ortak iris.ai, bize şunları söyledi: “Microsoft'un Phi-3 modelini duyurması, yapay zeka gelişiminde devam eden bir eğilimi temsil ediyor. Microsoft, giderek daha büyük modelleri kovalamak yerine, daha dikkatli bir şekilde seçilmiş veriler ve özel eğitim içeren araçlar geliştiriyor. Bu, trilyonlarca parametreye sahip modellerin devasa hesaplama maliyetleri olmadan gelişmiş performans ve muhakeme yeteneklerine olanak tanır. Bu sözün yerine getirilmesi, yapay zeka çözümleri arayan işletmeler için büyük bir benimseme engelinin ortadan kaldırılması anlamına gelecektir.

“Microsoft akıllıca 'daha büyük olan daha iyidir' zihniyetinin ötesine bakıyor. Yaygın iş ve tüketici yapay zeka uygulamaları için fizibilite ve spesifiklik, büyük parametre sayılarından daha önemlidir. Phi-3 gibi modeller, doğru veri ve eğitim yaklaşımıyla gelişmiş yapay zeka yeteneklerinin daha büyük modeller oluşturmayı gerektirmediğini açıkça gösteriyor; bu, maliyet-kalite oranının kritik olduğu işletmeler için karar verici bir faktör." ®

SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
Kaynak: https://go.theregister.com/feed/www.theregister.com/2024/04/23/microsoft_phi_3_mini/

Etiketler: 1, 14, 2023, 7, 8, a, yeteneklerini, yapabilmek, adres, Benimseme, ileri, önde, AI, AI uygulamaları, Yapay Zeka Yetenekleri, ai geliştirme, AI modeli, izin, veriyor, Ayrıca, Amplifikasyon, an, ve, açıkladı, duyuru, uygulamaları, yaklaşım, yaklaşık olarak, ARE, AS, At, bariyer, BE, Bulunan, olmuştur, olmak, daha iyi, Ötesinde, önyargı, büyük, Milyar, biyonik, genişlik, bina, iş, işletmeler, Fakat, by, CAN, yetenekleri, yetenekli, Kapasite, dikkatlice, belli, zorluklar, takip, yonga, iddia, Açıkça, CO, Kurucu, geliyor, rakipler, Hesaplamalı, oluşan, tüketici, içerik, devam eden, Ücret, maliyetler, olabilir, Sayımlar, kritik, CTO, küratörlüğünü, veri, Veri kaynakları, gün, Aralık, Aralık 2023, karar, göstermek, konuşlandırılmış, gelişen, gelişme, cihaz, Mı, aşağı, olumsuzlukları, motor, İngilizce, yeterli, hiç, örnek, kapsam, faktör, gerçek, fizibilite, şekil, süzülmüş, odak, odaklanma, İçin, örneğin, Airdrop Formu, bulundu, kurucu, itibaren, Sınır, yerine, tamamen, oyun, oluşturulan, nesil., Tercih Etmenizin, gpt, GPT 3, Var, ağır şekilde, Vurgulamak, büyük ölçüde, Houston, Ancak, Kocaman, if, önemli, Gelişmiş, in, Uygunsuz, bilgi, doğal, Internet, içine, tanıttı, iPhone, iphone 14, Is, IT, ONUN, bilgi, dil, dil modeli, büyük, son, Davalar, Lig, En az, Ayrılmak, seviye, hafif, sevmek, Yüksek Lisans, bakıyor, aramak, Yapılmış, masif, ortalama, anlamına geliyor, orta, bellek, Microsoft, Kuvvet, Mindset, mini, azaltılmış olması, model, modelleri, Daha, çoğu, çoğunlukla, Çok, doğal, gerek, notlar, işgal etmek, of, çevrimdışı, on, bir tek, açık, or, dışarı, kâğıt, parametre, parametreler, belirli, PDF, performans, Telefon, Platon, Plato Veri Zekası, PlatoVeri, cep, nokta, mümkün, Başbakan, Premier League, mevcut, sorunlar, söz, kalite, daha doğrusu, oran, RE, ulaşmak, muhakeme, Nispeten, Kaldır, temsil, gerektirir, araştırma, Araştırmacılar, sırasıyla, kısıtlı, sonuç, Sağ, rakipleri, koşmak, koşu, s, Adı geçen, söylemek, ekran, Ara, arama motoru, birkaç, şov, önemli, sadece, beden, küçük, akıllı telefon, So, Çözümler, bir şey, kaynaklar, Konuşma, özel, özgüllük, mağaza, konu, Böyle, Hedeflenen, göre, o, The, Orada, Bunlar, işler, Re-Tweet, için, Jeton, söyledi, çok, çok fazla, araçlar, Toplam, tren, eğitilmiş, Eğitim, Eğitim verileri, Eğitim Modelleri, akım, denenmiş, trilyon, trilyonlar, Anlamak, up, us, Kullanılmış, Çeşitli, galip, oldu, we, ağ, Ne zaman, nerede, Hangi?, süre, yaygın, akıllıca, ile, olmadan, İş, olur, yazı yazıyor, zefirnet

Kripto İçin Zorlu Haftada Polkadot ve Cosmos Kazanç Kazandı: CoinDesk Endeks Piyasası Güncellemesi

Mayıs 3, 2024

'Daha Fazla Dezavantaj Kalmadı': Yatırımcı Bitcoin'in Döngünün En Derin Geri Dönüşünden Sonra Dibe Yakın Olduğunu Söyledi - The Daily Hodl

Mayıs 3, 2024

Xlera8

Microsoft, Phi-3 Mini ile yapay zekayı cep boyutuna küçültüyor

Plato tarafından yeniden yayınlandı

Kripto İçin Zorlu Haftada Polkadot ve Cosmos Kazanç Kazandı: CoinDesk Endeks Piyasası Güncellemesi

Dünya Çapındaki Hükümetleri DeFi Konusunda Endişelendiren Nedir? – CryptoInfoNet

Analist: Bu Kripto Boğa Koşusu Neden Geçmişe Kadar Yaşayamayabilir?

BDAG'ın Yeni Ödeme Seçenekleri Arbitrum Sahiplerini Mantle'ın Mücadelesinin Ortasına Çekiyor

Bizimle sohbet