Xlera8

Falcon LLM: Açık Kaynaklı LLM'lerin Yeni Kralı – KDnuggets

Falcon LLM: Açık Kaynaklı LLM'lerin Yeni Kralı
Editöre göre resim
 

Her hafta büyük dil modellerinin (LLM'ler) kullanıma sunulduğunu ve kullanmamız için giderek daha fazla sohbet robotunun ortaya çıktığını görüyoruz. Ancak hangisinin en iyisi olduğunu, her birinde ilerleme olduğunu ve hangisinin en faydalı olduğunu anlamak zor olabilir. 

SarılmaYüz LLM'leri yayınlanırken izleyen, değerlendiren ve sıralayan bir Açık LLM Liderlik Tablosu vardır. Üretken dil modellerini farklı değerlendirme görevlerinde test etmek için kullanılan benzersiz bir çerçeve kullanırlar. 

Son zamanlarda, LLaMA (Büyük Dil Modeli Meta AI) skor tablosunun en üstünde yer aldı ve yakın zamanda önceden eğitilmiş yeni bir LLM - Falcon 40B tarafından tahtından indirildi.
 

Falcon LLM: Açık Kaynaklı LLM'lerin Yeni Kralı
Image HuggingFace Open LLM Skor Tablosu

Şahin Yüksek Lisans tarafından kurulmuş ve inşa edilmiştir. Teknoloji İnovasyon Enstitüsü (TII), Abu Dabi Hükümetinin İleri Teknoloji Araştırma Konseyi'nin bir parçası olan bir şirket. Hükümet, bilim insanları, araştırmacılar ve mühendislerden oluşan ekibin bilimde dönüştürücü teknolojiler ve keşifler sunmaya odaklandığı Birleşik Arap Emirlikleri'nin tamamındaki teknoloji araştırmalarını denetlemektedir.

Şahin-40B Bir trilyon token üzerinde eğitim veren, 40B parametreli temel bir LLM'dir. Falcon 40B yalnızca otoregresif kod çözücüye sahip bir modeldir. Yalnızca otoregresif kod çözücü modeli, modelin önceki belirteçlere verilen bir sırayla sonraki belirteci tahmin edecek şekilde eğitildiği anlamına gelir. GPT modeli buna iyi bir örnektir.

Falcon mimarisinin, eğitim bilgi işlem bütçesinin yalnızca %3'i için GPT-75'ten önemli ölçüde daha iyi performans gösterdiği ve yalnızca ? çıkarım anında hesaplamanın.

Yüksek Lisans'ların eğitim verilerinin kalitesi konusunda oldukça hassas olduğunu bildiğimizden, geniş ölçekte veri kalitesi Teknoloji İnovasyon Enstitüsü ekibinin önemli bir odak noktasıydı. Ekip, hızlı işleme için on binlerce CPU çekirdeğine ölçeklenen bir veri hattı oluşturdu ve kapsamlı filtreleme ve veri tekilleştirme kullanarak web'den yüksek kaliteli içerik çıkarmayı başardı.

Ayrıca daha küçük bir versiyonları daha var: Şahin-7B 7B parametresi olan ve 1,500B token üzerinde eğitilmiş. Ayrıca Falcon-40B-Talimat, ve Falcon-7B-Talimat Kullanıma hazır bir sohbet modeli arıyorsanız, mevcut modeller mevcuttur.

Falcon 40B ne yapabilir?

Diğer LLM'lere benzer şekilde Falcon 40B şunları yapabilir:

  • Yaratıcı içerik oluşturun
  • Karmaşık sorunları çözün
  • Müşteri hizmetleri işlemleri
  • Sanal asistanlar
  • Dil Çeviri
  • Duygu analizi.
  • “Tekrarlayan” işleri azaltın ve otomatikleştirin.
  • Emirlik şirketlerinin daha verimli olmasına yardımcı olun

Falcon 40B nasıl eğitildi?

1 trilyon token üzerinde eğitilmek için iki ay boyunca AWS'de 384 GPU gerekiyordu. 1,000 Milyar jetonla eğitildi Rafine Web, TSEV tarafından oluşturulmuş devasa bir İngilizce web veri kümesi. 

Ön eğitim verileri, web'den kamuya açık verilerin toplanmasından oluşuyordu. Ortak Tarama. Ekip, makine tarafından oluşturulan metni kaldırmak için kapsamlı bir filtreleme aşamasından geçti ve yetişkinlere yönelik içeriğin yanı sıra, yaklaşık beş trilyon jetonluk bir ön eğitim veri kümesi oluşturmak için her türlü tekilleştirme bir araya getirildi.

CommonCrawl'ın üzerine inşa edilen RefinedWeb veri kümesi, modellerin, seçilmiş veri kümeleri üzerinde eğitilen modellerden daha iyi bir performans elde ettiğini göstermiştir. RefinedWeb aynı zamanda multimodal dostudur. 

Falcon hazır olduğunda, EAI Harness, HELM ve BigBench gibi açık kaynak kıyaslamalarına göre doğrulandı.

Onlar var açık kaynaklı Falcon LLM Bu sayede Falcon 40B ve 7B, Apache Lisansı Sürüm 2.0 sürümünü temel aldığından araştırmacılar ve geliştiriciler için daha erişilebilir hale geliyor. 

Bir zamanlar yalnızca araştırma ve ticari kullanıma yönelik olan Yüksek Lisans, artık yapay zekaya kapsayıcı erişime yönelik küresel talebi karşılamak için açık kaynak haline geldi. BAE, AI içindeki zorlukları ve sınırları değiştirmeye ve gelecekte nasıl önemli bir rol oynayacağına kararlı olduğundan artık ticari kullanım kısıtlamaları için telif ücreti almıyor. 

Yapay zeka dünyasında işbirliği, yenilik ve bilgi paylaşımı ekosistemini geliştirmeyi amaçlayan Apache 2.0, güvenlik ve güvenli açık kaynak yazılım sağlar.

Falcon-40B'nin sohbet robotu tarzındaki genel talimatlara daha uygun olan daha basit bir versiyonunu denemek istiyorsanız Falcon-7B'yi kullanmak istiyorsunuz.

O halde başlayalım…

Henüz yapmadıysanız aşağıdaki paketleri yükleyin:

!pip install transformers
!pip install einops
!pip install accelerate
!pip install xformers

 

Bu paketleri yükledikten sonra, sağlanan kodu çalıştırmaya devam edebilirsiniz. Falcon 7-B Talimatı:

from transformers import AutoTokenizer, AutoModelForCausalLM
import transformers
import torch model = "tiiuae/falcon-7b-instruct" tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline( "text-generation", model=model, tokenizer=tokenizer, torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto",
)
sequences = pipeline( "Girafatron is obsessed with giraffes, the most glorious animal on the face of this Earth. Giraftron believes all other animals are irrelevant when compared to the glorious majesty of the giraffe.nDaniel: Hello, Girafatron!nGirafatron:", max_length=200, do_sample=True, top_k=10, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id,
)
for seq in sequences: print(f"Result: {seq['generated_text']}")

Mevcut en iyi açık kaynaklı model olarak öne çıkan Falcon, LLaMA tacını aldı ve insanlar güçlü bir şekilde optimize edilmiş mimarisine, benzersiz lisansa sahip açık kaynağa ve iki boyutta mevcut olmasına hayran kaldı: 40B ve 7B parametreleri.

Hiç denedin mi? Eğer varsa, yorumlarınızda ne düşündüğünüzü bize bildirin.

 
 
Nişa Arya KDnuggets'ta bir Veri Bilimcisi, Serbest Teknik Yazar ve Topluluk Yöneticisidir. Veri Bilimi kariyer tavsiyesi veya eğitimleri ve Veri Bilimi hakkında teoriye dayalı bilgi sağlamakla özellikle ilgileniyor. Ayrıca, Yapay Zekanın insan yaşamının uzun ömürlülüğüne fayda sağladığı/sağlayabileceği farklı yolları keşfetmek istiyor. Başkalarına rehberlik ederken teknoloji bilgisini ve yazma becerilerini genişletmeye çalışan hevesli bir öğrenci.
 

Bizimle sohbet

Merhaba! Size nasıl yardım edebilirim?