Big Data

Falcon LLM: nowy król LLM typu open source – KDnuggets

Znacznik czasu: 7 czerwca 2023 r 10: 00 AM
Węzeł źródłowy: 2544928

Opublikowane ponownie przez Plato

Obraz autorstwa redaktora

Widzieliśmy, jak co tydzień pojawiają się duże modele językowe (LLM), z coraz większą liczbą chatbotów, z których możemy korzystać. Jednak ustalenie, który jest najlepszy, postęp w każdym z nich i który jest najbardziej użyteczny, może być trudne.

Przytulanie twarzy ma tablicę liderów Open LLM, która śledzi, ocenia i klasyfikuje LLM w miarę ich wydawania. Używają unikalnej struktury, która jest używana do testowania generatywnych modeli językowych w różnych zadaniach ewaluacyjnych.

Ostatnio LLaMA (Large Language Model Meta AI) znajdował się na szczycie tabeli liderów i został niedawno zdetronizowany przez nowy, wstępnie wyszkolony LLM – Falcon 40B.

Image by HuggingFace Otwarta tablica wyników LLM

Firma Falcon LLM została założona i zbudowana przez Instytut Innowacji Technologicznych (TII), firma będąca częścią Rady ds. Badań nad Zaawansowanymi Technologiami rządu Abu Zabi. Rząd nadzoruje badania technologiczne w całych Zjednoczonych Emiratach Arabskich, gdzie zespół naukowców, badaczy i inżynierów koncentruje się na dostarczaniu przełomowych technologii i odkryć naukowych.

Sokół-40B to podstawowy LLM z parametrami 40B, trenujący na jednym bilionie tokenów. Falcon 40B to model wyłącznie z dekoderem autoregresyjnym. Model autoregresyjny tylko z dekoderem oznacza, że model jest szkolony do przewidywania następnego tokena w sekwencji, biorąc pod uwagę poprzednie tokeny. Model GPT jest tego dobrym przykładem.

Wykazano, że architektura Falcon znacznie przewyższa GPT-3 przy zaledwie 75% budżetu obliczeniowego szkolenia, a także wymaga tylko ? obliczenia w czasie wnioskowania.

Jakość danych na dużą skalę była ważnym celem zespołu w Technology Innovation Institute, ponieważ wiemy, że LLM są bardzo wrażliwe na jakość danych szkoleniowych. Zespół zbudował potok danych, który skalował się do dziesiątek tysięcy rdzeni procesora w celu szybkiego przetwarzania i był w stanie wyodrębnić wysokiej jakości treści z sieci za pomocą rozbudowanego filtrowania i deduplikacji.

Mają też inną mniejszą wersję: Sokół-7B który ma 7B parametrów, wytrenowany na 1,500B tokenach. A także jako Instruktaż Falcon-40B, Instruktaż Falcon-7B dostępnych modeli, jeśli szukasz gotowego do użycia modelu czatu.

Co potrafi Falcon 40B?

Podobnie jak inne LLM, Falcon 40B może:

Twórz kreatywne treści
Rozwiązuj złożone problemy
Operacje obsługi klienta
Wirtualni asystenci
Tłumaczenie językowe
Analiza nastrojów.
Zredukuj i zautomatyzuj „powtarzalną” pracę.
Pomóż firmom z Emiratów zwiększyć wydajność

Jak szkolono Falcona 40B?

Przeszkolony na 1 bilionie tokenów wymagał 384 procesorów graficznych na AWS w ciągu dwóch miesięcy. Wyszkolony na tokenach 1,000B Wyrafinowana sieć, ogromny zestaw danych internetowych w języku angielskim zbudowany przez TII.

Dane wstępnego szkolenia składały się ze zbioru danych publicznych z sieci, przy użyciu Wspólne przeszukiwanie. Zespół przeszedł przez dokładną fazę filtrowania, aby usunąć tekst generowany maszynowo i treści dla dorosłych, a także wszelkie deduplikacje w celu utworzenia wstępnego zestawu danych zawierającego prawie pięć bilionów tokenów.

Zestaw danych RefinedWeb, zbudowany na bazie CommonCrawl, pokazał, że modele osiągają lepszą wydajność niż modele, które są szkolone na wyselekcjonowanych zestawach danych. RefinedWeb jest również przyjazny multimodalnie.

Gdy był gotowy, Falcon został zweryfikowany pod kątem testów porównawczych open source, takich jak EAI Harness, HELM i BigBench.

Mają Falcon LLM o otwartym kodzie źródłowym publicznie, dzięki czemu Falcon 40B i 7B są bardziej dostępne dla badaczy i programistów, ponieważ są oparte na licencji Apache w wersji 2.0.

LLM, który kiedyś służył wyłącznie do celów badawczych i komercyjnych, stał się teraz oprogramowaniem typu open source, aby zaspokoić globalne zapotrzebowanie na integracyjny dostęp do sztucznej inteligencji. Jest teraz wolny od opłat licencyjnych za ograniczenia dotyczące użytku komercyjnego, ponieważ Zjednoczone Emiraty Arabskie są zobowiązane do zmiany wyzwań i granic w ramach sztucznej inteligencji oraz tego, jak odgrywa ona znaczącą rolę w przyszłości.

Mając na celu kultywowanie ekosystemu współpracy, innowacji i dzielenia się wiedzą w świecie sztucznej inteligencji, Apache 2.0 zapewnia bezpieczeństwo i bezpieczne oprogramowanie typu open source.

Jeśli chcesz wypróbować prostszą wersję Falcon-40B, która lepiej nadaje się do ogólnych instrukcji w stylu chatbota, chcesz użyć Falcon-7B.

Więc zacznijmy…

Jeśli jeszcze tego nie zrobiłeś, zainstaluj następujące pakiety:

!pip install transformers
!pip install einops
!pip install accelerate
!pip install xformers

Po zainstalowaniu tych pakietów możesz przejść do uruchamiania przewidzianego kodu Instruktaż Falcona 7-B:

from transformers import AutoTokenizer, AutoModelForCausalLM
import transformers
import torch model = "tiiuae/falcon-7b-instruct" tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline( "text-generation", model=model, tokenizer=tokenizer, torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto",
)
sequences = pipeline( "Girafatron is obsessed with giraffes, the most glorious animal on the face of this Earth. Giraftron believes all other animals are irrelevant when compared to the glorious majesty of the giraffe.nDaniel: Hello, Girafatron!nGirafatron:", max_length=200, do_sample=True, top_k=10, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id,
)
for seq in sequences: print(f"Result: {seq['generated_text']}")

Będąc najlepszym dostępnym modelem open source, Falcon zdobył koronę LLaMA, a ludzie są zdumieni jego silnie zoptymalizowaną architekturą, open source z unikalną licencją i jest dostępny w dwóch rozmiarach: parametrach 40B i 7B.

Czy próbowałeś? Jeśli tak, daj nam znać w komentarzach, co myślisz.

Nisza Arja jest analitykiem danych, niezależnym pisarzem technicznym i menedżerem ds. społeczności w KDnuggets. Jest szczególnie zainteresowana udzielaniem porad dotyczących kariery w Data Science lub samouczkami i wiedzą opartą na teorii wokół Data Science. Chciałaby również zbadać różne sposoby, w jakie sztuczna inteligencja jest / może korzystnie wpłynąć na długowieczność ludzkiego życia. Chętnie się uczy, stara się poszerzyć swoją wiedzę techniczną i umiejętności pisania, jednocześnie pomagając innym.

Więcej na ten temat

Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
EVM Finanse. Ujednolicony interfejs dla zdecentralizowanych finansów. Dostęp tutaj.
Quantum Media Group. Wzmocnienie IR/PR. Dostęp tutaj.
PlatoAiStream. Analiza danych Web3. Wiedza wzmocniona. Dostęp tutaj.
Źródło: https://www.kdnuggets.com/2023/06/falcon-llm-new-king-llms.html?utm_source=rss&utm_medium=rss&utm_campaign=falcon-llm-the-new-king-of-open-source-llms

tagi: 000, 1, 10, 384, 7, 75, a, zdolny, Abu Dabi, przyśpieszyć, dostęp, dostępny, osiągać, Dorosły, zaawansowany, Zaawansowana technologia, Rada, przed, AI, Cel, Wszystkie kategorie, już, również, an, analiza, i, zwierzę, zwierzęta, inne, każdy, Apache, Arabki, architektura, SĄ, na około, Sztuczny, sztuczna inteligencja, AS, zmontowane, asystenci, At, samochód, zautomatyzować, dostępny, AWS, na podstawie, BE, stają się, być, jest, uważa,, Benchmarki, korzyści, BEST, lepszy, Granice, poszerzać, budżet, Wybudowany, by, CAN, Kariera, Poradnik kariery, zaopatrywać, wyzwania, wymiana pieniędzy, pogawędzić, chatbot, nasze chatboty, kod, współpraca, kolekcja, komentarze, handlowy, zobowiązany, społeczność, Firmy, sukcesy firma, w porównaniu, kompleks, obliczać, składał się, zawartość, Rada, CPU, Twórczy, Korona, kultywować, kurator, klient, Obsługa klienta, dane, Potok danych, jakość danych, Nauka danych, kariera naukowa o danych, naukowiec danych, zestaw danych, Zbiory danych, dekoder, dostarczanie, Kreowanie, deweloperzy, Dhabi, różne, odkrycia, każdy, Ziemia, Ekosystem, redaktor, wydajny, Arabskie, Emiraty, Inżynierowie, Angielski, Zapewnia, ewaluację, Każdy, przykład, odkryj, rozległy, wyciąg, Twarz, sokół, FAST, Postać, filtracja, Pięć, Skupiać, następujący, W razie zamówieenia projektu , Podstawowy, Założony, Framework, Darmowy, wolny zawód, przyjazny, od, przyszłość, Generować, wygenerowane, generacja., generatywny, ogólny, Get , zacznij, dany, Globalne, dobry, Rząd, Gpt, GPT-3, GPU, poprowadzi, miał, Ciężko, uprząż, Have, Port, Pomoc, pomoc, HER, Wysoki, wysokiej jakości, wysoko, W jaki sposób, Jednak, Przytulanie twarzy, człowiek, ŻYCIE CZŁOWIEKA, if, obraz, import, ważny, in, łącznie z, wnioskowanie, Innowacja, Zainstalować, zainstalowany, Instytut, pouczać, instrukcje, Inteligencja, zainteresowany, nieistotny, Is, IT, JEGO, Knuggety, KEEN, król, wiedzieć, wiedza, język, model języka, duży, duże modele językowe, liderów, uczeń, Wynajmować, Licencja, życie, Lama, Lamy, LLM, długowieczność, poszukuje, poszukuje, maszyna, Dokonywanie, kierownik, masywny, znaczy, Meta, Meta sztuczna inteligencja, model, modele, miesięcy, jeszcze, bardziej wydajny, większość, ruch, Multimodalny, prawie, nowa, Następna, Teraz, obsesję, of, on, pewnego razu, ONE, tylko, koncepcja, open source, Oprogramowanie typu open source, operacje, zoptymalizowane, or, Inne, Pozostałe, na zewnątrz, Przewyższają, O, nadzoruje, Pakiety, parametry, część, szczególnie, Ludzie, jest gwarancją najlepszej jakości, które mogą dostarczyć Ci Twoje monitory,, faza, pypeć, rurociąg, plato, Analiza danych Platona, PlatoDane, odgrywa, dla, przewidzieć, poprzedni, , problemy, przetwarzanie, produkować, Postęp, pod warunkiem,, że, publiczny, dane publiczne, jakość, szeregi, gotowy, Niedawny, niedawno, zmniejszyć, zwolnić, Zwolniony, usunąć, powtarzalne, wymagany, wymagające, Badania naukowe, Badacze, Ograniczenia, dalsze, rola, tantiemy, bieganie, s, "bezpiecznym", Skala, łuskowaty, nauka, naukowiec, Naukowcy, bezpieczeństwo, widzenie, poszukuje, wrażliwy, sentyment, Sekwencja, Usługi, dzielenie, ona, pokazane, znaczący, znacznie, podobny, prostsze, rozmiary, umiejętności, mniejszy, So, Tworzenie , ROZWIĄZANIA, źródło, pozyskiwany, stojący, rozpoczęty, strongly, styl, Taki, w kolorze, Zadania, zadania, Zespół zarządzający, tech, Techniczny, Technologies, Technologia, innowacje technologiczne, kilkadziesiąt, test, XNUMX, Niż, że, Połączenia, Przyszłość, społeczeństwo, świat, następnie, teoria, Te, one, myśleć, to, Przejdź, tysiące, Przez, czas, do, żeton, Żetony, Top, aktualny, pochodnia, utworów, Przeszkolony, Trening, dane treningowe, transformacyjny, Transformatory, Tłumaczenie, trylion, prawdziwy, próbować, tutoriale, drugiej, ZEA, wyjątkowy, Zjednoczony, Zjednoczone Emiraty Arabskie, us, posługiwać się, Używany, użyteczny, za pomocą, zatwierdzony, ve, wersja, Wirtualny, wirtualni asystenci, chcieć, była, sposoby, we, sieć, tydzień, DOBRZE, poszedł, Co, Kiedy, gdzie, Który?, Podczas, cały, Życzenia, w, w ciągu, Praca, świat, pisarz, pisanie, Umiejętności Pisania, You, zefirnet

Handlarz kryptowalutami skazany za oszustwo polegające na wykorzystaniu 110 milionów dolarów na rynkach Mango – CryptoInfoNet

19 kwietnia 2024 r. 5: 55 pm

Xlera8

Falcon LLM: nowy król LLM typu open source – KDnuggets

Opublikowane ponownie przez Plato

Co potrafi Falcon 40B?

Jak szkolono Falcona 40B?

Więcej na ten temat

Lando Norris zdobywa pole position do sprinterskiego Grand Prix Chin F1 od Hamilton – Autoblog

Pionier Bitcoina Hal Finney pośmiertnie zdobywa nową nagrodę nazwaną jego imieniem

Czat z nami