Big Data

Falcon LLM : le nouveau roi des LLM open source - KDnuggets

Horodatage : 7 juin 2023 10h00 AM
Nœud source : 2544928

Republié par Platon

Image par l'éditeur

Nous avons vu de grands modèles de langage (LLM) cracher chaque semaine, avec de plus en plus de chatbots à utiliser. Cependant, il peut être difficile de déterminer lequel est le meilleur, les progrès de chacun et lequel est le plus utile.

Étreindre a un classement Open LLM qui suit, évalue et classe les LLM au fur et à mesure de leur publication. Ils utilisent un cadre unique qui est utilisé pour tester des modèles de langage génératif sur différentes tâches d'évaluation.

Récemment, LLaMA (Large Language Model Meta AI) était en tête du classement et a récemment été détrôné par un nouveau LLM pré-formé - Falcon 40B.

Image Classement Open LLM de HuggingFace

LLM Faucon a été fondée et construite par le Institut d'innovation technologique (TII), une entreprise qui fait partie du Conseil de recherche sur les technologies avancées du gouvernement d'Abu Dhabi. Le gouvernement supervise la recherche technologique dans l'ensemble des Émirats arabes unis, où l'équipe de scientifiques, de chercheurs et d'ingénieurs se concentre sur la fourniture de technologies transformatrices et de découvertes scientifiques.

Faucon-40B est un LLM fondamental avec des paramètres 40B, s'entraînant sur un billion de jetons. Le Falcon 40B est un modèle à décodeur autorégressif uniquement. Un modèle de décodeur autorégressif uniquement signifie que le modèle est formé pour prédire le jeton suivant dans une séquence compte tenu des jetons précédents. Le modèle GPT en est un bon exemple.

Il a été démontré que l'architecture de Falcon surpasse de manière significative GPT-3 pour seulement 75 % du budget de calcul de formation, et ne nécessite que ? du calcul au moment de l'inférence.

La qualité des données à grande échelle était un objectif important de l'équipe du Technology Innovation Institute, car nous savons que les LLM sont très sensibles à la qualité des données de formation. L'équipe a construit un pipeline de données qui s'est adapté à des dizaines de milliers de cœurs de processeur pour un traitement rapide et a pu extraire du contenu de haute qualité du Web à l'aide d'un filtrage et d'une déduplication étendus.

Ils ont aussi une autre version plus petite : Faucon-7B qui a des paramètres 7B, formés sur des jetons 1,500B. Ainsi qu'un Falcon-40B-Instruireet Falcon-7B-Instruire modèles disponibles, si vous recherchez un modèle de chat prêt à l'emploi.

Que peut faire le Falcon 40B ?

Semblable à d'autres LLM, le Falcon 40B peut :

Générer du contenu créatif
Résoudre des problèmes complexes
Opérations de service à la clientèle
Assistants virtuels
Traduction
Analyse des sentiments.
Réduisez et automatisez le travail « répétitif ».
Aider les entreprises émiraties à devenir plus efficaces

Comment le Falcon 40B a-t-il été entraîné ?

Entrainé sur 1 384 milliards de jetons, il a fallu 1,000 GPU sur AWS, sur deux mois. Formé sur XNUMX XNUMX milliards de jetons de Web raffiné, un énorme ensemble de données Web en anglais construit par TII.

Les données de pré-formation consistaient en une collecte de données publiques sur le Web, à l'aide de CommonCrawl. L'équipe a traversé une phase de filtrage approfondie pour supprimer le texte généré par la machine, et le contenu pour adultes ainsi que toute déduplication pour produire un ensemble de données de pré-formation de près de cinq billions de jetons a été assemblé.

Construit sur CommonCrawl, l'ensemble de données RefinedWeb a montré que les modèles atteignent de meilleures performances que les modèles formés sur des ensembles de données organisés. RefinedWeb est également compatible avec le multimodal.

Une fois prêt, Falcon a été validé par rapport à des références open source telles que EAI Harness, HELM et BigBench.

Ils ont Falcon LLM open source au public, rendant les Falcon 40B et 7B plus accessibles aux chercheurs et aux développeurs car ils sont basés sur la version 2.0 de la licence Apache.

Le LLM, qui était autrefois réservé à la recherche et à un usage commercial, est maintenant devenu open source pour répondre à la demande mondiale d'accès inclusif à l'IA. Il est désormais exempt de redevances pour les restrictions d'utilisation commerciale, car les Émirats arabes unis se sont engagés à modifier les défis et les frontières au sein de l'IA et comment elle jouera un rôle important à l'avenir.

Visant à cultiver un écosystème de collaboration, d'innovation et de partage des connaissances dans le monde de l'IA, Apache 2.0 garantit la sécurité et la sécurité des logiciels open source.

Si vous voulez essayer une version plus simple du Falcon-40B qui convient mieux aux instructions génériques dans le style d'un chatbot, vous voulez utiliser le Falcon-7B.

Alors, commençons…

Si vous ne l'avez pas déjà fait, installez les packages suivants :

!pip install transformers
!pip install einops
!pip install accelerate
!pip install xformers

Une fois que vous avez installé ces packages, vous pouvez ensuite passer à l'exécution du code fourni pour Instruction Falcon 7-B:

from transformers import AutoTokenizer, AutoModelForCausalLM
import transformers
import torch model = "tiiuae/falcon-7b-instruct" tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline( "text-generation", model=model, tokenizer=tokenizer, torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto",
)
sequences = pipeline( "Girafatron is obsessed with giraffes, the most glorious animal on the face of this Earth. Giraftron believes all other animals are irrelevant when compared to the glorious majesty of the giraffe.nDaniel: Hello, Girafatron!nGirafatron:", max_length=200, do_sample=True, top_k=10, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id,
)
for seq in sequences: print(f"Result: {seq['generated_text']}")

Se tenant comme le meilleur modèle open-source disponible, Falcon a pris la couronne LLaMAs, et les gens sont étonnés de son architecture fortement optimisée, open-source avec une licence unique, et il est disponible en deux tailles : paramètres 40B et 7B.

Avez-vous essayé? Si vous en avez, faites-nous savoir dans les commentaires ce que vous en pensez.

Nisha Arya est Data Scientist, rédacteur technique indépendant et Community Manager chez KDnuggets. Elle est particulièrement intéressée à fournir des conseils de carrière en science des données ou des tutoriels et des connaissances théoriques sur la science des données. Elle souhaite également explorer les différentes façons dont l'intelligence artificielle est/peut bénéficier à la longévité de la vie humaine. Une apprenante passionnée, cherchant à élargir ses connaissances techniques et ses compétences en écriture, tout en aidant à guider les autres.

En savoir plus sur ce sujet

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
Financement EVM. Interface unifiée pour la finance décentralisée. Accéder ici.
Groupe de médias quantiques. IR/PR amplifié. Accéder ici.
PlatoAiStream. Intelligence des données Web3. Connaissance Amplifiée. Accéder ici.
La source: https://www.kdnuggets.com/2023/06/falcon-llm-new-king-llms.html?utm_source=rss&utm_medium=rss&utm_campaign=falcon-llm-the-new-king-of-open-source-llms

Mots clés: 000, 1, 10, 384, 7, 75, a, capable, abu dhabi, accélérer, accès, accessible, atteindre, Adulte, Avancée, technologie avancée, conseils, à opposer à, AI, Visée, Tous, déjà, aussi, an, selon une analyse de l’Université de Princeton, ainsi que , animal, animaux, une , tous, Apache, Arabe, architecture, SONT, autour, Artificiel, intelligence artificielle, AS, assemblé, assistants, At, auto, automatiser, disponibles, AWS, basé, BE, devenez, était, va, croit, repères, profiter, LES MEILLEURS, mieux, frontières, élargir, budget, Conçus, by, CAN, Carrière, Conseils carrière, répondre, globaux, en changeant, le chat, Chatbot, Chatbots, code, collaboration, collection, commentaires, commercial, engagé, Communautés, Sociétés, Société, par rapport, complexe, calcul, consistait, contenu, Conseil, Processeur, Conception, #, cultiver, organisée, des clients, Service à la clientèle, données, Pipeline de données, qualité des données, Sciences des données, carrière en science des données, Data Scientist, jeu de données, Jeux de données, décodeur, livrer, Demande, mobiles, Dhabi, différent, découvertes, chacun, Terre, risque numérique, éditeur, efficace, émirats, United, Les ingénieurs, Anglais, Assure, évaluation, Chaque, exemple, explorez, les, extrait, Visage, faucon, RAPIDE, Figure, filtration, Cinq, Focus, Abonnement, Pour, Fondatrice, Fondée, Framework, Test d'anglais, freelance, friendly, de, avenir, générer, généré, génération., génératif, générique, Obtenez, Oui je le veux, donné, Global, Bien, Gouvernement, gpt, GPT-3, GPU, guide, ait eu, Dur, harnais, Vous avez, Port, d’aide, aider, ELLE, Haute, de haute qualité, très, Comment, Cependant, Étreindre, humain, VIE HUMAINE, if, image, L’, important, in, compris, inférence, Innovation, Installer, Installé, Institut, instruire, Des instructions, Intelligence, intéressé, pertinent, Is, IT, SES, KDnuggetsGenericName, VIF, King, savoir, spécialisées, langue, modèle de langage, gros, grands modèles de langage, classement, apprenant, Laisser, Licence, VIE, Flamme, Flammes, LLM, longévité, recherchez-, à la recherche de, click, Fabrication, manager, massif, veux dire, Meta, Méta IA, modèle, numériques jumeaux (digital twin models), mois, PLUS, plus efficace, (en fait, presque toutes), Bougez, multimodal, presque, neufs, Suivant, Maintenant, obsédé, of, on, une fois, ONE, uniquement, ouvert, open source, Logiciels open source, Opérations, optimisé, or, Autre, Autres, ande, Surpasser, infos, supervise, Forfaits, paramètres, partie, particulièrement, Personnes, performant, phase, pépin, pipeline, Platon, Intelligence des données Platon, PlatonDonnées, joue, pré, prévoir, précédent, Imprimé, d'ouvrabilité, traitement, produire, Progrès, à condition de, aportando, public, données publiques, qualité, rangs, solutions, Articles de, récemment, réduire, libérer, Libéré, supprimez, répétitif, conditions, exigeant, un article, chercheurs, restrictions, résultat, rôle de l', redevance, pour le running, s, des, Escaliers intérieurs, escaladé, Sciences, scientifique, scientifiques, sécurité, voir, recherche, sensible, sentiment, Séquence, Service, partage, elle, montré, significative, de façon significative, similaires, plus simple, tailles, compétences, faibles, So, Logiciels, RÉSOUDRE, la source, source, permanent, j'ai commencé, fortement, Catégorie, Tel, adapté, tâches, tâches, ÉQUIPE, technologie, Technique, Les technologies, Technologie, innovation technologique, dizaines, tester, texte, Que, qui, La, El futuro, le public, le monde, puis, théorie, Ces, l'ont, penser, this, Approfondie, milliers, Avec, fiable, à, jeton, Tokens, top, sujet, torche, vos titres, Qualifié, Formation, données d'entraînement, transformation, transformateurs, Traduction, billion, oui, Essai, tutoriels, deux, UAE, unique, Uni, Émirats arabes unis, us, utilisé, Occasion, incontournable, en utilisant, validé, ve, version, Salle de conférence virtuelle, assistants virtuels, souhaitez, était, façons, we, web, semaine, WELL, est allé, Quoi, Quand, De, Lequel?, Si l’achat , la totalité, Souhaits, avec, dans les, Activités:, world, écrivain, écriture, Compétences d'écriture, Vous, zéphyrnet

Xlera8

Falcon LLM : le nouveau roi des LLM open source - KDnuggets

Republié par Platon

Que peut faire le Falcon 40B ?

Comment le Falcon 40B a-t-il été entraîné ?

En savoir plus sur ce sujet

Meilleurs joueurs disponibles pour la deuxième journée du repêchage de la NFL 3

Litecoin évolue dans une fourchette en raison de l'ambivalence des commerçants

Alien : Rogue Incursion arrive sur Quest 3, PSVR 2 et PC VR

"Alien: Rogue Incursion" enfin annoncé par Veteran VR Studio, prévu pour fin 2024

Stripe réintègre le marché des paiements cryptographiques avec le stablecoin USDC – Tech Startups

Comment les ordinateurs quantiques pourraient éclairer toute la diversité génétique humaine

Discutez avec nous