Microsoft réduit l'IA au format de poche avec Phi-3 Mini

Horodatage : 23 avril 2024 11h01 AM
Nœud source : 2735513

Republié par Platon

Microsoft affirme que la dernière incarnation de son modèle léger Phi-3 Mini AI rivalise avec des concurrents tels que GPT-3.5 tout en étant suffisamment petite pour être déployée sur un téléphone.

Phi-3 Mini est un modèle de langage de 3.8 milliards de paramètres formé sur 3.3 billions de jetons. Ce chiffre est en hausse par rapport aux 2.7 milliards de paramètres de Phi-2, que Microsoft introduit en Décembre 2023.

Plutôt que d’investir autant que possible dans les modèles de formation, l’accent a été mis sur le raisonnement. Microsoft a déclaré : « À titre d'exemple, le résultat d'un match de Premier League un jour donné pourrait être de bonnes données d'entraînement pour les modèles frontières, mais nous devons supprimer ces informations pour laisser plus de capacité de « raisonnement » au modèle pour les modèles de taille mini. .»

L'approche ciblée signifie que même si Phi-3 n'a peut-être pas l'étendue des connaissances de ses concurrents, il est au moins aussi bon, sinon meilleur, en matière de raisonnement, du moins c'est ce que prétend Microsoft. Dans un document de recherche [PDF], Microsoft note que cela a permis à son petit modèle de langage « d'atteindre le niveau de modèles très performants tels que GPT-3.5 ou Mixtral avec seulement 3.8 milliards de paramètres au total (alors que Mixtral a 45 milliards de paramètres au total par exemple). »

La recherche note également que les données de formation utilisées étaient constituées de « données Web fortement filtrées… provenant de diverses sources Internet ouvertes » et de données générées par LLM. Les sources de données utilisées pour former les LLM font l’objet de plusieurs poursuites.

La petite taille du Phi-3 Mini signifie qu'il peut fonctionner hors ligne sur un smartphone, nous dit-on. Les chercheurs ont déclaré qu’il pourrait occuper environ 1.8 Go de mémoire et l’ont essayé hors ligne sur un iPhone 14 avec une puce A16 Bionic fonctionnant de manière native sur un appareil. Dans l'article, les chercheurs montrent des captures d'écran de Phi-3 Mini écrivant un poème et suggérant des choses à faire à Houston.

Les chercheurs soulignent également les inconvénients inhérents à l’accent mis sur la compréhension et le raisonnement du langage. « Le modèle n'a tout simplement pas la capacité de stocker trop de « connaissances factuelles » », ce qui peut être atténué dans une certaine mesure en l'ajoutant à un moteur de recherche. Cependant, cela irait à l’encontre de l’intérêt de pouvoir l’exécuter hors ligne.

La langue est actuellement principalement limitée à l'anglais, et les problèmes inhérents à la plupart des LLM – hallucinations, amplification des biais et génération de contenu inapproprié – peuvent également être trouvés dans Phi-3 Mini.

Les chercheurs affirment dans l’article : « Il y a un travail important à faire pour relever pleinement ces défis. »

Des modèles plus grands – relativement parlant – ont également été annoncés sous la forme de Phi-3 Small et Phi-3 Medium avec respectivement 7 et 14 milliards de paramètres.

Victor Botev, CTO et co-fondateur de Iris.ai, nous a déclaré : « L'annonce par Microsoft du modèle Phi-3 représente une tendance continue dans le développement de l'IA. Plutôt que de rechercher des modèles toujours plus grands, Microsoft développe des outils avec des données plus soigneusement sélectionnées et une formation spécialisée. Cela permet d’améliorer les performances et les capacités de raisonnement sans les coûts de calcul énormes des modèles comportant des milliards de paramètres. Tenir cette promesse signifierait éliminer un énorme obstacle à l’adoption pour les entreprises à la recherche de solutions d’IA.

« Microsoft regarde judicieusement au-delà de la mentalité « plus c'est gros, mieux c'est ». Pour les applications d’IA commerciales et grand public largement répandues, la faisabilité et la spécificité sont plus importantes que le nombre massif de paramètres. Des modèles comme Phi-3 démontrent clairement qu’avec la bonne approche en matière de données et de formation, les capacités avancées d’IA ne nécessitent pas nécessairement la construction de modèles toujours plus grands – un facteur décisif pour les entreprises où le rapport coût/qualité est critique. ®

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
La source: https://go.theregister.com/feed/www.theregister.com/2024/04/23/microsoft_phi_3_mini/

Mots clés: 1, 14, 2023, 7, 8, a, capacités, capable, propos, Adoption, Avancée, devant, AI, Applications IA, Capacités d'IA, développement IA, Modèle IA, permis, permet, aussi, Amplification, an, ainsi que , annoncé, NOUVEAUTÉ!, applications, une approche, d'environ, SONT, AS, At, une barrière, BE, Être trouvé, était, va, mieux, dans tous, biais, plus gros, Milliards, Bionique, largeur, Développement, la performance des entreprises, entreprises, Mais, by, CAN, capacités, capable, Compétences, prudemment, certaines, globaux, ciselure, puce, prétentions, clairement, CO, Co-fondateur, vient, concurrents, Computational, consistait, consommateur, contenu, continue, Prix, Costs, pourriez , comtes, critique, CTO, organisée, données, Les sources de données, journée, Décembre, Décembre 2023, décidant, démontrer, déployé, développement, Développement, dispositif, Le, down, inconvénients, moteur, Anglais, assez, déjà, exemple, ampleur, facteur, Les faits, faisabilité, Figure, filtré, Focus, mettant l'accent, Pour, par exemple, formulaire, trouvé, fondateur, de, frontière, l'accomplissement, d’étiquettes électroniques entièrement, jeu, généré, génération., Bien, gpt, GPT-3, Vous avez, fortement, Souligner, très, Houston, Cependant, majeur, if, important, Amélioration, in, Inapproprié, d'information, inhérent, Internet, développement, introduit, iPhone, iphone 14, Is, IT, SES, spécialisées, langue, modèle de langage, plus importantes, Nouveautés, Poursuites, Ligue, Au, Laisser, Niveau, léger, comme, LLM, recherchez-, à la recherche de, Fait du, massif, signifier, veux dire, moyenne, Mémoire, Microsoft, Puissance, Mindset, mini-, atténué, modèle, numériques jumeaux (digital twin models), PLUS, (en fait, presque toutes), la plupart, Beaucoup, nativement, Besoin, Notes, occuper, of, direct, on, uniquement, ouvert, or, ande, Papier, paramètre, paramètres, particulier, PDF, performant, Téléphone, Platon, Intelligence des données Platon, PlatonDonnées, poche, point, possible, Premier, Premier League, représentent, d'ouvrabilité, PROMETTONS, qualité, plutôt, rapport, RE, nous joindre, raisonnement, relativement, supprimez, représente, exigent, un article, chercheurs, respectivement, limité, résultat, Droite, rivaux, Courir, pour le running, s, Saïd, dire, screenshots, Rechercher, moteur de recherche, plusieurs, montrer, significative, Simplement, Taille, petit, smartphone, So, Solutions, quelque chose, sources, Anglais parlé, spécialisé, spécificité, Boutique, sujet, Tel, des campagnes marketing ciblées,, Que, qui, Les, Là, Ces, des choses, this, à, Tokens, dit, trop, trop, les outils, Total, train, Qualifié, Formation, données d'entraînement, Modèles de formation, tendance, essayé, billion, trillions, LUMIÈRE SUR NOS, up, us, Occasion, Divers, vainqueur, était, we, web, Quand, De, Lequel?, tout en, répandu, judicieusement, comprenant, sans, Activités principales, pourra, écriture, zéphyrnet

"Il ne reste plus beaucoup d'inconvénients à résoudre" : un trader déclare que Bitcoin est proche du fond après le retracement le plus profond du cycle - The Daily Hodl

3 mai 2024 10 h 30

Qu’est-ce qui inquiète les gouvernements du monde entier à propos de DeFi ? – CryptoInfoNet

3 mai 2024 10 h 02

Xlera8

Microsoft réduit l'IA au format de poche avec Phi-3 Mini

Republié par Platon

Étude : Ce sont les véhicules les plus chers à conduire au kilomètre – Autoblog

La secrétaire de l'AF, Kendall, vole dans un X-62 VISTA contrôlé par l'IA à Edwards AFB

ChainSwap révolutionne le DeFi multi-chaînes avec des échanges intra-chaînes

Les Dolphins de Miami signent un contrat d'un an avec Odell Beckham Jr.

Polkadot et Cosmos gagnent au cours d'une semaine difficile pour la crypto : mise à jour du marché des indices CoinDesk

Qu’est-ce qui inquiète les gouvernements du monde entier à propos de DeFi ? – CryptoInfoNet

Discutez avec nous