Microsoft зменшує штучний інтелект до кишенькового розміру за допомогою Phi-3 Mini

Позначка часу: 23 квітня 2024 р 11: 01 А.М.
Вихідний вузол: 2735513

Перевидано Платоном

Корпорація Майкрософт стверджує, що останнє втілення її легкої моделі Phi-3 Mini AI конкурує з такими конкурентами, як GPT-3.5, але є достатньо малим, щоб його можна було розгорнути на телефоні.

Phi-3 Mini — це модель мови з 3.8 мільярда параметрів, навчена на 3.3 трильйона токенів. Ця цифра перевищує 2.7 мільярда параметрів Phi-2, які Microsoft введені у грудні 2023.

Замість того, щоб якомога більше вникати в навчальні моделі, увага була зосереджена на аргументації. Microsoft сказала: «Як приклад, результатом гри в Прем’єр-лізі в певний день можуть бути хороші тренувальні дані для передових моделей, але нам потрібно видалити таку інформацію, щоб залишити більше можливостей моделі для «міркування» для моделей міні-розміру. .”

Цілеспрямований підхід означає, що, хоча Phi-3 може не мати такої широти знань, як його конкуренти, він принаймні такий самий, якщо не кращий, коли йдеться про міркування, принаймні так стверджує Microsoft. В дипломну роботу [PDF], Microsoft зазначає, що це дозволило її маленькій мовній моделі «досягти рівня високопродуктивних моделей, таких як GPT-3.5 або Mixtral, лише з 3.8 B загальних параметрів (у той час як Mixtral, наприклад, має 45 B загальних параметрів)».

Дослідження також зазначає, що використані навчальні дані складалися з «сильно відфільтрованих веб-даних … з різних відкритих інтернет-джерел» і даних, згенерованих LLM. Джерела даних, які використовуються для навчання LLM, є предметом декілька судових позовів.

Нам сказали, що невеликий розмір Phi-3 Mini означає, що він може працювати в автономному режимі на смартфоні. Дослідники сказали, що його можна змусити займати приблизно 1.8 ГБ пам’яті, і випробували його в автономному режимі на iPhone 14 із чіпом A16 Bionic, який працює на пристрої. У статті дослідники демонструють скріншоти, на яких Phi-3 Mini пише вірш і пропонує, чим зайнятися в Х’юстоні.

Дослідники також підкреслюють недоліки, властиві зосередженню на розумінні мови та міркуванні. «Модель просто не здатна зберігати занадто багато «фактичних знань», що можна певною мірою пом’якшити, доповнивши його за допомогою пошукової системи. Однак це зруйнувало б сенс можливості запуску в автономному режимі.

Мова на даний момент здебільшого обмежена англійською мовою, і проблеми, властиві більшості LLM – галюцинації, посилення упередженості та створення невідповідного контенту – також можна знайти в Phi-3 Mini.

Дослідники кажуть у статті: «Попереду ще багато роботи, щоб повністю вирішити ці проблеми».

Умовно кажучи, більші моделі також були анонсовані у вигляді Phi-3 Small і Phi-3 Medium з 7 і 14 мільярдами параметрів відповідно.

Віктор Ботев, технічний директор і співзасновник компанії Iris.ai, сказав нам: «Оголошення компанією Microsoft моделі Phi-3 демонструє триваючу тенденцію в розвитку ШІ. Замість того, щоб гнатися за все більшими моделями, Microsoft розробляє інструменти з більш ретельно підібраними даними та спеціалізованим навчанням. Це дозволяє підвищити продуктивність і здатність міркувати без великих обчислювальних витрат на моделі з трильйонами параметрів. Виконання цієї обіцянки означало б зруйнувати величезний бар’єр для впровадження для компаній, які шукають рішення ШІ.

«Майкрософт мудро виходить за межі мислення «більше — краще». Для широко розповсюджених ділових і споживчих додатків штучного інтелекту здійсненність і специфіка важливіші, ніж величезна кількість параметрів. Такі моделі, як Phi-3, чітко демонструють, що за наявності правильних даних і підходу до навчання розширені можливості штучного інтелекту не потребують створення все більших моделей, що є вирішальним фактором для компаній, де співвідношення ціни та якості має вирішальне значення». ®

Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
джерело: https://go.theregister.com/feed/www.theregister.com/2024/04/23/microsoft_phi_3_mini/

Ключові слова: 1, 14, 2023, 7, 8, a, здібності, в стані, адреса, Прийняття, просунутий, попереду, AI, AI-додатки, Можливості AI, ай розвиток, Модель AI, дозволено, дозволяє, Також, Посилення, an, та , оголошений, Оголошення, застосування, підхід, приблизно, ЕСТЬ, AS, At, бар'єр, BE, Бути знайденим, було, буття, краще, За, зміщення, більший, Мільярд, Bionic, широта, Створюємо , бізнес, підприємства, але, by, CAN, можливості, здатний, потужність, обережно, певний, проблеми, погоня, чіп, претензій, очевидно, CO, Співзасновник, приходить, конкурентів, обчислювальний, складався, споживач, зміст, триває, Коштувати, витрати, може, графи, критичний, CTO, Куратор, дані, джерела даних, день, Грудень, грудня 2023, приймаючи рішення, демонструвати, розгорнути, розвивається, розробка, пристрій, Лі, вниз, недоліки, двигун, англійська, досить, ever , приклад, ступінь, фактор, Фактичні, здійсненність, Рисунок, фільтрують, Сфокусувати, фокусування, для, наприклад, форма, знайдений, засновник, від, Кордон, виконання, повністю, гра, генерується, покоління, добре, gpt, GPT-3, Мати, сильно, Виділіть, дуже, Х'юстон, Однак, величезний, if, важливо, Покращений, in, невідповідний, інформація, притаманне, інтернет, в, введені, iPhone, iphone 14, Is, IT, ЙОГО, знання, мова, мовна модель, більше, останній, судові процеси, Ліга, Найменш, Залишати, рівень, легкий, як, LLM, шукати, шукаю, Зроблений, масивний, значити, засоби, середа, пам'ять, Microsoft, Міць, Розум, міні, пом’якшене, модель, Моделі, більше, найбільш, в основному, Багато, спочатку, Необхідність, примітки, займають, of, offline, on, тільки, відкрити, or, з, Папір, параметр, параметри, приватність, PDF, продуктивність, Телефони, plato, Інформація про дані Платона, PlatoData, кишеню, точка, це можливо, Прем'єр, Прем'єр-ліга, представити, проблеми, обіцянку, якість, швидше, співвідношення, RE, досягати, міркування, щодо, видаляти, представляє, вимагати, дослідження, Дослідники, відповідно, обмежений, результат, правий, суперників, прогін, біг, s, Зазначений, say , скріншоти, Пошук, Пошукова система, кілька, Показувати, значний, просто, Розмір, невеликий, смартфон, So, Рішення, що в сім'ї щось , джерел, Розмова, спеціалізований, специфічність, зберігати, тема, такі, цільове, ніж, Що, Команда, Там, Ці, речі, це, до, Жетони, сказав, занадто, забагато, інструменти, Усього:, поїзд, Навчений, Навчання, дані навчання, Навчальні моделі, тенденція, намагався, трильйон, трильйони, Розуміння, up, us, Використаний, Різний, переможець, було, we, Web, Коли, де, Котрий?, в той час як, широко поширений, мудро, з, без, Work, б, лист, зефірнет

Xlera8

Microsoft зменшує штучний інтелект до кишенькового розміру за допомогою Phi-3 Mini

Перевидано Платоном

Китайський авіаносець Fujian розпочав ходові випробування

Коштовність на звалищі: Volkswagen Vanagon 1982 року

Подія Pokémon Masters EX Infamous Pokéstar Villains

Росія може пропустити першу оперативну місію Starliner

Зв'яжіться з нами!