Mistral AI запускає моделі з відкритим кодом для глобальної доступності

1

Французький розробник штучного інтелекту Mistral AI представив нову лінійку мовних моделей, розроблених для розширення доступу до передових технологій ІІ незалежно від географічного розташування, надійності інтернет-з’єднання або мови. Випуск включає як великомасштабні моделі загального призначення, так і більш дрібні, адаптовані версії, призначені для розгортання на різних пристроях.

Розширення ІІ за межі англоцентричних систем

В основі запуску лежить Mistral Large 3 – високопродуктивна модель, конкурентоспроможна з пропозиціями OpenAI та Google. Однак Mistral виділяється тим, що ставить на чільне місце багатомовні можливості. Більшість існуючих ІІ-бенчмарків сильно перевішені у бік англійської продуктивності, часто на шкоду точності іншими мовами. Mistral навмисно збільшив частку неанглійських навчальних даних, щоб його моделі незмінно добре працювали різними мовами.

За словами співзасновника Mistral Гюйома Лампля, багато компаній уникають фокусування на багатомовній підтримці, оскільки це може трохи знизити результати в популярних англомовних бенчмарках. Mistral вирішив надати пріоритет глобальної корисності, а не рейтингам лідерів. Це зрушення важливе, тому що доступність ІІ — це не лише питання ціни, а й питання мовної рівності.

Невеликі моделі для більш широких застосувань

Поряд із флагманською моделлю Large 3, Mistral представила сімейство Ministral 3 : ряд менших моделей (3, 8 та 14 мільярдів параметрів) з варіаціями, адаптованими для різних варіантів використання. Ці менші моделі призначені для ефективності, що дозволяє їм працювати на таких пристроях, як ноутбуки, смартфони, автомобілі та роботи.

Три варіанти в сімействі Ministral 3 включають:

  • Базові моделі : Налаштовані користувачами для конкретних завдань.
  • Тонко налаштовані моделі : Оптимізовані Mistral для загальної продуктивності.
  • Розмірковані моделі : Призначені для ітеративної обробки для отримання більш якісних відповідей.

Цей багаторівневий підхід визнає, що багато користувачів ІІ віддають пріоритет спеціалізованої функціональності над сирою потужністю великих моделей. Надаючи розробникам можливість розміщувати ці моделі на своїх серверах, Mistral також вирішує проблеми конфіденційності даних і операційних витрат.

Автономна функціональність та граничні обчислення

Ключовою перевагою менших моделей є їхня здатність працювати в автономному режимі. Це критично важливо для програм у середовищах, де надійний доступ до Інтернету недоступний, наприклад, у робототехніці або автономних транспортних засобах. Можливість запуску ІІ безпосередньо на пристрої також підвищує конфіденційність, зберігаючи дані локально та знижує енергоспоживання.

«Ми глибоко віримо, що це зробить ІІ доступним кожному, помістивши ІІ до їхніх рук, по суті». – Гюйом Лампль, співзасновник Mistral AI.

Підхід Mistral є відходом від тенденції до централізованого хмарного ІІ. Пропонуючи моделі з відкритою вагою, які можуть працювати на пристрої, компанія просувається до більш децентралізованої та інклюзивної екосистеми ІІ.

Більш широкі наслідки очевидні: ІІ виходить з-під контролю кількох великих гравців і прямує до більш розподіленого та доступного майбутнього. Цей зсув, ймовірно, прискорить інновації та дозволить розробникам у всьому світі створювати ІІ-рішення, адаптовані до їх конкретних потреб та мов.