Конкуренты ChatGPT и DeepSeek: обзор ИИ-моделей разных стран

ИИ, нейросеть, чатбот, модель, алгоритм

Пока новости пестрят заголовками о необычных функциях известных ИИ-моделей США или Китая, в гонку постепенно включаются схожие продукты других стран. Собрали самые интересные из них.

Нормы в приоритете

Недавно Швейцария запустила собственную ИИ-модель Apertus — в качестве альтернативы коммерческим системам ChatGPT от OpenAI или Claude от Anthropic.

Разработчики Apertus заявили, что модель создана с нуля с соблюдением европейских норм в области авторского права и этики ИИ. Все данные для обучения получены исключительно с сайтов, разрешающих автоматический сбор информации, и с учетом запретов, установленных владельцами ресурсов. Так называемое «скрытное сканирование» не применяли.

На нескольких языках

Это далеко не первая попытка Европы создать конкурента известным ИИ-моделям. Среди наиболее успешных примеров — продукт французского стартапа Mistral.

Нейросеть способна работать с контекстом из 32 тыс. токенов, что позволяет модели лучше понимать и участвовать даже в длинных разговорах. Кроме того, искусственный интеллект функционирует на нескольких языках — английском, немецком, испанском, итальянском и французском.

Еще одна особенность — пользователи с помощью инструмента Ollama могут запускать Mistral локально и использовать версию без цензуры, благодаря чему настройка будет более точной. Как утверждают разработчики, в большинстве проведенных тестов Mistral 8×7B превзошла модели LLama-2 и GPT3.5.

Самостоятельная настройка

Исследователи ИИ японского стартапа Sakana AI объявили о разработке самонастраивающейся большой языковой модели (LLM) под названием Transformer2. LLM сама регулирует веса параметров для более точной настройки обучения.

Другой необычный проект того же стартапа — ИИ-система Continuous Thought Machine (CTM). Эта модель имитирует то, как человеческий мозг представляет себе время, отходя от традиционного подхода языковых моделей, которые рассматривают входные данные как единый статический снимок. Благодаря этой изюминке программа показала хорошие результаты в обучении, правда, ее производительность в целом из-за такого подхода хромает.

Обучают с нуля

В России одновременно развивают сразу несколько проектов в области больших языковых моделей. Самые крупные из них — GigaChat от Сбера и YandexGPT от Яндекса.

Сбер выбрал наиболее затратный, но перспективный путь, обучив GigaChat с нуля на собственных ресурсах, что позволяет лучше учитывать специфику русского языка и национальный контекст, особенно для официальных и технических текстов.

Яндекс также разрабатывает некоторые модели самостоятельно (например, YandexGPT 5 Lite), но есть у него и версии (YandexGPT 5 Pro), которые базируются на глубоко адаптированных под РФ с помощью обширных датасетов китайских разработках.

Вышли из гонки

Правда, не все так просто в ИИ-сфере. Немецкая компания Aleph Alpha из Гейдельберга тоже пыталась вывести аналогичное приложение на рынок. Однако результаты оказались неубедительными, поэтому компания сменила направление и разрабатывает индивидуальные ИИ-приложения по заказам организаций, компаний и органов власти.

Теперь немецкие компании, занимающиеся разработкой ИИ, фокусируются не на масштабных моделях, а на специализированных решениях, и благодаря этому добиваются успеха на международном рынке.

Мошенница «Наташа»

А в Индии успешный на первый взгляд IT-стартап, выдававший себя за новейшую нейросеть под названием «Наташа» и привлекший миллионы инвестиций, оказался банальным мошенничеством. Вместо широко разрекламированного компанией BuilderAI искусственного интеллекта на деле программный код вручную писали около 700 законспирированных программистов-индийцев.