ОАЭ создали самый точный ИИ для арабского языка

ОАЭ, ИИ, арабский, Falcon, нейросеть

Ученые из Объединенных Арабских Эмиратов разработали модель искусственного интеллекта, которая лучше по результатам международных тестов справляется с арабским языком, чем более крупные зарубежные аналоги. Новая модель Falcon‑H1 Arabic, созданная Институтом технологических инноваций, показывает высокую точность и при этом требует меньше вычислительных ресурсов.

Falcon‑H1 Arabic заняла первое место в рейтинге Open Arabic LLM Leaderboard, который оценивает способность ИИ обрабатывать арабский язык. В версии с 34 миллиардами параметров она обошла более крупные модели — Llama‑70B от Meta и Qwen‑72B из Китая, несмотря на то, что ее размер менее чем вдвое меньше.

Модель обучали на данных, специально ориентированных на арабский язык, включая норму современного арабского, региональные диалекты и материалы с культурной привязкой. Благодаря этому Falcon‑H1 Arabic точнее понимает нюансы речи, ведет длинные диалоги и корректно интерпретирует контекст — задачи, с которыми традиционно испытывают трудности глобальные системы, ориентированные на английский язык.

Версия модели с 3 млрд параметров обходит в тестах Microsoft Phi‑4 Mini на 10 процентных пунктов, а версия с 7 млрд лидирует в своей категории. Самая крупная модель достигает 75,36 % точности в комплексных испытаниях по арабской лингвистике.

Falcon‑H1 Arabic обрабатывает до 192 000 слов в рамках одной сессии, что позволяет анализировать юридические документы, научные исследования или медицинские записи без потери контекста. Это открывает практические возможности: школы смогут внедрять ИИ‑репетиторов, которые действительно понимают язык и диалекты учеников, компании — автоматизировать обслуживание клиентов на родном арабском, а госструктуры — создавать диалоговые системы без искусственных переводов с английского.

Арабский язык используют более 450 млн человек в более чем 20 странах, но он долгое время оставался второстепенным в развитии ИИ. Falcon‑H1 Arabic стала одной из первых моделей, созданных с самого начала именно для арабоговорящей аудитории, а не адаптированных с английского.