Ученые из Объединенных Арабских Эмиратов разработали модель искусственного интеллекта, которая лучше по результатам международных тестов справляется с арабским языком, чем более крупные зарубежные аналоги. Новая модель Falcon‑H1 Arabic, созданная Институтом технологических инноваций, показывает высокую точность и при этом требует меньше вычислительных ресурсов.
Falcon‑H1 Arabic заняла первое место в рейтинге Open Arabic LLM Leaderboard, который оценивает способность ИИ обрабатывать арабский язык. В версии с 34 миллиардами параметров она обошла более крупные модели — Llama‑70B от Meta и Qwen‑72B из Китая, несмотря на то, что ее размер менее чем вдвое меньше.
Модель обучали на данных, специально ориентированных на арабский язык, включая норму современного арабского, региональные диалекты и материалы с культурной привязкой. Благодаря этому Falcon‑H1 Arabic точнее понимает нюансы речи, ведет длинные диалоги и корректно интерпретирует контекст — задачи, с которыми традиционно испытывают трудности глобальные системы, ориентированные на английский язык.
Версия модели с 3 млрд параметров обходит в тестах Microsoft Phi‑4 Mini на 10 процентных пунктов, а версия с 7 млрд лидирует в своей категории. Самая крупная модель достигает 75,36 % точности в комплексных испытаниях по арабской лингвистике.
Falcon‑H1 Arabic обрабатывает до 192 000 слов в рамках одной сессии, что позволяет анализировать юридические документы, научные исследования или медицинские записи без потери контекста. Это открывает практические возможности: школы смогут внедрять ИИ‑репетиторов, которые действительно понимают язык и диалекты учеников, компании — автоматизировать обслуживание клиентов на родном арабском, а госструктуры — создавать диалоговые системы без искусственных переводов с английского.
Арабский язык используют более 450 млн человек в более чем 20 странах, но он долгое время оставался второстепенным в развитии ИИ. Falcon‑H1 Arabic стала одной из первых моделей, созданных с самого начала именно для арабоговорящей аудитории, а не адаптированных с английского.




