Исследователи из проекта African Next Voices разработали крупнейший на сегодня набор данных для искусственного интеллекта на 18 африканских языках. До этого большинство ИИ-инструментов, включая ChatGPT, работали преимущественно на английском и других европейских и китайских языках, оставляя миллионы людей без доступа к технологиям.
В течение двух лет команда записала 9 000 часов речи в Кении, Нигерии и Южной Африке, охватив повседневные ситуации в сельском хозяйстве, здравоохранении и образовании. Среди языков — кикуйю и дхолуо в Кении, хауса и йоруба в Нигерии, а также исизулу и тшивенда в Южной Африке.
Данные откроют для разработчиков, что позволит создавать инструменты для перевода, транскрипции и ответов на африканских языках. Уже сегодня фермеры и компании используют такие технологии для решения практических задач — от диагностики заболеваний растений до финансовых сервисов.