ИИ расшифровывает крупнейшее собрание еврейских рукописей

искусственныйинтеллект, рукописи, нейросеть, гениза, иврит

Нейросеть восстанавливает биографии, переписки и бытовые подробности повседневной жизни еврейской общины средневекового Ближнего Востока. По словам одного из руководителей проекта, Даниэля Стокля Бен Эзры, «это возможность воссоздать, по сути, „средневековую соцсеть“».

Архив из Каирской генизы насчитывает более 400 тысяч текстов на иврите, арабском, арамейском и идише. Это крупнейшее в мире собрание еврейских документов, созданных в период с X по XIX века.

Несмотря на многолетние усилия исследователей, до наших дней расшифровано лишь около 10% материалов. Теперь благодаря проекту MiDRASH команда ученых обучает нейросети распознавать древние почерки и восстанавливать тексты по фрагментам, что значительно ускоряет работу.

В качестве примера исследователи приводят письмо вдовы из Иерусалима, написанное на идише в XVI веке и адресованное сыну в Египте. Его ответ, размещенный на полях письма, рассказывает о распространении чумы в Каире.

Проект финансирует Европейский исследовательский совет, в нем участвуют специалисты из нескольких стран. Тексты обрабатывают с использованием цифрового архива библиотеки, а расшифровки проверяют специалисты для уточнения результатов и дальнейшего улучшения алгоритмов.

Гениза в синагоге Бен-Эзра в Каире, где обнаружили документы, сохранилась благодаря сухому климату. Среди находок — религиозные и деловые документы, а также тексты, написанные философом Маймонидом.