
Москвичи более 20 млн раз воспользовались порталом «Поиск по архивам», который приступил к работе в 2023 году. Появилось свыше 5,4 млн страниц исторических материалов из Главархива Москвы и др. По словам заместителя мэра по вопросам социального развития Анастасии Раковой, стало проще находить историю семьи, была облегчена работа ученых и журналистов.
Портал это сервис Яндекса, который помогает находить упоминания людей, населенных пунктов и событий в расшифрованных нейросетью рукописных документах XVIII-XX веков.
«На протяжении нескольких последних лет запросы, связанные с поиском предков и исследованием прошлого семьи, оказываются одними из самых популярных в Главархиве Москвы. Это особенно заметно в Год семьи. Мы стремимся помочь жителям в столь важном деле и ищем способы сделать доступ к документам проще. Так, несколько лет назад мы открыли онлайн-сервис "Моя семья" и разместили в нем оцифрованные метрические книги — документы, содержащие сведения о рождении, браке и смерти москвичей и жителей Московской губернии разных вероисповеданий. На основе ресурса "Моя семья" нейросеть "Поиска по архивам" училась читать рукописные тексты. За год работы сервиса к порталу обратились более 20 миллионов раз, что говорит о его популярности и необходимости. Сама же нейросеть проанализировала свыше 10 миллионов страниц исторических документов», - отметила Ракова.
Упрощена работа историков, социологов, демографов и др. Сотрудники Соцкомплекса столицы отметили, что работать с документами можно так же, как с поиском Яндекса.
Загружены документы 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и др. Всего нейросеть узнала свыше 60 тысяч рукописных и печатных текстов середины XVIII — начала XX веков.
Есть 3,6 млн оцифрованных страниц периодических изданий, например, газет «Советский спорт» и «Вечерняя Москва».
Технология строится на оптическом распознавании символов. Нейросеть замечает устаревшие знаки, берет во внимание особенности почерка и быстро преобразует такие записи в печатный текст.