В Бурятии завершён первый этап создания уникального цифрового ресурса — аудио-дата-сета бурятского языка. Проект реализован Республиканским центром «Бэлиг» при поддержке Дома народов России и компании «Яндекс».
Собранные записи живой устной речи станут основой для обучения систем автоматического распознавания и синтеза речи. Это откроет путь к созданию голосовых помощников, виртуальных ассистентов, инструментов автоматической транскрипции и образовательных программ на бурятском языке.
Сейчас начинается важнейший этап экспертной проверки материалов. Специалисты центра проведут верификацию записей, отберут наиболее качественные образцы и подготовят данные для обучения нейросетей.