Применение методов машинного обучения для задачи распознавания русских дореволюционных печатных текстов - дипломная работа | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Научный руководитель: Ершов Н.М.
Автор: Федоров В.В.
Тип: Бакалавр
Организация, в которой проходила защита: МГУ имени М.В. Ломоносова
Год защиты: 2022
Аннотация: Данная работа посвящена возможностям применения технологий машинного обучения для распознавания печатных русских текстов XIX века. Был проведен обзор этапов работы OCR-программы и способов их реализации, произведено сравнение существующих программных продуктов – как свободно распространяемых, так и проприетарных – на качестве распознавания дореволюционных текстов. Также была обучена собственная модель при помощи платформы Tesseract, которая продемонстрировала значительные улучшения в качестве по сравнению с исходной моделью. Наконец, был создан графический интерфейс для выбора изображения с текстов и наглядного сравнения исходной страницы с полученным распознанным текстом.
Добавил в систему: Ершов Николай Михайлович

	ИСТИНА	Войти в систему Регистрация
	ИСТИНА ИНХС РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИСТИНА ИНХС РАН

Применение методов машинного обучения для задачи распознавания русских дореволюционных печатных текстовдипломная работа (Бакалавр)