![]() |
ИСТИНА |
Войти в систему Регистрация |
ИСТИНА ИНХС РАН |
||
База данных предназначена для сбора, хранения и обработки электронных цифровых материалов, содержащих изображения рукописного текста. База данных наполнена индексами, созданными из документов, содержащих значительное количество связного текста без выделенного текстового слоя. Индекс построен на основе сочетания распознавания рукописного текста с поиском текстовых пересечений. Из изображения выделяется информативный слой, учитывающий особенности написания текста - вручную, без возможности автоматической проверки грамотности, и неточность распознавания символов, вызванной индивидуальностью почерка и отклонениями при превращении исходного рукописного текста в цифровой файл. Изображения в базе данных хранятся в специальном виде, подготовленном для поиска заимствованных фрагментов текста в проверяемых материалах, с учетом различных условий получения изображений, либо имеющих искажения. Доступ к информации, полученной из базы данных, предоставляется только авторизованным пользователям, имеющим права на работу с функционалом поиска заимствованных изображений. Тип ЭВМ: IBM PC-совмест. ПК; ОС: Ubuntu 20.04 LTS и выше.