ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ИНХС РАН |
||
В работе предложен новый алгоритм преобразования документа с таблицами в электронный вид. Целью алгоритма является поиск таблиц на изображении документа, их классификация и определение их содержимого на основе обучающего набора таблиц. Алгоритм основан на непрерывно-морфологическом подходе. Непрерывно-морфологический подход позволяет уйти от необходимости оперировать растровыми терминами и перейти к более интуитивно понятной терминологии: линия, форма, фигура. В основе алгоритма лежит метод скелетизации.