Search UDK in PDF and DJVU

cmd Поправлены скрипты для скачивания файлов 8 months ago
example Поправлены скрипты для скачивания файлов 8 months ago
images Поправлены мелкие недочеты 8 months ago
program Добавлены языковые модели tesseract 8 months ago
src/main/java/ru/mcs/ udk Поправлены мелкие недочеты 8 months ago
README.md Добавлен описание. Поправлены названия классов 8 months ago
pom.xml Поправление получение УДК в djvu файлах 8 months ago
README.md

udk-pdf-scanner

Программа для поиска номеров УДК PDF и DJVU файлах.

Для распознавания используется OCR Tesseract 5 https://github.com/tesseract-ocr/tesseract

Для Windows 7, используется https://github.com/UB-Mannheim/tesseract/wiki

Для работы с djvu используется DjVuLibre https://djvu.sourceforge.net/index.html

Документация по командам https://djvu.sourceforge.net/doc/man/ddjvu.html