Search UDK in PDF and DJVU

cmd Поправлены скрипты для скачивания файлов 10 months ago
example Поправлены скрипты для скачивания файлов 10 months ago
images Поправлены мелкие недочеты 10 months ago
program Добавлены языковые модели tesseract 10 months ago
src/main/java/ru/mcs/ udk Поправлены мелкие недочеты 10 months ago
README.md Добавлен описание. Поправлены названия классов 10 months ago
pom.xml Поправление получение УДК в djvu файлах 10 months ago
README.md

udk-pdf-scanner

Программа для поиска номеров УДК PDF и DJVU файлах.

Для распознавания используется OCR Tesseract 5 https://github.com/tesseract-ocr/tesseract

Для Windows 7, используется https://github.com/UB-Mannheim/tesseract/wiki

Для работы с djvu используется DjVuLibre https://djvu.sourceforge.net/index.html

Документация по командам https://djvu.sourceforge.net/doc/man/ddjvu.html