Newer
Older
udk-pdf-scanner / windows.cmd
@echo off
setlocal enabledelayedexpansion

:: Пути
set "ROOT_DIR=%~dp0"
set "WGET=%ROOT_DIR%program\wget.exe"
set "TARGET_DIR=%ROOT_DIR%windows"
set "TESSDATA_DIR=%TARGET_DIR%\tessdata"

:: 1. Создаем папку windows
if not exist "%TARGET_DIR%" mkdir "%TARGET_DIR%"

:: 2. Скачиваем Tesseract 5.5.0
echo Загрузка Tesseract...
"%WGET%" -O "%TARGET_DIR%\tesseract.exe" "https://github.com/tesseract-ocr/tesseract/releases/download/5.5.0/tesseract-ocr-w64-setup-5.5.0.20241111.exe"

:: 3. Установка Tesseract в портабельном режиме (если требуется)
:: Примечание: Для реальной портабельности используйте ZIP-архив, но здесь пример с установщиком
:: start /wait "" "%TARGET_DIR%\tesseract.exe" /SILENT /DIR="%TARGET_DIR%"

:: 4. Создаем папку для языковых пакетов
if not exist "%TESSDATA_DIR%" mkdir "%TESSDATA_DIR%"

:: 5. Скачиваем языковые пакеты (ru и en)
echo Загрузка русской языковой модели...
"%WGET%" -O "%TESSDATA_DIR%\rus.traineddata" "https://github.com/tesseract-ocr/tessdata/raw/main/rus.traineddata"

echo Загрузка английской языковой модели...
"%WGET%" -O "%TESSDATA_DIR%\eng.traineddata" "https://github.com/tesseract-ocr/tessdata/raw/main/eng.traineddata"


echo Готово! Портабельная версия создана в:
echo %TARGET_DIR%