diff --git a/README.md b/README.md index 8d4ccf4..3a8dca7 100644 --- a/README.md +++ b/README.md @@ -1,2 +1,34 @@ udk-site-parser =============== + +The program parses the tables on the website https://www.teacode.com/online/udc and receives UDC codes. We receive UDK codes in the form of a hierarchy. + +For example: +```text +00 Наука в целом (информационные технологии - 004) + 001 Наука в целом. Науковедение. Организация умственного труда + 001.1 Общее понятие о науке + 001.2 Взаимосвязь наук + 001.3 Ценность, значение, польза, место и подчинение, защита и поощрение науки + 001.4 Язык науки. Научная терминология. Номенклатура + 001.5 Научные теории, гипотезы и системы. Установление зависимости между научными фактами + 001.6 Научные знания + 001.8 Общая методология. Научные и технические методы исследований, изучения, поисков и дискуссий. Научный анализ и синтез + 001.9 Распространение знаний: факты, фантазии и фальсификации. Ограничения в распространении знаний. Сохранение знаний в тайне + 002 Печать в целом. Документация. Научно-техническая информация (НТИ) + 002.2 Печать в целом. Книговедение + 002.5 Работа органов научно-технической информации + 002.6 Центры документации. Органы научно-технической информации + 003 Системы письма и письменности. Знаки и символы. Семиотика в целом. Коды. Графическое представление мысли +``` + +**Build program** + +```shell +mvn clean package +``` +Run program + +```shell + java -jar .\jar\udk-site-parser-jar-with-dependencies.jar +``` diff --git a/jar/udk-site-parser-jar-with-dependencies.jar b/jar/udk-site-parser-jar-with-dependencies.jar new file mode 100644 index 0000000..8724a34 --- /dev/null +++ b/jar/udk-site-parser-jar-with-dependencies.jar Binary files differ diff --git a/pom.xml b/pom.xml index a6ce7ae..6965cbc 100644 --- a/pom.xml +++ b/pom.xml @@ -6,12 +6,14 @@ ru.mcs.udk udk-site-parser - 1.0-SNAPSHOT + 1.0 + jar - 23 - 23 + 21 + 21 UTF-8 + udk-site-parser @@ -26,4 +28,36 @@ 2.17.2 + + + + + maven-assembly-plugin + 3.7.1 + + + jar-with-dependencies + + ${project.basedir}/jar + ${jar.finalName} + + + true + ru.mcs.udk.UdkSiteParser + + + + + + assemble-all + package + + single + + + + + + + \ No newline at end of file diff --git a/src/main/java/ru/mcs/udk/UdkSiteParser.java b/src/main/java/ru/mcs/udk/UdkSiteParser.java index 241f2c1..486b4bd 100644 --- a/src/main/java/ru/mcs/udk/UdkSiteParser.java +++ b/src/main/java/ru/mcs/udk/UdkSiteParser.java @@ -16,7 +16,7 @@ public static void main(String[] args) throws IOException { System.setOut(new PrintStream(new FileOutputStream("udk.txt"), true, StandardCharsets.UTF_8)); - getHierarchy(HTTPS_WWW_TEACODE_COM_ONLINE_UDC, 0, 3); + getHierarchy(HTTPS_WWW_TEACODE_COM_ONLINE_UDC, 0, 50); } public static void getHierarchy(String url, int level, int stopLevel) {