перенес все накопленное для обучения из tupolev-recog.cont

This commit is contained in:
Nikita Orlov 2020-02-12 18:46:20 +03:00
parent 0c7ea419db
commit 7d178ce8a9
3 changed files with 75 additions and 0 deletions

6
.idea/vcs.xml Normal file
View File

@ -0,0 +1,6 @@
<?xml version="1.0" encoding="UTF-8"?>
<project version="4">
<component name="VcsDirectoryMappings">
<mapping directory="$PROJECT_DIR$" vcs="Git" />
</component>
</project>

7
add-fonts-to-ocr.sh Executable file
View File

@ -0,0 +1,7 @@
if [ ! -d $FONTS_DIR ]; then
echo "set FONTS_DIR envvar"; exit 1
fi
LNG_DIR=/vagrant/init/langdata/rus
text2image --find_fonts --fonts_dir $FONTS_DIR \
--text $LNG_DIR/rus.training_text --min_coverage .9 \
--outputbase $LNG_DIR/rus |& grep raw | sed -e 's/ :.*/@ \\/g' | sed -e "s/^/ '/" | sed -e "s/@/'/g" > $LNG_DIR/fontslist.txt

62
training/0base.md Normal file
View File

@ -0,0 +1,62 @@
```shell script
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example10.png stdout
Detected 4 diacritics
1-16 0ЕТ 113696-81
2-17 0СТ 113696-61
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example9.png stdout
Штамп для одсечки
контура и продивки
отверстия
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example8.png stdout
ло посабке ведущей звездочки и корзины сцепления
3 Лазы поб сегментных шпонок фрезеровать фрезой
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example7.png stdout
Вал сцепления
двигателей Д-5, Д-6,
Д-8
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example6.png stdout
ВСЧД5-8.002.000.24.01.17
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example5.png stdout
Empty page!!
Empty page!!
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example5.png stdout
Empty page!!
Empty page!!
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example4.png stdout
Стобка ("солдатик") регулировочного
Винта сцепления фёиготелео ДА-Д8
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example3.png stdout
СВО Д\-8.002.16.01.2017
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example1.png stdout
Редуктор
СВорочный чертех
СОорочный чертеж
vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example2.png stdout
Detected 9 diacritics
Прим. Установку на картере дбиготеля производить
через алюм. шадбы толщиноо 0.5-1 мм.
Фиксация относительно рычага сцепления и положение
тросика сцепления осуществляется подбором шайб
```