diff --git a/.gitignore b/.gitignore new file mode 100644 index 0000000..1174595 --- /dev/null +++ b/.gitignore @@ -0,0 +1,2 @@ +.vagrant +.idea diff --git a/README.md b/README.md index e69de29..ed5ff33 100644 --- a/README.md +++ b/README.md @@ -0,0 +1,10 @@ +# Tesseract OCR Vagrant Box + +## First UP + +```shell script +vagrant plugin install vagrant-vbguest +vagrant vbguest +vagrant up +``` + diff --git a/Vagrantfile b/Vagrantfile index 94632d8..35d1021 100644 --- a/Vagrantfile +++ b/Vagrantfile @@ -9,13 +9,13 @@ Vagrant.configure("2") do |config| config.vm.provider :virtualbox do |vb| vb.customize ["modifyvm", :id, "--natdnshostresolver1", "on"] # Display the VirtualBox GUI when booting the machine - # vb.gui = true + #vb.gui = true # Customize the amount of memory on the VM: - vb.memory = "4096" + vb.memory = 2048 # Use 1 CPUs - vb.cpus = 4 + vb.cpus = 2 end config.vm.network "forwarded_port", guest: 8000, host: 8001, auto_correct: true @@ -23,7 +23,6 @@ Vagrant.configure("2") do |config| config.vm.network "forwarded_port", guest: 5000, host: 5001, auto_correct: true config.vm.synced_folder ".", "/vagrant" - config.vm.provision "shell", privileged: true, path: "./provision.sh" # Error: diff --git a/provision.sh b/provision.sh index 4dab673..9640c12 100644 --- a/provision.sh +++ b/provision.sh @@ -1,8 +1,16 @@ +# Fix X11 forwarding +echo "X11UseLocalhost no" >> /etc/ssh/sshd_config +echo "AddressFamily inet" >> /etc/ssh/sshd_config +systemctl restart ssh.service +env|grep DISPLAY + +# echo "%vagrant ALL=(ALL) NOPASSWD: ALL" > /etc/sudoers.d/vagrant -export DEBIAN_FRONTEND=noninteractive -export PATH=$PATH:/home/vagrant/local/bin +export PATH=$PATH:$HOME/local/bin +echo "PATH=$PATH:$HOME/local/bin" >> $HOME/.bashrc # зависимости +export DEBIAN_FRONTEND=noninteractive apt-get update apt-get install -y htop nano libsm6 libxext6 libxrender-dev \ libicu-dev libpango1.0-dev libcairo2-dev g++ autoconf automake \ @@ -11,7 +19,7 @@ apt-get install -y htop nano libsm6 libxext6 libxrender-dev \ # Устанавливаем чертежные шрифты в систему export FONTS_DIR=/usr/local/share/fonts -echo "export FONTS_DIR=$FONTS_DIR" >> /home/vagrant/.bashrc +echo "export FONTS_DIR=$FONTS_DIR" >> /etc/profile cp /vagrant/fonts/* $FONTS_DIR chmod -R 644 $FONTS_DIR fc-cache -v @@ -22,12 +30,26 @@ wget https://github.com/tesseract-ocr/tesseract/archive/4.1.1.tar.gz tar -zxvf 4.1.1.tar.gz cd /tesseract-4.1.1 || exit 1 mkdir -p $HOME/local/include $HOME/local/lib/pkgconfig + export PKG_CONFIG_PATH=$HOME/local/lib/pkgconfig +echo "export PKG_CONFIG_PATH=$HOME/local/lib/pkgconfig" >> /etc/profile + ./autogen.sh LIBLEPT_HEADERSDIR=$HOME/local/include ./configure \ --prefix=$HOME/local/ --with-extra-libraries=$HOME/local/lib make make install +export LD_LIBRARY_PATH=$HOME/local/lib +echo "LD_LIBRARY_PATH=$HOME/local/lib" >> /etc/profile + +make training +make training-install + +export TESSDATA_PREFIX=/tesseract-4.1.1/tessdata +acho "export TESSDATA_PREFIX=/tesseract-4.1.1/tessdata" >> /etc/profile +cd /tessdata +wget https://github.com/tesseract-ocr/tessdata_best/raw/master/rus.traineddata + diff --git a/training/0base.md b/training/0base.md deleted file mode 100644 index 07855f5..0000000 --- a/training/0base.md +++ /dev/null @@ -1,62 +0,0 @@ -```shell script -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example10.png stdout -Detected 4 diacritics - - -1-16 0ЕТ 113696-81 -2-17 0СТ 113696-61 - - - -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example9.png stdout - - -Штамп для одсечки -контура и продивки -отверстия - -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example8.png stdout -ло посабке ведущей звездочки и корзины сцепления -3 Лазы поб сегментных шпонок фрезеровать фрезой - -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example7.png stdout -Вал сцепления -двигателей Д-5, Д-6, -Д-8 - -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example6.png stdout -ВСЧД5-8.002.000.24.01.17 - -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example5.png stdout -Empty page!! -Empty page!! - -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example5.png stdout -Empty page!! -Empty page!! - -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example4.png stdout - - -Стобка ("солдатик") регулировочного -Винта сцепления фёиготелео ДА-Д8 - -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example3.png stdout -СВО Д\-8.002.16.01.2017 - -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example1.png stdout -Редуктор -СВорочный чертех - -СОорочный чертеж - -vagrant@debian10:/vagrant$ tesseract -l rus data/ocr/example2.png stdout -Detected 9 diacritics -Прим. Установку на картере дбиготеля производить -через алюм. шадбы толщиноо 0.5-1 мм. - -Фиксация относительно рычага сцепления и положение -тросика сцепления осуществляется подбором шайб - - -``` \ No newline at end of file diff --git a/training/example1.jpg b/training/example1.jpg new file mode 100644 index 0000000..58f3f0f Binary files /dev/null and b/training/example1.jpg differ