どうやらLinuxにはオープンソースのOCRソフト
Tesseract-OCRというものがあるようです。
これを試してみます。
こちらの記事を参考にしました。
https://kitakantech.com/tesseract-basic/
インストールは、
$ sudo apt-get install tesseract-ocr
$ sudo apt-get install tesseract-ocr-jpn
1つ目はTesseract-OCRの本体、2つ目は言語対応モジュールです。
使用方法は、こんな感じ。
$ tesseract test.jpg output -l jpn
これに対して、
読み込ませてみました。
うーん、読み込んでほしい部分が読み込まれてない。
写真だからダメなのだろうか。
たぶんスキャナで読み取った画像ならうまく読み込めるのかもしれないが。
栄養成分表をスキャナで読み取るなんて手間はありえないので、
ちょっと、この機能の実装を続けるかどうかは微妙ですな。