Tesseractは光学文字認識エンジンで、これに限らずオープンソースのソフトウェア使うとき全般に言えることなのですがそこで提供されているメソッド(?)やその使い方はGithubのどこに書かれていたりするのでしょうか?
例えばこちらはTesseractのリポジトリで、YouTubeのTesseractを使ったPythonによる光学文字認識入門動画で以下のようなコードを書いたのですが、そこでの文字認識の結果があまり良くなかったためこちらの記事にあるような「エンジンの切り替え」を行ってみたいのですがGoogle Colab上でどう行えるのかがわかりません。ローカルで行ってる記事が多く、Google Colab上では行えないのでしょうか?知見をお持ちの方、ぜひよろしくお願いいたします。
from PIL import Image import pyocr import cv2 img1 = Image.open('drive/My Drive/Colab Notebooks/sample.jpg') tools = pyocr.get_available_tools() tool = tools[0] # tesseract_layoutには0から13までの14種類のアルゴリズムを指定できるらしい txt1 = tool.image_to_string(img1, lang='eng+jpn', builder=pyocr.builders.TextBuilder(tesseract_layout=11)) print(txt1)