Tess4Jを使って、読み取った後のキャンバス(Rectangle)指定をすれば何とか読めるかと。
java
1package tess_sample;
2
3import java.awt.Rectangle;
4import java.awt.image.BufferedImage;
5import java.io.File;
6import java.io.IOException;
7
8import javax.imageio.ImageIO;
9
10import net.sourceforge.tess4j.ITesseract;
11import net.sourceforge.tess4j.Tesseract;
12import net.sourceforge.tess4j.TesseractException;
13
141517
18public class TessSample {
19
20 public static void main(String[] args) throws IOException, TesseractException {
21 BufferedImage img = ImageIO.read(new File("sample.jpeg"););
22
23 ITesseract tesseract = new Tesseract();
24 tesseract.setDatapath("."); // jpn.traineddataのディレクトリを指定
25 tesseract.setLanguage("jpn"); // 解析言語:「日本語」
26
27 String str = tesseract.doOCR(img, new Rectangle(600,300)); // RectangleでOCRで読み込む対象サイズを指定
28
29 System.out.println(str);
30 }
31
32}
pom.xml
1<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 https://maven.apache.org/xsd/maven-4.0.0.xsd">
2 <modelVersion>4.0.0</modelVersion>
3 <groupId>Java11Sampe</groupId>
4 <artifactId>Java11Sampe</artifactId>
5 <version>0.0.1-SNAPSHOT</version>
6 <build>
7 <sourceDirectory>src</sourceDirectory>
8 <plugins>
9 <plugin>
10 <artifactId>maven-compiler-plugin</artifactId>
11 <version>3.8.1</version>
12 <configuration>
13 <release>15</release>
14 </configuration>
15 </plugin>
16 </plugins>
17 </build>
18</project>
実行結果:
っ @IiNRCI
も う
ど う 広 告 し た ら い い の か
わ か ら な い の で 。
参照記事:
JavaでORC
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/02/07 19:12
2021/02/11 13:24