问题

我目前正在处理一个程序，该程序应使用OpenCV和Tessj4在图像中检测字母和数字。为此，我从https://github.com/UB-Mannheim/tesseract/wiki下载并安装了Tesseract（版本5.0.0 alpha），从http://tess4j.sourceforge.net下载了Tess4j API（版本3.4.8），并将.jar文件（tess4j-3.4.8.jar + lib文件夹中的所有.jar文件）添加到了我的项目中。

此外，我将tesseract目录（C:/Program Files/Tesseract-OCR）添加到系统路径，并将TESSDATA_PREFIX与值（C:/Program Files/Tesseract-OCR/tessdata）添加到我的环境变量中。

然而，当我尝试运行以下这4行简单的代码时，我遇到了以下错误：

Tesseract tesseract = new Tesseract();
tesseract.setDatapath("C:/Program Files/Tesseract-OCR/tessdata");
tesseract.setLanguage("eng");
System.out.println(tesseract.doOCR(new File("screen.png")));

错误消息：

Failed loading language 'eng'
Tesseract couldn't load any languages!
Exception in thread "main" java.lang.Error: Invalid memory access
   at com.sun.jna.Native.invokePointer(Native Method)
   at com.sun.jna.Function.invokePointer(Function.java:470)
   ...

但是，当我使用控制台运行tesseract程序，然后读取创建的文件内容时，一切正常运行。

Process p = Runtime.getRuntime().exec("cmd /c tesseract screen.png text -l eng");
while (p.isAlive())
   Thread.sleep(5);

BufferedReader reader = new BufferedReader(new FileReader(new File("text.txt")));
StringBuilder stringBuilder = new StringBuilder();
String line;

while ((line = reader.readLine()) != null)
   stringBuilder.append(line).append("\n");

reader.close();
System.out.println(stringBuilder.toString().trim());

有人知道如何解决这个问题吗？
谢谢，Ypselon。

英文:

I'm currently working on a program which should detect letters and numbers in an image using OpenCV and Tessj4. For that I downloaded and installed Tesseract (Version 5.0.0 alpha) from https://github.com/UB-Mannheim/tesseract/wiki, downloaded the Tess4j API (Version 3.4.8) from http://tess4j.sourceforge.net and added the .jar files (tess4j-3.4.8.jar + all the .jar files inside the lib folder) to my project.

Furthermore I included the tesseract directory (C:/Program Files/Tesseract-OCR) to the systems path and added TESSDATA_PREFIX with the value (C:/Program Files/Tesseract-OCR/tessdata) to my environment variables.

However, when I try to run this 4 simple lines of code, I get the following error:

Tesseract tesseract = new Tesseract();
tesseract.setDatapath(&quot;C:/Program Files/Tesseract-OCR/tessdata&quot;);
tesseract.setLanguage(&quot;eng&quot;);
System.out.println(tesseract.doOCR(new File(&quot;screen.png&quot;)));

Failed loading language &#39;eng&#39;
Tesseract couldn&#39;t load any languages!
Exception in thread &quot;main&quot; java.lang.Error: Invalid memory access
   at com.sun.jna.Native.invokePointer(Native Method)
   at com.sun.jna.Function.invokePointer(Function.java:470)
   at com.sun.jna.Function.invoke(Function.java:404)
   at com.sun.jna.Function.invoke(Function.java:315)
   at com.sun.jna.Library$Handler.invoke(Library.java:212)
   at com.sun.proxy.$Proxy0.TessBaseAPIGetUTF8Text(Unknown Source)
   at net.sourceforge.tess4j.Tesseract.getOCRText(Unknown Source)
   at net.sourceforge.tess4j.Tesseract.doOCR(Unknown Source)
   at net.sourceforge.tess4j.Tesseract.doOCR(Unknown Source)
   at net.sourceforge.tess4j.Tesseract.doOCR(Unknown Source)
   at app.Main.main(Main.java:41)

But when I use the console to run the tesseract program and then reading the content of the file that is created, all works properly.

Process p = Runtime.getRuntime().exec(&quot;cmd /c tesseract screen.png text -l eng&quot;);
while(p.isAlive()) 
   Thread.sleep(5);
    
BufferedReader reader = new BufferedReader(new FileReader(new File(&quot;text.txt&quot;)));
StringBuilder stringBuilder = new StringBuilder();
String line;
    
while((line = reader.readLine()) != null)
   stringBuilder.append(line).append(&quot;\n&quot;);
    
reader.close();
System.out.println(stringBuilder.toString().trim());

Does anyone know how to fix this issue?
 Thanks, Ypselon.

答案1

得分: 2

好的，我发现由于某种原因，我的语言文件损坏了。 
我只是在“C:\Program Files\Tesseract-OCR\tessdata”目录中替换了“eng.traineddata”文件。
 现在一切正常工作。

英文:

Okay I found out that for some reason my language file got corrupted. 
I simply replaced the "eng.traineddata" file inside the "C:\Program Files\Tesseract-OCR\tessdata" directory.
 Now all is working properly.

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

Tesseract加载语言失败（Tess4j / Java / Netbeans）

问题

答案1

将1维数组复制到2维数组的一行中

Testing with functions passed to a mock object

为什么 Kafka 生产者在第一条消息上非常缓慢？

为什么 BoundService 为空？

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论