ocr - 第 2 | 开发者交流平台

Paddle OCR传递PDF文件进行文本检测时出现问题。

英文: Paddle OCR Issue when passing pdf file for text detection 问题我遇到了一个问题，当传递PDF文件给PaddleOCR时。我的代码是...

2023年6月15日120评论

英文: Is Using Two Custom Processors for DocumentAI Efficient? 问题从多面文件中提取数据的最佳实践是什么？我需要从身份证的正反两面提取数据...

2023年6月2日129评论

英文: How to eliminate certain words of particular height on image in tesseract ocr? 问题 I want to dele...

2023年5月25日144评论

英文: How to detect digits from image by using Tesseract 5? 问题 I installed tesseract5 on WSL (Ubuntu 2...

2023年5月17日154评论

英文: Why is Tesseract returning the wrong number here? 问题我使用Tesseract扫描从图像中裁剪出的日期。日期的格式可能是这样的：对于几乎所...

2023年4月4日149评论

英文: Paperless-ngx redo OCR for documents 问题我正在尝试重新对Paperless-ngx上的我的文档进行OCR，因为PDF中一些明显的文本丢失或未自动索引。我...

2023年3月21日210评论

英文: How to use tessedit_write_images with pytesseract? 问题 I'm using pytesseract 0.3.10 with tesserac...

2023年3月8日174评论

英文: find a text with pattern from google lens response using regex 问题我正在尝试通过上传图像从Google Lens获取学习驾驶执...

2023年3月7日163评论

英文: Extracting data from multiple PDFs 问题我有200个PDF文件，它们都有类似的格式。目前我正在打开每个PDF文件，查找两个相关的值，然后手动输入它们到Ex...

2023年3月3日111评论

英文: How to convert a Scanned PDF file using Foxit Libraries 问题我的问题简单而明确。我发现似乎没有其他人有这个问题。我坚持使用Foxit库...

2023年2月8日151评论