一个开源的为扫描的PDF文件添加OCR文本层的工具,使其能够被搜索和复制。
该工具利用Tesseract OCR引擎,支持多种语言的文本识别,并能够生成符合PDF/A标准的文件。
不仅能保持原始图像的分辨率,还能在不干扰其他内容的情况下插入OCR信息。
项目地址:https://github.com/ocrmypdf/OCRmyPDF
一个开源的为扫描的PDF文件添加OCR文本层的工具,使其能够被搜索和复制。
该工具利用Tesseract OCR引擎,支持多种语言的文本识别,并能够生成符合PDF/A标准的文件。
不仅能保持原始图像的分辨率,还能在不干扰其他内容的情况下插入OCR信息。
项目地址:https://github.com/ocrmypdf/OCRmyPDF
您猜对了答案,下面是向您展示的隐藏信息:
猜错啦:您选中的是「」,正确答案是:「」
·已选
已选·
请先登录!
登录之后回答问题,请先登录!