- 打开汉王软件,加载需要识别的PDF文件。
- 点击“识别”按钮,系统会自动识别出页面,并将它们分成独立的文件。
- 选定第一页面,按下Shift键同时拖动至最后一页面,此时识别出来的所有页面都将被选中。
- 按下快捷键F8启动识别过程,它会搜索指定路径下的图像文件夹。
识别完成后,系统将自动识别出图像文件所在的目录(My Documents/My Hwdoc Files/HWPDFOCR80/IMAGE),然后创建一个新的纯文本文件(如命名为:合并.txt),并将所有的图像文件**到该新文件中,运行此批处理文件,它会在当前目录下找到所有单独的TXT文件,并将其组合成一个完整的TXT文件,记得只执行一次即可,避免重复操作导致信息丢失。
0
