pdf转换成word后乱码怎么办?网络上有一些PDF材料,你可以复制它们的内容,但是粘贴到word或者text里就是一堆乱码。可以用转换软件转换一下,有些文件不会乱码,但有些文件还是乱码。
我们做什么呢今天为了帮助你,我亲自演示了pdf转换成word后解决乱码的步骤。希望你能学会。
工具/原材料:
Adobe reader/Adobe acrobat pro软件
PDF 6/7 software for solid state converter
ABBYY finereader 9 /10软件
pdf转word后解决乱码的步骤:
首先,我们需要了解这个转换是关于什么的。
首先,我们使用Adobe reader或Adobe acrobat Pro软件打开带有乱码的PDF文件。
然后在菜单栏中,在文件-属性-字体下,我们可以看到文件中是否嵌入了很多字体。
我们在这里找到了一个文件作为例子:
在读取嵌入字体时,如果没有嵌入字体,那么读取的字体在您的系统中显示,但WORD
该文件直接读取系统中的字体,所以如果您的PDF文件中嵌入的一种或几种字体在您的操作系统中。
否,那么转换后的word文件一般会出现乱码。
图中本文档使用的字体是文件中嵌入的字体。由于PDF文件可以嵌入字体,因此您可以打开PDF文件。
[!--empirenews.page--]
知道为什么转换后会出现乱码后,我们现在找一个转换软件来测试转换结果。这里我们用AnyBizSoft PDF Converter 2.5来测试一下。
转换后,我们打开word文件,看看它是否是乱码。
我截取了其中一个典型的页面。可以看看和原PDF的对比。转换成word后就是一堆乱码。
接下来,我们切换到一个转换软件,我们使用固体转换器PDF 6/7软件。
这个转换软件是一个非常强大的PDF转换软件,转换效果好,排版好。在过去,
在转换的使用过程中,发现这个软件可以自动替换PDF中嵌入的一些字体,从而解决一些转换文件。
乱码问题,但是这个软件不能解决所有乱码问题,有时候会乱码。
我惊讶地发现,虽然没有原来那么工整,但也没有乱码。
如果你用这个软件处理,它不是乱码,那么我们的目的就达到了。如果用这个软件转换,还是乱码。
那我们继续吧。
如果实体转换器PDF无法解决,那么我们只能使用ABBYY finereader这个软件对这个PDF进行OCR识别。
[!--empirenews.page--]
软件界面的设置如下:
转变的过程:
如果中间出了问题,会有提示。
转换后,我们打开转换后的单词,截图。看效果:
效果挺好的~ ~ ~乱码解决了~ ~ ~而且效果甚至比Solid Converter PDF还要好。
总结:ABBYY finereader几乎可以解决PDF到WORD乱码的所有问题,只要文件清晰度还可以。市面上有很多OCR识别软件。
不过ABBYY finereader的混合识别能力和页面留存能力是我见过最好的~ ~ ~,所以推荐大家~ ~
注意事项:
OCR识别存在一定的错误率,这与被识别文件的清晰度和分辨率有关。文件分辨率高,准确率就高,反之,准确率就低。
记得用ABBYY finereader转换后检查原始PDF内容。
我碰到过一个PDF单词表,上面有音标。不管用什么软件转换,其他内容都是正确的,但是音标总是乱码。在这种情况下,请下载金山音标字体并安装在您的操作系统中。
然后你可以再次转换PDF文件,这将是一个完美的解决方案。