今天工作时,想将PDF文件中的文字拷贝出来,先试了直接复制粘贴功能,结果粘贴到WORD中变成了乱码,如图1和2所示。
图1 复制PDF中的文字
图2 粘贴到WORD中的文字
想将PDF转成WORD版本,可恶的WPS要求必须开通会员,见图3. 感觉不常用,没必要开通会员。
图3 WPS将PDF导出为WORD后必须开通会员
想到了VX有文字识别的功能,就截图,将图片发送到VX中,用手机上的VX进行文字识别,结果出来的又是一堆乱码,跟直接复制粘贴差不多,见图4.
图4 VX识别出的文字
以前使用VX的这个功能一直没有问题,这次却出现了问题,觉得可能是和图片上的特殊符号有关,去掉了前面的中括号,还是不行;再去掉图片上的英文,只识别中文,这次可以了。但是参考文献都是中英文交替出现的,要是一篇一篇识别,太麻烦了。
正在一筹莫展之际,想到QQ有提取图片中文字的功能,就抱着试试看的态度尝试了一下,结果,太让人惊喜了,整张图片识别毫无问题!正确率接近百分之百!见图5和6.
图5 QQ提取图片中的文字
图6 QQ从图片中提取的文字与原文对比
这个功能对于需要写论文,查资料的学生来说,简直太有用了!
感觉还是大马给力,知道学生的不易,在这里留了一个小小的宝库!