源文鉴查重——Word和PDF检测出的结果为什么不同?

发表时间:2022-05-20 20:25:23

最近有同学提出,使用的源文鉴查重系统进行论文查重,同样的论文提交查重系统时,分别的提交了Word文档和PDF的文档,会发现源文鉴查重对于Word文档的检测结果和PDF的文档的检测不同,这是什么原因呢?哪一份检测报告更为准确呢?

1、其实在很多人的意识当中大家会觉得PDF的话会越来越适用,其实PDF的话在专业性上面是会比较好一点,但是在查重上面的话是不占据优势的。论文提交源文鉴查重时,Word格式论文当中的图片和公式系统是不检测的,而PDF格式论文当中的图片和公式系统会先转化成文本然后再进行检测,那么转化以后的内容和论文的原文是有很大差别的,还会可以会被源文鉴查重系统当做重复。

2、论文提交源文鉴查重时,Word文档会发现论文里面的表格、脚注以及参考文献等内容如果出现和其他文章雷同的情况下,系统会自己忽略掉。但是PDF文档查出来的内容重复率可能会大大增加,可以说是因为Word格式较PDF拥有标准的参考文献格式和自动生成目录,检测系统会更加细致准确得分模块进行检测。

3、在源文鉴查重进行Word文档和PDF文档查重时,PDF文档的论文会更加容易出现错误,可能会造成查重系统对论文中的某些代码无法解析而出现检测失败,也可能会出现乱码或者检测结果为空的情况。

4、源文鉴查重系统对于Word文档及PDF文档检测时会发现,Word版本在系统中是直接进行检测的,而PDF格式在系统中需要先转化成文本,不仅对格式会有影响,而且检测时间比Word明显也会久一些。

综合以上所述,会发现Word版本比PDF版本更加准确。除非学校有明确要求提出检测时必须提交PDF文档的论文,否则尽量不要采用PDF进行论文查重,可将自己PDF的文档转换成一下再进行查重,Word一定会是最好的选择。

本网站部分文章转载自互联网以及作者的分享,如本网站所引用的文章涉及著作权问题, 请您及时通知本站,我们将及时妥善处理。