知网查重几个字算抄袭?由于检测系统是按字符数计算,故网上有大神总结是13个字符相同就算抄袭。其实它的算法并非简单连续13个字符算抄袭,它是采用语义解析的模糊算法判断抄袭。此外,知网查重报告总字数时常变多!那么,知网查重几个字算抄袭?一起了解一下吧!
一、知网查重几个字算抄袭
知网在检测一篇论文的时候,是把论文根据目录进行分章的,像期刊这样没有目录的文章就会直接进行检测,检测系统会已段落为段位和茫茫多的数据库进行对比,如果系统检测出连续十三个字以上重复,系统则会判段这段话为抄袭。知网在这些年的发展是非常之迅速的,其收录的文献资料也在不断的增多,其检测科技也在不断的提高,同学们如果只是简单的把十三个字以上简单的调整顺序,很大几率上也是通不过的。
二、知网查重是13个字还是字符
知网查重系统“连续13个字符重复会被计入重复率”的说法是不准确的。中国知网查重从来没对其查重算法给出过定义,因为查重系统的目的是“防止学术不端行为”,所以查重算法是不可能公开的,这种以某个最小单位进行循环对比的查重算法也是最低级的算法,不可能正确。其实知网采用的是语义解析的模糊算法,对整片论文构架进行解析,按近似度进行重复率识别。所以报告单中很多并不完全一致的句子,被系统认定为重复。
三、知网查重字数变多了
总字数变多有这么几点:第一点,知网查重计算的总字数是Word统计里的字符(计空格),并不是单纯的Word统计里的字数。第二点,知网查重时表格里面的内容也会算字数,而简单的Word统计的时候一般表格统计不到字数。第三点,每篇文章基本都会有英文摘要或者英文参考文献,和中文对比,英文更占字符数了。一个字母就是一个字符,而Word统计的时候是一个单词算一个字。
小结:知网查重几个字算抄袭?系统并非简单的按几个字算抄袭,它是根据语义解析判断抄袭的,对于连续13个相同算抄袭仅仅是江湖传说。此外,知网查重报告中的总字数变多是因为计算方式与Word不同。以上是“知网查重几个字算抄袭”全部内容。