论文反查重各种攻略
知己知彼:
一.论文思路相同算抄袭么?
1.在学术上,算是借鉴,但是如果没有创新点,是没有学术价值的,没有意义的论文和研究。
2.在抄袭检测中,如果论文思路相同,软件是查不出来的。
所以,思路相同,文字不同,也是大部分人避过论文抄袭检测的有效手段。
二:硕士论文检测是如何运作的?
1.提交完整版的论文word文档
2.系统对标注格式的文档进行分章
3.每一章节独立检测抄袭率
4.对引用的参考文献进行处理,剔除参考文献部分
5.计算全文抄袭率,并标注
6.检测不出繁体字论文
三.知网论文检测
1、对格式的要求
知网学位论文检测为整篇上传,格式对检测结果可能会造成影响,需要将最终交稿格式提交检测,将影响降到最小,此影响为几十字的小段可能检测不出。都不会影响通过。系统的算法比较复杂,每次修改论文后再测可能会有第一次没测出的小段抄袭(经2 年实践经验证明,该小段不会超过200 字,并且二次修改后论文一般会大大降低抄袭率)
2、对比库
对比库为:中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,中国重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,个人比对库,其他比对库, 部分书籍不在知网库,检测不出抄袭。知网库是国家指定的论文检测对比库,国家指定高校论文检测系统为知网学位论文检测系统,该系统是目前效果最好、范围最广的官方检测系统,所有高校都是知网的检测系统,这是教育部出于全国学术不端公平性考虑而实施的。
3、关于分段和分章出结果
上传论文后,系统会自动检测该论文的章节信息,如果你学校的目录设置符合知网系统内置的分章判断条件,系统就会按章检测,分章出结果,否则会分段出结果。关于分段或分章主要涉及4 中的阀值。不论是分章还是分段,保持和学校一致即可。
4、引用的能检测出来吗?
有的同学问:“我明明引用了别人的段落或句子,为什么没有检测出来?”也有的同学问:“我的引用标注了出处,为什么还算抄袭?”首先,引用算不算抄袭,与标注出处没有任何关系,引用能不能检测出来,与系统准不准确也没有关系。所有这些都靠系统的阀值来决定。中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为3%,以段落(或章节)的字数来计算,单篇文献低于3%的抄袭或引用是检测不出来的,这种情况常见于大段文字中的小句或者小概念。举个例子:假如检测段落1(第一章)有10000 字,那么引用A 文献300字(10000 乘以3%=300)以内,是不会被检测出来的。若引用B文献超过300字,那么B文献分布于第一章中的抄袭都会被红字标注,不管位于第一章何处,即使打断成句子,只要超过20字就会被标注。①实际上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。②关于一些同学问引用的为什么也算抄袭,这里主要是因为知网的阀值问题,高于3%的统一算抄袭,也就是说引用于抄袭的临界就在3%之间。一旦你超标,即使你标注了引用也无济于事。所以请同学们注意。我们举例说明:某篇论文第一章有5000 字,那么第一章中,我们就只能引用A文献150 字以下,否则会被系统认为是抄袭。第二章4000 字,那么我们只能引用A 文献120字以下,否则会被系统认为是抄袭。第三章8000 字,第四章7000 字,分别为240 字以下和210 字以下,以此类推。综上所述,引用超标的计算方式是按章计算,这与抄袭的计算方式是一样的。
5、系统对一句话怎么才算抄袭?
一篇论文的抄袭怎么才会被检测出来?知网论文检测的条件是20字单位以上的相似或抄袭都会被红字标注,但是必须满足4里面的前提条件:即你所引用或抄袭的A 文献文字总和在你的各个检测段落(各章)中要达到3%。
引用:
6、抄袭的修改方式
针对标红文字的修改方式除了3中提到的外,还有改词、换句、改变描述方式(变原句为倒装句、被动句、主动句等)、打乱段落顺序、删除关键词汇、关键句等。经过实践证明,使用以上方法结合,可有效降低复制比,保证顺利通过。
总体来说,我们需要在保证修改后句子通顺的前提下,尽量和原句在字面上保持不同。
例1:例如下句:
过热故障中的过热与变压器正常运行下的发热是有区别的,正常运行时的其发热源来自于绕组和铁芯,即铜损和铁损,而变压器过热故障是由于受到有效热应力而造成的绝缘加速劣化,它具有中等水平的能量密度。
几乎被标红,说明与相似文献存在重合和高度相似,经过以上方式结合,本句可改为:
过热故障中出现的过热容易与变压器正常运行下的发热相混淆,后者是因为其绕组和铁芯会出现铜损和铁损的现象,这是正常运行过程中的发热,而变压器过热故障是受到有效热应力造成的绝缘加速劣化,
① 这里所指的300 字是一个大概值,并非临界值。引用的数量越低,就越不容易被检测出来。
② 更新以后的CNKI 学术不端检测系统将这一阀值调整到了3%,以前是5%,意味着检测系统对引用的要求更加严格,但运用我们后面提到的方法也不是很难。具有中等水平的能力密度。
这样修改几乎可以降低抄袭率一半。
例2:在看下面一个例句:
3.7.1.2 在透明水杯的清水中放入少量纤维进行搅动,便可以直观地发现纤维呈立体悬浮状乱向分散,且长时间放置都不会有太大变化,说明合成纤维的质量较好;质量差的纤维经搅动后可能分散,但时隔不久便会上浮为一絮状层。质量差的纤维在混凝土的实际配制过程中多不易均匀分散。
本段完全被标红,修改方式只有一种,就是打乱顺序,重新组织。
3.7.1.2 将少量纤维放入盛装清水的透明容器中,边搅动边观察纤维变化情况,如果合成纤维质量较好,那么就可以直观地看到纤维呈立体悬浮状分散,随着时间的推移,位置也不会发生明显的变化;若合成纤维质量较差,那么搅动的过程中,纤维可能分散,并且容易上浮形成絮状层。质量差的纤维在混凝土的实际配制过程中多不易均匀分散。
例3:下句:
对施工单位或业主提出的设计变更要求要进行统筹考虑,确定其必要性,同时将设计变更对施工工期和费用的影响进行全面分析,非改不可的要调整施工计划,以尽可能减少对工程的不利影响。
修改为:
施工单位或业主一旦提出设计变更要求,要进行统筹考虑,考察变更的必要性,同时,将设计变更对施工工期、费用等方面可能造成的影响进行全面而科学的分析,遇到非改不可的变更要调整施工计划,尽可能将其对工程的不利影响降到最小
百战不殆:
一.如何应对高校论文相似度检测
估计是最近学术抄袭的现象过于严重了,现在一大部分高校整了一个论文反抄袭检测系统,用的是CNKI知网的论文库,只要你的毕业论文存在抄袭现象,它就会给你检测出来,严重影响了广大学生毕业论文的顺利通过,破坏了社会的和谐。
要对付这个系统,首先要了解它的运行原理。通过分析我砸银子得出的检验报告,可以了解到这个检测系统,不是简单的把你的文章和他论文库进行对比,现在的学生也不傻,抄完文章,都是改句话,改个词,加几个字什么的,单用word查找似的对比方法,肯定查不出来。这个系统缺德带冒烟的地方就在于它是把你的文章按一定字数分段,然后把每段里面的汉字统计下来,跟论文库里的文章进行对比,只要相同的汉字达到一定的比率,就在你文章与库里文章连续重复较多的位置给你画出红线算抄袭了。根本不在乎你文字的顺序,就比如说你把你抄的一个段落整个打散了,每句话分别放在不同的段落里,也全都能给查出来。
但这个系统也是有弱点的,首先它有一定的查找范围,也就是它的论文库有限。去年这个系统能检测到CNKI知网里的抄袭内容,对从书上和网上抄的内容根本检测不出来。不过今年变化了,根据最新的检测报告,这缺德系统现在连书上的文章也可以检测出来了,网上的东西也可以检测的到。但是从外国网站dnowload来的英文文章在翻译成汉语后,还是检测不出来。
所以对付这个系统,如果你的学科在自然科学领域,那就简单了,直接去外国的网站找论文,然后自己或者找人翻译过来,把作者名字换成自己,抄上就OK了。但是社科类学科,尤其是我这个专业的就倒了血霉了,万恶的资本主义国家没有研究这个的,朝鲜估计可能研究这个,但是棒子文我看不懂。这就需要一定的技巧了,在抄文章时,最好从不同的文章里抄取(在检测系统里这叫多元抄取),然后记好自己每短话抄袭的文章,例如1段抄自A文章,2段抄自B文章,C段…….然后在论文整体抄袭完毕后,去学校(有的学校不给个人检,比如长春某高校)或者网上花钱检测一下(不要在乎钱,延期答辩带来的损失要远比这点钱多的多)。如果检测系统准确率不错的话,你大部分抄袭段落就会被检测出来,但是要注意不是全部,由于上段提到的那个论文库的问题,很可能你的某段从书上或者网上抄来的文章中的一段就没有被检测出来,那么恭喜你,赶紧把那本书或者网上的那篇文章找出来,尽情的抄吧。
而对于已经被检测出来,画了红线的段落,如果受到论文写作需要的制约,无法用其他安全的抄袭文章段落来进行合理更换的话,我们只能是自己改。笨方法就是逐字逐句的改,大面积的更换原句的原有汉字,尽可能降低汉字的重复比。例如这句话:”近几年中央政府相继出台了一系列惠农政策,在减轻农民负担、刺激粮食生产等方面效果明显。”绝对不能简单的更换几个字,调整一下刺激粮食生产和减轻农民负担的顺序,那样改还不如不改,劳时费力还起不到一点的效果。必须得类似这样改成”近些年来,党中央国务院连续颁布了一系列扶农政策,对提高粮食产量、增加农民收入等方面卓有成效。”这么改安全是安全,不过有个缺点,就是太耗费心力了,你要是不多看几本书,还真改不出来,不过话说回来,书要是看的够多,论文谁他妈还抄啊。
国外的论文反抄袭软件早就应用了。国内的中文反抄袭软件,08年年底也开发出来了,目前国内有一些高校和研究机构在试用。之所以试用,而不是全面推广,是因为目前这个软件尚不稳定,而且数据库也需要补充。不过再过两年,高校和研究机构检查论文反抄袭,是大势所趋了。
论文需要检测的tf,可以先检测一下,得出雷同比例,以及红色标志的雷同内容,然后根据下面的原则进行修改,就可以通过了。
修改原则:
1,反抄袭软件检测到13个相同的字,就认为是雷同,所以连续相同的,不要超过13个字;
2,尽量用同义词替代,比如: 损坏=破坏;渠道=途径;原理=基本思路;不可见=隐藏;优点尤其突出=优势尽显无疑
3,改变句子的主动被动语态,比如:数字水印为多媒体数据文件在认证、防伪、防篡改、保障数据安全和完整性等方面提供了有效的技术手段。=在多媒体制品的认证、防伪、防修改和传送安全以及完整性保障方面,可以采用数字水印的检测作为有力的检测手段。
下面是一个例子,按照这个程度的修改,保证能通过:
修改前:目前,数字水印技术(Digital Watermarking)已成为国际信息安全学术界研究的一个前沿方向,为多媒体的安全保存和传送开辟了一条全新的途径。数字水印通过在原始数据中嵌入版权信息,即水印来保证该数据信息的所有权,这种被嵌入的水印可以是一段文本、标识、序列号、图像等各种数字信号。而且这种水印通常是不可见的,它与原始数据紧密结合并且隐藏在其中,可以经历一些不破坏原数据使用价值或商用价值的操作而能保存下来。在需要时,能够通过一定的技术检测方法提取出水印,以此作为判断媒体的版权归属和跟踪起诉非法侵权的证据。数字水印为多媒体数据文件在认证、防伪、防篡改、保障数据安全和完整性等方面提供了有效的技术手段。
修改后:当前,国际信息安全领域的一个热点研究,就是数字水印技术。这种技术可以在多媒体的保存和传送中提供一种更安全的渠道。数字水印技术的原理是用水印来保证数据的所有权,即在保存或传送的原始数据中嵌入特定的版权信息。这些被嵌入的信息,也就是水印,可以是各种形式,比如标识,文本,图像,序列号等各种数字信号。并且,这些数字信号在表面是不可见的,并且与原始的数据以各种形式密切结合,当然这种结合不会损坏原始数据,所以数据在使用过程中丝毫不受影响。在使用过程中如果有必要检测水印,则可以通过相关的手段提取出隐含其中的水印,用这种方法来判定原始数据的版权,可以作为法律上侵犯版权的证据。这项技术在某些领域应用前景特别广发,尤其是多媒体数据、制品、文件的认证、防伪、防止修改、保障传送安全和完整性时,优点尤其突出。