国自然相似性查重深度探索

浏览
212
回复
0
收藏
0

1#

2019-3-29 22:52:37
除非想成为一流,否则就是二流。

14d474fb5726367250f514ac167eada6.png

1  引言

之前,我们对于国自然基金查重的事情做了相关的介绍:谈谈国自然基金查重,反响很热烈,大家都想对这个国自然的查重有进一步的了解,很多人都通过各种渠道来联系咨询,想获得相关的信息。

问题1:项目申请书用了自己博士学位论文里面的一部分内容会不会被查重?
问题2:国自然查重查什么,是具体怎么查?
问题3:不放心,能不能自己查重?
......

相关的问题层出不穷,不能说大家想着去做不端行为!而是很大程度上很多都由于是第一次申报,确实是不了解,也有很多是相关的信息不掌握,怕对自己的本子造成影响,大家都是一样的,对于不了解的事情总是有一定的畏惧心理。

那么火行出品,必有理有据,杜绝不专业、不负责任,来看看到底这个查重是怎么一回事。

2  查重历史

通过之前的文章,我们已经知道,这个“神器”的官方名字叫做:“项目相似度检测系统”,一般情况下50%以上重复定义为疑似重复,会被相关监督委员会调查后判定。80%以上,直接认定为重复,学术不端。

那么我们来看看这个基金查重的历史:

2010年,国家自然科学基金委开发了项目相似度检查系统并启用。系统分别对申请书整体及立项依据、研究内容、研究方案和创新点方面的相似度进行比对。

在2011项目指南上明确就提出了这样的要求,作为历史的一部分,火行还是找了出来,并且进行了标注:

186914a175f8a4bb0a3d839bb38e06ef.jpg

要求很明确,查重要求【1】:

1.不得将内容相同或相近的项目,向同一科学部或不同科学部申请不同类型项目的资助;
2.受聘于一个以上依托单位的申请人,不得将内容相同或相近的项目,通过不同依托单位提出申请;
3.不得将内容相同或相近的项目,以不同申请人的名义提出申请。

通过9年的不断完善,这中间经过了技术的发展,也经过了《肿瘤生物学》107篇撤稿事件,相关的科研不端行为有了新的苗头。

在高层不断加强科研诚信建设的形势下,最新2019项目指南已经对相关要求合并到科研诚信中,并且对于查重的相关要求也进行了更为严格的要求【2】:

2a420538238e240d6524fb5dbce67d3c.jpg

对于“不得同一研究内容向不同资助机构提出申请”这点上,建议大家考量一个背景:机构改革。目前改革已经完成,在相关机构部门的介绍上:国家自然科学基金委员会由科学技术部管理

科技部改版的最新官方网站【3】上明确:

(十四)负责管理国家自然科学基金委员会(简称自然科学基金委),依法对国家自然科学基金工作进行宏观管理、统筹协调和监督评估。自然科学基金委依法管理国家自然科学基金,相对独立运行,负责资助计划、项目设置和评审、立项、监督等组织实施工作。

做过重点研发计划申报的火友应该知道,重点研发计划里面已经要求填写申请人承担的国自然情况,所以这块上大家也需要重视。

好了,历史知道了,那么查重到底是怎么样的,太神秘了,不了解,也会有担心,那么我们接下来讲讲查重的真身!

3  查重真身

根据基金委的统计数据,科研不端行为主要发生在项目申请阶段,申请者在申请过程中发生的不端行为占科研不端行为的比例约为80%【4】。

查重内容:

国自然的查重(主动检测)是查的项目申请书的内容;也就是系统会分别对申请书整体及立项依据、研究内容、研究方案和创新点方面的相似度进行比对。

系统提供相关项目的查重比对结果,由科学部审查后,相应的认定处罚由监督委委员会审议。

技术手段【5】:


6c8f339703a4e51a9399eb6c1e215881.jpg

针对这个技术有相关的研究表述【6】:
基于海量数据的提取与特征化:包括语料库建立与中文分词准确性、项目基本特征粒度的选取、多粒度的特征提取算法、项目模板抽象表达、停用分词库维护、项目数据预处理与特征权重与阈值设定、特征数据存取方法、项目比对算法以及基于海量数据处理的计算任务的原子性、任务分解及分离与合并策略等。
通过采用基于指纹和语义特征的相似性检查方法对基金项目中的内容、引用关系进行相似性比对分析,挖掘出项目相似性关系,形成完整的基金项目相似性检查系统。

大家有兴趣的可以依据上述表述找点资料研究一下,海涵我一个外行只能了解到这么多。

这套系统运营上线的前几年运行怎么样?

这套项目相似性检查系统在2012年全部相似性检测10天完成,而2011年耗时20天完成,2010年第一次耗时44天完成【6】

目前这套检测系统最新的可能变化有哪些呢?

4  最新进展

高层的加强科研诚信建设的大背景下,经过这几年信息技术的发展,相关的功能有了一定的优化及调整。
据相关渠道信息,这套相似度检测系统有如下调整:拓展查重资助类型,优化调整现有查重功能。
上述两句话通俗一点:(1)查重比对的数据库扩大(2)更快捷高效的多重比对,耗时进一步降低,比对的精准度提高。

加入整合科研诚信违规管理:对“个人、项目、单位”的处理决定分别进行记录。由科研诚信办进行录入,提交后生效,业务处及相关领导可随时查看录入情况,并提供对违规信息的统计查询功能。


5  总结一下
第一、自己真实本人撰写,正确合理引用,没有多头申报,其实均可放心。
第二、目前不能做到申请前个人预先查重,这部分系统暂未开放相关功能。
第三、所有外界所有号称可以提供项目查重的服务,均为假,原因也简单,比对的核心数据内容(历年的申请书)是国家自然科学基金委独有,如果有人能号称查重,你要擦亮眼了!

上述相关信息仅供参考,不作为相关依据,敬请知悉,谢谢!

参考资料:【1】国家自然科学基金委2011项目申请指南-申请须知【2】国家自然科学基金委2019项目申请指南-科研诚信要求
【3】国家科技部网站:组织机构-管理/代管机构
【4】中国青年报《谁泄露了被抄袭的项目申请书》
【5】国家自然科学基金委信息中心-华东片报告
【6】科学基金共享成果网-《基金项目相似性检查系统研究》

版权归属:火行
转载请授权,感谢厚爱

回复

已有 0 条回复
您需要登录后才可以回帖 登录 | 注册
高级模式

关于作者
中级会员
帖子
93
日志
0
精华
0