造假者的噩梦:她一出手,不是撤稿就是勘误!不管你是院士大佬,还是Nature顶刊!
小奇 2020-05-15
最近,学术造假多次刷爆朋友圈,包括5月12日最新消息报道的关于中国研究团队在5月7日于Nature发表的一篇关于新冠病毒的研究中存在图片重合,以及在今年2月份的中国数十家三甲医院的400多篇论文被扒或来自同一“论文工厂”的事件。

 
这些事件均由美国生物医学领域学术打假专业户Elizabeth Bik在推特上公开指出的,据说,只要她一出手,什么复杂的图片造假操作都逃不过!下面咱们跟着Nature的专访来了解一下这位学术界的“孙悟空”。

1589508081298654.png
图自Nature
 
Elisabeth Bik是一位来自荷兰的微生物学家,大约在二十年前移居美国,是一位广受赞誉的科学文献中复制图像的超级观察者。在通常的一天中,她将用肉眼扫描数十篇生物医学论文,寻找重复使用图像,或是克隆、翻转、移动或旋转部分图像以创建“新”数据的实例。
 
下面来测试下大家是不是超级观察者?请看下图,找出下面3张图内各自重复的地方
 
1589508296397868.png
1589508322297845.png
图自PLo SONE(已撤稿)

1589508352598634.png
1589508417471913.png
进阶版
1589508439634000.png
1589508456841379.png
大师级

说实话,没看答案之前,小编是真的看不出来的。
 
所以对于Bik的技术是由衷的佩服,她也因她的技巧和坚持不懈赢得了全世界的关注。意大利萨莫内研究诚信公司Resis的联合创始人Enrico Bucci表示:“她有一种不同寻常的能力,即使是最复杂的操纵也能察觉。”。
 
并非每个问题都意味着论文是欺诈性的或错误的。但也有一些确实如此,这引起了许多研究者的深切关注。华盛顿大学的微生物学家Ferrier Fang表示:“这是一个可怕的问题,我们不能依赖科学文献的某些方面。”他曾与Bik进行了一项研究,分析了20000多篇生物医学论文,发现大约4%的论文存在问题重复。他说:“你让博士后和学生浪费数月或数年时间去追求那些实际上是无效的东西”。

图片7.png
图自Nature
 
Bik不是世界上唯一的图像侦探,但她在公开展示自己作品的方式上独树一帜。许多图像检查人员在幕后工作,将他们的发现发表在研究论文中,并私下写信给期刊;少数人受雇于期刊或机构。一些举报图像问题的人都不愿透露姓名。但是Bik几乎每天都会在Twitter和其他在线论坛上发布她的发现,在此过程中,她教别人如何发现重复,并迫使期刊调查论文。这引发“反应堆式”反应,Bik估计,她的发现至少导致了172次撤稿,超过300次勘误和更正,但她表示,很多时候,她的警告似乎都被忽略了
 
2019年4月,Bik宣布离开一家生物医学初创公司的带薪工作,并将至少一年全职免费从事图像完整性工作。如今一年过去了,尽管她面临骚扰或有时不堪重负,但她丝毫没有任何改变的迹象。她还试图开发软件,在数百万篇论文中发现重复的图像。她乐在其中。
 
该不该公开?
尽管许多人赞扬Bik的工作,但有些人说,在将问题私下标记给期刊或研究机构之前,不应该公开关注这些问题。因为在怀疑有违规行为的情况下,公开信息可能会妨碍大学的调查程序,且对于故意违规的那些人来说这些警告对他们来说是销毁证据的绝佳机会。
 
之前,Bik是私底下通知期刊的,但是由于数量太多,杂志社无法处理得来,造成积压,所以,Bik越来越失去耐心,并跟杂志社表态,如果在5年之内仍无法完成60%的问题,将更加公开地讨论这一问题,所以就有了今天公开讨论这一勇敢举措。
 
我们知道,对于数据的审查是需要时间的,有的甚至花上几年,但Bik认为期刊可以对可以论文发布concerns以提醒其他研究人员。而期刊方面认为,因为发布concern是正式和永久部分的科学记录;需谨慎使用。

1589508497934902.png
图自Nature丨3种方法
 
如今,Bik通常直接在PubPeer上报告她的发现。并认为“更重要的是要标记这些文件,不要担心这些研究所的幕后活动。”另外,包括Bik在内的许多人认为,打击图像操纵和复制需要在科学出版领域进行全系统的变革,比如对已接受的手稿进行更大程度的预筛选。但大多数期刊仍然没有预先筛选或只在发表前抽查一部分论文。
 
但形势正在缓慢转变,部分杂志开始准备推出筛选服务。Science杂志有编辑协调人负责检查已接受的手稿是否有图像操纵的迹象,但他们没有能力检查某些问题,例如数字是否被翻转、旋转或复制。
 
能否给AI去做?
许多研究人员说,自动化是大规模提高图像完整性的关键。然而,不幸的是,我们不能克隆Bik。另外,尽管Bik擅长在一张纸上找到重复的图像,但计算机可以通过比较数十万或数百万张纸来帮助在纸之间找到更多的重复,这对人类来说是一项不可行的任务。

1589508517322519.png
图自Nature
 
目前已有一些辅助软件来进行图片检查,但是更好的软件将需要更多数据。机器学习算法需要训练大量包含重复项的图像,而目前数量还是很有限,仍需要各大期刊合作方成。
 
直到最近,Bik都对可用的软件不满意。她表示:“现在,我完全有信心,在未来两年中,计算机将成为筛选稿件的一种大规模方式。”但是,人们将始终需要检查计算机筛选的结果,特别是剔除在某些部分图像可能和应该相似的情况。
 
写在最后:
无论是出于毕业压力还是晋升目的,研究人员都不应该对图片进行额外操作,这些“污点”就是一生学术记录另外,审查由于实验操作或是放错图生的错误也是很有必要的,尽管不影响实结论但这对于其他研究者的一种尊重,对学术的一种敬畏

参考来源:
Meetthis super-spotter of duplicated images in science papers. Nature 581, 132-136(2020)
DOI:10.1038/d41586-020-01363-z
https://www.nature.com/articles/d41586-020-01363-z

加载更多
2773

版权声明:

1) 本文仅代表原作者观点,不代表本平台立场,请批判性阅读! 2) 本文内容若存在版权问题,请联系我们及时处理。 3) 除特别说明,本文版权归纳米人工作室所有,翻版必究!
纳米人
你好测试
copryright 2016 纳米人 闽ICP备16031428号-1

关注公众号