对很多人来说,电子表格是日常生活的必备工具。同样,对于基因组学研究人员来说,电子表格更是必不可少的“研究基石”。
近期的一项研究表明,发表的基因组学研究数据中,有很多的错误是由于Excel造成的。
澳大利亚科学家们分析了发表在3600篇基因组文章中的7500个excel表格。这些文章来自18个期刊,文章之间的时间跨度为10年。结果发现,五分之一的excel文件中存在很容易检测出的错误。
研究者认为,Excel表格和其他常用的电子表格,会在程序的默认的情况下,将一些基因符号转换为日期和数字。
例如,基因名称“Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase”(膜相关环指蛋白C3HC41,泛素蛋白连接酶E3)会被表格自动转换为日期“03/01/2016”。同样类似的转化也发生在基因标识符中,如“2310009 E13”转化为指数数字(2.31 e + 19)。这样一来,有价值的信息就被电子表格转换掉了,由此造成基因组学数据出现错误。
主要参考文献:
http://qz.com/768334/years-of-genomics-research-is-riddled-with-errors-thanks-to-a-bunch-of-botched-excel-spreadsheets/
~~~欢迎转发~~~
!!!转载请联系我们获取授权!!!