微软
该问题本质上是由于Excel的自动格式化功能在保存时,系统性地将基因名称更改为日期而导致。随后,许多遗传学家不得不仔细搜寻历史上的大量论文以手工修复损坏的数据,可以理解的是这相当令人沮丧和耗时。
Quadrams研究所的生物学家Dezső Módos说:「这确实非常令人讨厌。」他也说道:「这是一种广泛使用的工具,如果您在计算上有点不识字,您将使用它。在我攻读博士学位期间,我也做过!」
根据2016年的一项研究,在3500多个遗传学论文中,大约有20的错误是由该问题引起的。
HUGO基因命名委员会 (HGNC) 最近发布了有关「影响数据处理和检索的符号」的新方针。
HGNC协调员Elspeth Bruford说:「我们咨询了各自的研究团体,以讨论拟议的更新,并且还通知了已在这些基因上发表这些变化的研究人员。」
重新命名的人类基因的一些例子包括MARCH1和SEPT1,它们现在分别已重命名为MARCHF1和SEPTIN1。
有趣的是,这并不是遗传学家第一次重新命名基因。
根据Bruford的说法,以前将某些基因重新命名,是考虑到某些单词用法的可能负面含义。
Bruford指出:「我们总是想像临床医生必须向父母解释,他们孩子的特定基因有突变。」例如,HECA曾经以果蝇中的同等基因命名,命名为headcase homolog (Drosophila) ,但为了避免潜在的冒犯,我们将其更改为hdc homolog,细胞周期调节剂。
最近对27种人类基因的更改是第一次为了适应软体问题以进行此类更改。
当然,Excel中的另一个选择是通过在更新中添加根据DNA名称进行格式设置的选项来方便遗传学家。 不过,考虑到与该软体的整体用户群相比,遗传学家Excel的用户数量相对较少,微软决定不包含任何此类更新的决定是可以理解的。
Bruford说:「这是Excel软体的有限用例。」也说道:「微软几乎没有动力对其他大量Excel用户社区广泛使用的功能进行重大更改。」从技术上来说,自动格式化功能导致遗传学论文中出现的这些错误,一直存在潜在的替代方法。Excel用户可以选择在保存时保留其格式,而不必为他们自动设置的软体格式。
就是说,Excel提供了许多功能,对于某些用户而言,这些功能相对较难记住和掌握,而这一点并不罕见。显然,对Excel的这些负面体验甚至对科学家而言仍然适用,这也可以表示Excel的整体用户可及性。
- https://futurism.com/the-byte/rename-genes-confused-microsoft-excel
- https://www.theverge.com/2020/8/6/21355674/human-genes-rename-microsoft-excel-misreading-dates#:~:text=From%20now%20on%2C%20they%20say
- avoid%20confusion%20in%20the%20future.
- https://www.extremetech.com/extreme/313567-scientists-rename-genes-so-excel-wont-reformat-them-as-dates#:~:text=The%20scientific%20body%20that%20controls
- %2DCH%2DType%20Finger%201.