Excelで「1-1」のように入力するだけで自動的に「1月1日」と変換してくれる機能は時には便利ですが、単純に「1-1」と入力したかった場合はおせっかいに感じることも。実際に、この機能による「人間の遺伝子の略称を勝手に日付に変換してしまう」という問題が遺伝子学者を悩ませており、ついに科学者側が根負けして遺伝子の名前が変更されることになったと報じられています。

Scientists rename human genes to stop Microsoft Excel from misreading them as dates - The Verge

https://www.theverge.com/2020/8/6/21355674/human-genes-rename-microsoft-excel-misreading-dates

Excelが文字列を勝手に変更し、使用者の意図しない表記に変えてしまう問題はかねてから遺伝子学者を悩ませており、例えばヒトの細胞内に存在するタンパク質の一種「Septin 2」の名称(遺伝子シンボル)である「SEPT2」は「2-Sep(9月2日)」に、「Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase」という遺伝子の名称である「MARCH1」は「1-Mar(3月1日)」になってしまいます。

2016年に発表された研究では、遺伝子を扱った論文3597件のうちExcelが原因とみられるミスが見つかった論文は704件と、ほぼ20%の論文にこうしたExcelの自動変換機能の影響が現れていることが分かっています。

Excelが遺伝子研究の誤りのもとになっていると研究者が指摘 - GIGAZINE



by John Gardner

実際にExcelで「MAR1」と入力すると……



「1-Mar」になってしまいました。



Excelでは、こうした自動変換が発生すると表示だけでなくデータ自体が変わってしまうため、後で修正することは困難です。遺伝子学者はセルの書式設定を「文字列」変更するなどして対応してきましたが、別の人が同じExcelファイルを開くとまた勝手に自動変換されてしまうといった問題もあり、解決には苦慮していたとのこと。

そこで、ヒト遺伝子解析機構のヒトゲノム命名法委員会(HGNC)は2020年8月3日に新たなガイドラインを発表し、「データの取り扱いや検索に影響を与えるシンボル」を変えることを宣言。これにより、今後「SEPT2」は「SEPTIN2」に、「MARCH1」は「MARCHF1」と表記されることや、今後新たに発見された遺伝子の名称はExcelの自動変換に配慮したものになることが決まりました。

HGNCのコーディネーターを務めるエルスペス・ブルーフォード氏によると、ガイドラインが発表される前から遺伝子名の変更は行われており、過去1年間だけで27種類の遺伝子が名前を変えられているとのこと。

ブルーフォード氏はIT系ニュースサイトThe Vergeの取材に対し、「遺伝子の名前は軽々しく変更していいものではありませんが、変更されること自体は珍しいことではありません」とコメントしています。例えば、これまでも名詞とまぎらわしい「CARS」は「CARS1」に、「WARS」は「WARS1」へと変更されたことがあります。

ほかにも、ヒトのがんに関連する遺伝子の中には、ハエで見つかった同様の遺伝子にちなんで名付けられた「headcase homolog (Drosophila)」という遺伝子がありましたが、「headcase(キチガイ)」という差別語が含まれているため、「Hdc Homolog, Cell Cycle Regulator」に変更されたという事例もあります。

今回のHGNCの新ガイドラインは、科学者がExcelのおせっかいに振り回されてしまった一例といえますが、ブルーフォード氏は「遺伝子に関する論文の資料を作成するのは、Excelの幅広い用途のうちかなり限定的なものなので、多くのExcelユーザーを抱えているMicrosoftに機能を削除する動機がないのも仕方ないことです」とコメントしました。