ゲノム情報解析には、生データからゲノムデータに仕上げるのに、いくつかの重要で難しいステップをこなさなければなりません。これらのステップには、単純作業ではなく知恵を出さねばならない関門があります。
そして、どこかで操作的に「エイヤー」と決めてしまわなければ先に進まないところがあります。マッピングしかり、アッセンブリしかり、SNP処理しかりですが、それぞれのアルゴリズムの中で、いくつもの等しく正しそうな選択肢が次々と出現し、そのどれかを選んでいかないと前に進まないからです。
また、ここに他の生物などの混在がある場合は、さらに問題は複雑になります。
いったんゲノム配列ができあがったとしても、次に「どこに遺伝子があるのか」などのアノテーションの作業が待っています。基本的には徹底的な相同性検索をおこなうのですが、かなりの人的で知的な作業プロセスが介在し、とりわけ取捨選択の基準の決め方など、ここでも大いに頭を悩ませることになります。
そして、このアノテーションが終了すると、ようやく研究対象のゲノム情報ができあがります。
これらの作業過程は、非常に大変ではありますが、大きな知的な醍醐味もあります。ただ、「唯一の真実を求めて」といった基本観念では、操作的な「エイヤー」の判断ができませんので、どうしてもすっきりしない感覚が残りながら、前進することになります。