バイオインフォマティクスにおける主要な塩基と塩基対
定義
次の五つの塩基を主要な塩基canonical Baseと呼ぶ。
- プリン塩基: アデニンadenin , グアニンguanine
- ピリミジン塩基: シトシンcytosine , チミンthymine , ウラシルuracil
説明
チミンはDNAでのみ使われ、ウラシルはRNAでのみ使われる。したがって、データで か のどちらが使われているかだけ確認することで、それがDNAかRNAの塩基配列か分かる。
水素結合が可能な二つの塩基が繋がれたものを塩基対base Pairと言う。プリン塩基とピリミジン塩基からそれぞれ一つずつ選ばれ、その中で可能なケースは 三つがある。
と は2つの水素結合で、 は3つの水素結合で繋がれている。DNAは塩基対によって二重らせんの構造をとっている。そのため、片方の鎖に があれば、反対側の鎖には があることが分かる。 例えば、上のようなDNAサンプルがあると、片方の鎖だけを知っていればいい。だから、データ取得時には左側だけを読んで、次のように記録してもいい:ACCGTTAC二重らせん構造の意義は、「バックアップ」そのものだ。実際にRNAは一本鎖で不安定な構造をしており、問題を起こすことが多いが、DNAは片側の鎖に問題が生じても、反対側の鎖を参照することで、安定して遺伝情報を子孫に伝えられる。