バイオインフォマティクスにおけるコドンとアミノ酸の遺伝暗号
定義
- DNAの塩基3個を順序対としてまとめた単位をトリプレットコードtriplet Codeと呼ぶ。
- セントラルドグマに従って転写されたmRNAのトリプレットコードをコドンcodonという。
- 化学的にアミノ基とカルボキシ基を含む分子で、タンパク質の構成単位をアミノ酸amino Acidと呼ぶ。
- コドンの順列によりアミノ酸の対応関係を遺伝暗号genetic Codeという。
説明
遺伝暗号及び遺伝コードは塩基配列でどのコドンがどのアミノ酸を指示するかを示す。遺伝暗号という表現は塩基配列だけ見てもどのタンパク質が合成されるか理解しにくいから使われる言葉だが、実際のDNAはその情報を隠す意図はないので、暗号システムとは言えない。したがって、エンコーディングencodingと呼ぶ方が適切だろう。
1 転写されたmRNAは核の外に出て、細胞の小器官であるリボソームに出会う。リボソームはmRNAを読み取り、スタートコドンAUG、つまりメチオニンからアミノ酸を集め、ストップコドンに達するとタンパク質の合成を停止する。この過程がまさにセントラルドグマで言う翻訳である。
トリプレットコード、コドンが3つの塩基の順序対である理由は単純である。生物体に必要なアミノ酸は20種類であり、主要塩基は4種類だが、二つの塩基だけでは$4^2 = 16$種類のアミノ酸しか表現できない。したがって、全てのアミノ酸を表現するには少なくとも3つの塩基が必要で、実際にも正確に3つを使う。