생명정보공학에서의 주요 염기와 염기쌍

생명정보공학에서의 주요 염기와 염기쌍

Canonical base and Pair

정의

다음의 다섯가지 염기를 주요 염기Canonical Base라고 한다.

  1. 퓨린 염기: 아데닌Adenin $A$, 구아닌Guanine $G$
  2. 피리미딘 염기: 사이토신Cytosine $C$, 티민Thymine $T$, 유라실Uracil $U$

설명

티민은 DNA에서만 사용되며, 유라실은 RNA에서만 사용된다. 따라서 데이터에서 $T$ 와 $U$ 중 어느 것이 쓰이는지만 확인해도 DNA와 RNA 중 무엇의 염기 서열인지 알 수 있다.

수소 결합이 가능한 두 염기가 연결된 것을 염기쌍Base Pair이라 한다. 퓨린 염기와 피리미딘 염기에서 각각 하나씩만 선택되며, 그 중 가능한 케이스는 $A-T, A-U, G-C$ 세가지가 있다.

$A-T$ 와 $A-U$ 는 2개의 수소 결합, $G-C$ 는 3개의 수소 결합으로 연결된다.DNA는 염기쌍에 의해 이중나선의 구조를 취하고 있다. 이에 따라 가닥 중 한쪽에 $A$ 가 있다면 반대쪽 가닥에는 $T$ 이 있음을 알 수 있다. $$ A-T \\ C-G \\ C-G \\ G-C \\ T-A \\ T-A \\ A-T \\ C-G $$ 가령 위와 같은 DNA 샘플이 있다면 우리는 한쪽 가닥만 알면 된다. 따라서 데이터로 취득할 때는 왼쪽만 읽어서 다음과 같이 기록해도 된다:ACCGTTAC이중나선 구조의 의의는 바로 ‘백업’이다. 실제로 RNA의 경우에는 한가닥으로 이루어진 불안정한 구조를 갖추고 있기 때문에 문제를 일으키는 경우가 많으나, DNA는 한 가닥에 문제가 생겨도 반대편 가닥을 참고할 수 있어 안정적으로 유전 정보를 후대로 물려줄 수 있다.

댓글