생명정보공학에서의 코돈과 아미노산 유전 부호
정의
- DNA의 염기 3개를 순서쌍으로 묶은 단위를 트리플렛 코드triplet Code라 한다.
- 센트럴 도그마에 따라 전사된 mRNA의 트리플렛 코드를 코돈codon이라 한다.
- 화학적으로 아미노기와 카복시기를 포함한 분자로, 단백질의 구성 단위를 아미노산amino Acid이라 부른다.
- 코돈의 순열에 따라 아미노산의 대응관계를 유전 부호genetic Code라 한다.
설명
유전 부호 및 유전 암호는 염기서열에서 어떤 코돈이 어떤 아미노산을 지시하는지를 나타낸다. 유전 암호라는 표현은 염기서열만 보아서는 어떤 단백질이 합성될지 이해하기 어려워서 쓰이는 말이고, 실제 DNA는 그 정보를 숨기려는 의도가 없기 때문에 암호 시스템이라 할 수 없다. 따라서 인코딩encoding이라 부르는 것이 더 적절할 것이다.
1전사된 mRNA는 핵 밖으로 나오게 되며, 세포 소기관인 리보솜을 만나게 되면 리보솜이 mRNA를 읽어들인다. 코돈 중 AUG, 그러니까 개시 코돈부터 메싸이오닌을 시작으로 아미노산들을 모으다가, 종결 코돈을 끝으로 단백질을 합성을 멈춘다. 이러한 과정이 바로 센트럴 도그마에서 말하는 번역이다.
하필 트리플렛 코드, 코돈이 3개의 염기로 이루어진 순서쌍인 이유는 간단하다. 생물체에게 필요한 아미노산은 20가지고 주요 염기는 4가지인데, 두 개의 염기만으로는 $4^2 = 16$가지의 아미노산만을 표현할 수 있기 때문이다. 따라서 모든 아미노산을 표현하기 위해서는 적어도 3개의 염기가 필요하며, 실제로도 정확히 3개를 사용한다.