logo

생명정보공학에서의 인트론과 엑손 📂알고리즘

생명정보공학에서의 인트론과 엑손

정의

진핵 생물의 DNA에서 실제로 단백질의 합성에 관여하는 부분을 엑손exon, 그렇지 않은 부분을 인트론intron이라고 한다.

설명

원핵 생물과 진핵 생물은 세포핵에 핵막이 있냐 없느냐로 구분되지만, 생명정보공학의 관점에서 중요한 차이점은 센트럴 도그마에 의해 mRNA가 전사되고 난 뒤의 스플라이싱splicing이라는 과정이 있느냐 없느냐다. 원핵 생물의 전사된 mRNA는 DNA와 염기서열상으로는 정확히 같으며(주요 염기인 T와 U만이 다르다.), 그 상태에서 단백질로의 번역이 이루어진다. 그러나 진핵 생물의 경우에는 mRNA가 핵막 밖으로 빠져나온 후 스플라이소좀spliceosome에 의해 특정 부분만 남기고 잘려나가게 된다.

1

5FA27D011.png

위 그림에서 1,3,5는 남았지만 2,4는 스플라이소좀에 의해 버려지게 되었다. 이것이 스플라이싱이며, 이 상태의 mRNA가 번역된다면 2,4에 있던 정보는 사용되지 않을 것이다. 정의에 따르면 녹색 1,3,5는 엑손이고 청색 2,4는 인트론이 되는 것이다.

이렇게 실제 단백질 합성에 관여하는 염기만이 남은 mRNA를 기존의 pre-mRNA와 대비해서 **성숙한 mRNA(mature mRNA)**이라고 표현한다. 유전체 단위로 생각해보면 이들이야말로 진짜 유전 영향을 미친다는 의미에서 엑손을 모두 모은 것을 **진유전체(眞遺傳體)**라고 한다. 영어 표현으로는 엑손의 체(-ome)이라는 의미에서 엑솜exome으로 부른다.


  1. 조재창 역, Dan E. Krane, Michael L. Raymer. (2007). 생명 정보학(Fundamental Concepts of Bioinformatics): p13. ↩︎