생물정보학/Bioinformatics

유전체 계통발생층서법 (Genomic phylostratigraphy)

케이든 2017. 7. 19. 12:10


유전체 계통발생층서법 (Genomic phylostratigraphy)


유전체학 공부를 하다보니 Genomic phylostratigraphy 분석이란 것을 접하게 되었습니다.

일단 이게 무엇인지 궁금하여 하나씩 어원을 따져보기로 하였습니다.


Genomic 유전체적

Phylo- 계통발생학, Strati- layer 층, -graphy 기술방법, Stratigraphy: 층서학 - 지층을 기술하는 과학


Graphy라는 접미사로 끝나는 비슷한 예로는 chromatography가 있죠?

Chromato- color 색깔, -graphy 기술방법, chromatography: 색층분석법


즉 유전체에서 계통발생학적으로 층을 나누는 기법이란 것 이였습니다. 계통발생층서법!!!!!


이제부터 자세한 설명에 들어가겠습니다.


유전체 계통발생층서법이란 창시 유전자(founder gene) 형성의 원칙과 단백질군 형성의 중단을 바탕으로 대진화적 경향(macroevolutionary trends)을 재건하는 통계적 접근법입니다. 이 새로운 통계 방법은 크로아티아 자그레브의 Ruđer Bošković Institute의 Tomislav Domazet-Lošo에 의해 2007년 처음 개발되었습니다. 이 방법은 존재하는 어떤 유전자의 마지막 공통 조상을 추적함으로써 모든 유전자의 원점을 결정할 수 있게 합니다. 이 정보에 기초하여 주어진 유전자의 최소 연령을 결정할 수 있습니다.


용어 정리:

Aptation (적응형질 - 적합한 상태): 적응(adaptation - 자연선택에 의해 생성된 형질)과 굴절적응(exaptation - 자연선택이 일어나기 전에 존재하던 형질)이 합쳐진 용어

Founder genes (Founder - 창시 유전자): 새로운 유전자 계통 또는 유전자군의 바탕이 되는 새로 출현된 유전자. 창시 유전자의 출현은 새로운 기능과 연관되어 있을 수 있습니다.

Phylostratum (계통층): 창시 유전자로 합쳐지는 공통 계통 발생 기원을 가진 한 생물의 유전자 세트

Punctuated protein family evolution (단백질군 진화 중단): 창시 유전자로 부터 유래된 단백질군이 진화적 시간을 통해 흩어져 있다고 가정하는 유전체 진화 모델


안타깝게도 이 방법의 개발자가 분석방법과 개념은 설명해놨지만, 해당 분석에 대한 코드나 프로그램을 공개하지 않았습니다. 그러나 (다행히도) 다른 그룹에서 분석방법을 코드로 구현하였습니다 (Drost et al., 2015). 


누르면 이동: (https://github.com/AlexGa/Phylostratigraphy)

파스타 파일 데이터 베이스를 받아서 압축을 풀고 blast make db로 db화 시킨다음, 원하는 생물체의 유전자들의 포맷을 위 페이지를 참조하여 맞추고 blast 기반의 코드를 돌리면 됩니다.

(분석을 위해 DB가 자주자주 업데이트 되었으면 좋겠군요...)

DB 크기: 17,582,624 단백질 서열 from 4,557 종


코드가 없이 Blastp로만 분석을 할 수는 이지만, 최대 난제가 DB로 사용할 서열을 모으는 것 입니다. 

(Sestak et al., 2013) 논문에서는 오직 blastp만을 사용하여 계통발생층서법으로 분석을 하였습니다.

DB 크기: 6,252,405 단백질 서열

또 어떤 사람은 출판이된 계통발생층서법 지도를 모으는 사람도 있습니다.

누르면 이동: (https://github.com/HajkD/published_phylomaps)


결론으로, 개념의 창시자가 코드를 공개하였으면 좋겠네요... 창시자분께서 공개를 안하고 혼자 논문을 계속 우려내고 계십니다. NR DB로 할 수 있겠지만, 포맷팅에 시간이 너무 잡아 먹힐 것 같아 2015년도 논문을 참조로 하고 사용하는게 현재로서는 제일 나은 방법같습니다.



출처:

Domazet-Lošo T, Brajković J, Tautz D (2007). A phylostratigraphy approach to uncover the genomic history of major adaptations in metazoan lineages. Trends in genetics


Drost HG, Gabel A, Grosse I, Quint M. (2015). Evidence for Active Maintenance of Phylotranscriptomic Hourglass Patterns in Animal and Plant Embryogenesis. Mol. Biol. Evol. 32 (5) 1221-1231. doi:10.1093/molbev/msv012.


Sestak M. S., Bozicevic V., Bakaric R., Dunjko V., Domazet-Loso T. (2013). Phylostratigraphic profiles reveal a deep evolutionary history of the vertebrate head sensory systems. Front. Zool. 10:18 10.1186/1742-9994-10-18