유전체 계통발생층서법 (Genomic phylostratigraphy)
유전체학 공부를 하다보니 Genomic phylostratigraphy 분석이란 것을 접하게 되었습니다.
일단 이게 무엇인지 궁금하여 하나씩 어원을 따져보기로 하였습니다.
Genomic 유전체적
Phylo- 계통발생학, Strati- layer 층, -graphy 기술방법, Stratigraphy: 층서학 - 지층을 기술하는 과학
Graphy라는 접미사로 끝나는 비슷한 예로는 chromatography가 있죠?
Chromato- color 색깔, -graphy 기술방법, chromatography: 색층분석법
즉 유전체에서 계통발생학적으로 층을 나누는 기법이란 것 이였습니다. 계통발생층서법!!!!!
이제부터 자세한 설명에 들어가겠습니다.
유전체 계통발생층서법이란 창시 유전자(founder gene) 형성의 원칙과 단백질군 형성의 중단을 바탕으로 대진화적 경향(macroevolutionary trends)을 재건하는 통계적 접근법입니다. 이 새로운 통계 방법은 크로아티아 자그레브의 Ruđer Bošković Institute의 Tomislav Domazet-Lošo에 의해 2007년 처음 개발되었습니다. 이 방법은 존재하는 어떤 유전자의 마지막 공통 조상을 추적함으로써 모든 유전자의 원점을 결정할 수 있게 합니다. 이 정보에 기초하여 주어진 유전자의 최소 연령을 결정할 수 있습니다.
용어 정리:
Aptation (적응형질 - 적합한 상태): 적응(adaptation - 자연선택에 의해 생성된 형질)과 굴절적응(exaptation - 자연선택이 일어나기 전에 존재하던 형질)이 합쳐진 용어
Founder genes (Founder - 창시 유전자): 새로운 유전자 계통 또는 유전자군의 바탕이 되는 새로 출현된 유전자. 창시 유전자의 출현은 새로운 기능과 연관되어 있을 수 있습니다.
Phylostratum (계통층): 창시 유전자로 합쳐지는 공통 계통 발생 기원을 가진 한 생물의 유전자 세트
Punctuated protein family evolution (단백질군 진화 중단): 창시 유전자로 부터 유래된 단백질군이 진화적 시간을 통해 흩어져 있다고 가정하는 유전체 진화 모델
누르면 이동: (https://github.com/AlexGa/Phylostratigraphy)
파스타 파일 데이터 베이스를 받아서 압축을 풀고 blast make db로 db화 시킨다음, 원하는 생물체의 유전자들의 포맷을 위 페이지를 참조하여 맞추고 blast 기반의 코드를 돌리면 됩니다.
(분석을 위해 DB가 자주자주 업데이트 되었으면 좋겠군요...)
DB 크기: 17,582,624 단백질 서열 from 4,557 종
코드가 없이 Blastp로만 분석을 할 수는 이지만, 최대 난제가 DB로 사용할 서열을 모으는 것 입니다.
(Sestak et al., 2013) 논문에서는 오직 blastp만을 사용하여 계통발생층서법으로 분석을 하였습니다.
또 어떤 사람은 출판이된 계통발생층서법 지도를 모으는 사람도 있습니다.
누르면 이동: (https://github.com/HajkD/published_phylomaps)
결론으로, 개념의 창시자가 코드를 공개하였으면 좋겠네요... 창시자분께서 공개를 안하고 혼자 논문을 계속 우려내고 계십니다. NR DB로 할 수 있겠지만, 포맷팅에 시간이 너무 잡아 먹힐 것 같아 2015년도 논문을 참조로 하고 사용하는게 현재로서는 제일 나은 방법같습니다.
출처:
Drost HG, Gabel A, Grosse I, Quint M. (2015). Evidence for Active Maintenance of Phylotranscriptomic Hourglass Patterns in Animal and Plant Embryogenesis. Mol. Biol. Evol. 32 (5) 1221-1231. doi:10.1093/molbev/msv012.
'생물정보학 > Bioinformatics' 카테고리의 다른 글
RAxML protein input 명령어 (0) | 2016.12.27 |
---|---|
계통수(Phylogenetic tree) 제작에 대한 고찰 (0) | 2016.12.10 |
N50, L50 및 연관된 통계치 (0) | 2016.12.01 |
dN/dS ratios (또는 Ka/Ks) 에서 추측 할 수 있는 결론 (0) | 2016.04.11 |
blast tabular format 추가 + Query coverage (0) | 2016.03.12 |