생물정보학/Bioinformatics

Composition Vector Tree (CVtree) 사용법

케이든 2015. 11. 23. 22:15

 

CVtree for constructing phylogenetic tree

 

* CVTree2 web version

- 하나의 protein file 또는 contig file의 크기가 20MB, 전체 파일의 크기는 100MB로

 

* CVTree stand-alone 사용

- protein sequence들을 사용해서 수행하였다.

- K-tuple: 7 - Pezizomycotina에 속하는 4종의 lichen들이 잘 묶여있는 것을 볼 수 있다.

 

CVTree stand-alone 사용법
Command line:

- PHYLIP format output: cvtree –i name_list.txt –d input_dir –k 7 –t dna –o PHYLIP_format_matrix

- MEGA formant output: cvtree –i name_list.txt –d input_dir –k 7 –t dna –l MEGA_format_matrix

 

name_list.txt는 sequence file들의 list를 저장한 파일, input_dir는 sequence file들이 있는 디렉터리를 말한다. –k에는 k-tuple값을 써주면 되고, sequence file의 종류가 protein일 경우에는 –t에 aa를, contig일 경 우에는 dna를 넣어준다.

 


Example of name_list.txt

4 (species 개수)

Cladonia_macilenta

Cladonia_metacorallifera

Caloplaca_flavorubescens

Endocarpon_pusillum

Umbilicaria_Muehlenbergii

 

PHYLIP format으로 생성된 distance matrix를 tree로 표현이 될 수 있는 newick format으로 변경해 주어야 한다. 아래의 web page에서 변경 가능하다.

 

 

http://www.trex.uqam.ca/index.php?action=matrixToNewick&project=trex