CVtree for constructing phylogenetic tree
* CVTree2 web version
- 하나의 protein file 또는 contig file의 크기가 20MB, 전체 파일의 크기는 100MB로
* CVTree stand-alone 사용
- protein sequence들을 사용해서 수행하였다.
- K-tuple: 7 - Pezizomycotina에 속하는 4종의 lichen들이 잘 묶여있는 것을 볼 수 있다.
CVTree stand-alone 사용법
Command line:
- PHYLIP format output: cvtree –i name_list.txt –d input_dir –k 7 –t dna –o PHYLIP_format_matrix
- MEGA formant output: cvtree –i name_list.txt –d input_dir –k 7 –t dna –l MEGA_format_matrix
name_list.txt는 sequence file들의 list를 저장한 파일, input_dir는 sequence file들이 있는 디렉터리를 말한다. –k에는 k-tuple값을 써주면 되고, sequence file의 종류가 protein일 경우에는 –t에 aa를, contig일 경 우에는 dna를 넣어준다.
Example of name_list.txt
4 (species 개수)
Cladonia_macilenta
Cladonia_metacorallifera
Caloplaca_flavorubescens
Endocarpon_pusillum
Umbilicaria_Muehlenbergii
PHYLIP format으로 생성된 distance matrix를 tree로 표현이 될 수 있는 newick format으로 변경해 주어야 한다. 아래의 web page에서 변경 가능하다.
http://www.trex.uqam.ca/index.php?action=matrixToNewick&project=trex
'생물정보학 > Bioinformatics' 카테고리의 다른 글
blast tabular format 추가 + Query coverage (0) | 2016.03.12 |
---|---|
NCBI의 nr db에서 특정 종 제거하기 (0) | 2016.01.04 |
SEARCHING BEST HITS FROM BLAST TABLE FORMAT (0) | 2015.07.22 |
mcl clustering (0) | 2015.03.27 |
Multiple Sequence Alignment 중 Progressive Alignment 기법 (0) | 2014.10.26 |