Mcl clustering 하는 방법
1. BLASTDB를 만든다
$ makeblastdb -in [input_file] -dbtype [nucl, prot] -title [db_name]
2. All-by-All BLAST를 수행한다.
$ blastp -db [db_name] -query [query_file] -out [outfile_name] -evalue [e.g. 0.001] -outfmt [6 - tabular] -num_threads [Cpu 개수]
3. BLAST 결과에 기록된 Clustering similarity graphs
- BLAST output을 ABC 포맷으로 맞추기
$ cut -f 1,2,11 [blast_output] > [blast_output.abc]
- mcxload로 network file(*.mci)과 dictionary file(*.tab)생성하기
$ mcxload -abc [blast_output.abc] --stream-mirror --stream-neg-log10 -o [blast_output.mci] -write-tab [blast_output.tab]
- mcl로 clustering 하기 (-I infalation value 적을 수록 granularity가 높아짐, 더 뭉침)
$ mcl [blast_output.mci] -I 1.4
$ mcl [blast_output.mci] -I 2
$ mcl [blast_output.mci] -I 4
$ mcl [blast_output.mci] -I 6
위와 같이 하면 out.blast_output.mci.Ixx 파일이 나옴. 이것을 아래의 -icl 인자로 집어넣음.
$ mcxdump -icl [out.blast_output.mci.I14] -tabr [blast_output.tab] -o [dump.blast_output.mci.I14]
$ mcxdump -icl [out.blast_output.mci.I20] -tabr [blast_output.tab] -o [dump.blast_output.mci.I20]
$ mcxdump -icl [out.blast_output.mci.I40] -tabr [blast_output.tab] -o [dump.blast_output.mci.I40]
$ mcxdump -icl [out.blast_output.mci.I60] -tabr [blast_output.tab] -o [dump.blast_output.mci.I60]
Alternatively:
- abc format에서 바로 clustering 하기
$ mcl [blast_output.abc] --abc -I 1.4
'생물정보학 > Bioinformatics' 카테고리의 다른 글
Composition Vector Tree (CVtree) 사용법 (0) | 2015.11.23 |
---|---|
SEARCHING BEST HITS FROM BLAST TABLE FORMAT (0) | 2015.07.22 |
Multiple Sequence Alignment 중 Progressive Alignment 기법 (0) | 2014.10.26 |
Position-Specific Socring Matrix (PSSM) 설명 (0) | 2014.10.26 |
E-value 설명 (0) | 2014.10.26 |