생물정보학/Bioinformatics

mcl clustering

케이든 2015. 3. 27. 08:32

 

Mcl clustering  하는 방법

 

1. BLASTDB를 만든다

 

$ makeblastdb -in [input_file] -dbtype [nucl, prot] -title [db_name]

 

2. All-by-All BLAST를 수행한다.

 

$ blastp -db [db_name] -query [query_file] -out [outfile_name] -evalue [e.g. 0.001] -outfmt [6 - tabular] -num_threads [Cpu 개수]

 

3. BLAST 결과에 기록된 Clustering similarity graphs

 

- BLAST output을 ABC 포맷으로 맞추기

$ cut -f 1,2,11 [blast_output] > [blast_output.abc]

 

- mcxload로 network file(*.mci)과 dictionary file(*.tab)생성하기

$ mcxload -abc [blast_output.abc] --stream-mirror --stream-neg-log10 -o [blast_output.mci] -write-tab [blast_output.tab]

 

- mcl로 clustering 하기 (-I infalation value 적을 수록 granularity가 높아짐, 더 뭉침)

$ mcl [blast_output.mci] -I 1.4
$ mcl [blast_output.mci] -I 2
$ mcl [blast_output.mci] -I 4

$ mcl [blast_output.mci] -I 6


위와 같이 하면  out.blast_output.mci.Ixx 파일이 나옴. 이것을 아래의 -icl 인자로 집어넣음.


$ mcxdump -icl [out.blast_output.mci.I14] -tabr [blast_output.tab] -o [dump.blast_output.mci.I14]

$ mcxdump -icl [out.blast_output.mci.I20] -tabr [blast_output.tab] -o [dump.blast_output.mci.I20]

$ mcxdump -icl [out.blast_output.mci.I40] -tabr [blast_output.tab] -o [dump.blast_output.mci.I40]

$ mcxdump -icl [out.blast_output.mci.I60] -tabr [blast_output.tab] -o [dump.blast_output.mci.I60]

 

Alternatively:

- abc format에서 바로 clustering 하기

$ mcl [blast_output.abc] --abc -I 1.4