유전체 계통발생층서법 (Genomic phylostratigraphy) 유전체 계통발생층서법 (Genomic phylostratigraphy) 유전체학 공부를 하다보니 Genomic phylostratigraphy 분석이란 것을 접하게 되었습니다. 일단 이게 무엇인지 궁금하여 하나씩 어원을 따져보기로 하였습니다. Genomic 유전체적 Phylo- 계통발생학, Strati- layer 층, -graphy 기술방법, Stratigraphy: 층서학 - 지.. 생물정보학/Bioinformatics 2017.07.19
RAxML protein input 명령어 2016년 12월 27일 오후 08:41 RAxML protein input 명령어. bootstrapping 1000번 raxmlHPC-PTHREADS-SSE3 -T 8 -f a -m PROTGAMMADAYHOFF -p 12345 -x 12345 -# 1000 -s FcC_automated.fas -n FcC_automated.result http://sco.h-its.org/exelixis/resource/download/NewManual.pdf http://sco.h-its.org/exelixis/web/software/raxml/hands_on.html 생물정보학/Bioinformatics 2016.12.27
계통수(Phylogenetic tree) 제작에 대한 고찰 계통수(Phylogenetic tree) 제작에 대한 고찰 사람들이 계통수 제작(Phylogenetic tree construction)을 너무 쉽게 생각하는 경향이 있어서, 계통수 제작에 대한 고찰을 해보고자 합니다. 옛날에는 생물들의 근연관계를 형태적(Mormological)으로 구분하여 분류군(clade)으로 묶었습니다. 하지만 현재 유전학.. 생물정보학/Bioinformatics 2016.12.10
N50, L50 및 연관된 통계치 N50과 L50 전산생물학에서 N50과 L50은 유전체의 어셈블된 단위인 contig 또는 scaffold의 길이를 나타내는 통계값 입니다. N50은 길이의 평균 또는 중앙값과 비슷하지만, 더 긴 contig에 더 많은 가중치를 둡니다. 이것은 유전체 어셈블리에 많이 쓰이고, 특히 드래프트 어셈블리의 contig 길이들을 .. 생물정보학/Bioinformatics 2016.12.01
dN/dS ratios (또는 Ka/Ks) 에서 추측 할 수 있는 결론 dN/dS ratios (또는 Ka/Ks) 에서 추측 할 수 있는 결론 https://www.biostars.org/p/5817/ * Synonymous: 단백질 서열에 영향을 안 주는 DNA 치환 * Non-synonymous: 단백질 서열에 영향을 주는 DNA 치환 Neutral Evolution (중립 진화: Drfit: 부동): dN/dS ratio = 1 의 뜻은 조상에서 현재의 단백질간의 시간 동안 synonymous와 non-sy.. 생물정보학/Bioinformatics 2016.04.11
blast tabular format 추가 + Query coverage -outfmt "6 qseqid sseqid pident length mismatch gapopen qstart qend sstart send evalue bitscore qlen slen" 1. qseqid Query Seq-id 2. sseqid Subject Seq-id 3. pident Percentage of identical matches 4. length Alignment length 5. mismatch Number of mismatches 6. gapopen Number of gap openings 7. qstart Start of alignment in query 8. qend End of alignment in query 9. sstart Start .. 생물정보학/Bioinformatics 2016.03.12
NCBI의 nr db에서 특정 종 제거하기 NCBI의 nr db에서 특정 종 제거하기 blastn 과 blastp에는 모두 -negative_gilist 옵션이 있습니다. 이 옵션을 사용하여 로컬로 다운받은 nr에서 특정 GI 세트를 빼고 blast를 할 수 있습니다. 원하는 종의 모든 서열에 대한 GI 파일을 만들고 싶다면, nucleotide나 protein search space (nucleotide: http://www.ncbi.nlm.nih.. 생물정보학/Bioinformatics 2016.01.04
Composition Vector Tree (CVtree) 사용법 CVtree for constructing phylogenetic tree * CVTree2 web version - 하나의 protein file 또는 contig file의 크기가 20MB, 전체 파일의 크기는 100MB로 * CVTree stand-alone 사용 - protein sequence들을 사용해서 수행하였다. - K-tuple: 7 - Pezizomycotina에 속하는 4종의 lichen들이 잘 묶여있는 것을 볼 수 있다. CVTree stand-alone 사용법 .. 생물정보학/Bioinformatics 2015.11.23
SEARCHING BEST HITS FROM BLAST TABLE FORMAT SEARCHING BEST HITS FROM BLAST TABLE FORMAT sort -k1,1 -k12,12nr -k11,11n blastout.txt | sort -u -k1,1 --merge sort 1 첫번째로 query name으로 Blast Ouput을 sorting 한 다음, 12번째 column(bit score)을 내림차순으로 정렬하고, 마지막으로 11번째 column(E value)을 오름차순으로 정렬한다. sort 2 각 줄의 첫번째 query만을 선택한다. Ou.. 생물정보학/Bioinformatics 2015.07.22
mcl clustering Mcl clustering 하는 방법 1. BLASTDB를 만든다 $ makeblastdb -in [input_file] -dbtype [nucl, prot] -title [db_name] 2. All-by-All BLAST를 수행한다. $ blastp -db [db_name] -query [query_file] -out [outfile_name] -evalue [e.g. 0.001] -outfmt [6 - tabular] -num_threads [Cpu 개수] 3. BLAST 결과에 기록된 Clustering similarity graphs - BLAST output을 ABC 포맷.. 생물정보학/Bioinformatics 2015.03.27