SEARCHING BEST HITS FROM BLAST TABLE FORMAT
sort -k1,1 -k12,12nr -k11,11n blastout.txt | sort -u -k1,1 --merge
sort 1
첫번째로 query name으로 Blast Ouput을 sorting 한 다음, 12번째 column(bit score)을 내림차순으로 정렬하고, 마지막으로 11번째 column(E value)을 오름차순으로 정렬한다.
sort 2
각 줄의 첫번째 query만을 선택한다. Output이 원하는 순서대로 정렬되어 있으면 첫번째 sort를 생략 할 수 있다.
'생물정보학 > Bioinformatics' 카테고리의 다른 글
NCBI의 nr db에서 특정 종 제거하기 (0) | 2016.01.04 |
---|---|
Composition Vector Tree (CVtree) 사용법 (0) | 2015.11.23 |
mcl clustering (0) | 2015.03.27 |
Multiple Sequence Alignment 중 Progressive Alignment 기법 (0) | 2014.10.26 |
Position-Specific Socring Matrix (PSSM) 설명 (0) | 2014.10.26 |