생물정보학/Bioinformatics

E-value 설명

케이든 2014. 10. 26. 15:26

 

E-value

 

종종 Biologist로부터, e-value가 의미하는 바가 무엇이냐는 질문을 받는다.

복잡한 통계적 수식말고, 간단히 설명하면,

 

검색 Database가 모두 random sequence라고 가정했을대, query 서열이 match되리라 기대되는 Database내의 서열의 갯수를 의미한다.

 

만약 BLAST의 E-value가 1e-12이면 0에 가까운 수이다.

 

따라서 쿼리서열이 우연히 조합되어 만들졌을 가능성이 매우 작다.

(검색 데이터베이스를 Random Data라고 가정했으므로).

 

즉, 랜덤서열중에 비슷한게 거의 없다는 의미이므로, 어떤 정보를 담고 있을 확률이 높다는 뜻이 된다

(=유의하다).

 

출처 - BioHackersNet [http://biohackers.net/wiki/BLAST]