생물정보학/Genomics

FASTQC – Raw Data Quality Control

케이든 2016. 1. 11. 17:44

 

FASTQC – Raw Data Quality Control

 

FASTAQC는 data 안에 bias 또는 문제가 있는지 확인하고 미가공 data가 좋은 상태인지 확인하는 quality control (QC)를 위해 사용하는 application/software 프로그램 입니다. 이 프로그램은 library material과 sequencer에서 유래되는 문제를 찾아내는 것을 목적으로 합니다. FASTQC는 FASTQ. BAM 또는 SAM 파일과 같은 미가공 data의 추가 분석을 하는데 사용됩니다.

 

FASTQC의 기능:

문제가 되는 부분을 빠르게 찾아냄

그래프와 테이블로 빠른 data 평가 가능

HTML로 보고

상호적인 오프라인 보고 허용

 

예제:

Good quality data read: 

 

Poor quality data read:

 

출처: http://www.beckmangenomics.com/genomic_services/bioinformatics/understanding_sequencing_data_file_formats.html#fastqc