유전적 다양성의 비교를 통해 자연선택에 대한 정보를 얻을 수 있을까요? 유전적 다양성의 비교를 통해 자연선택에 대한 정보를 얻을 수 있을까요? 예를 들어 중립적 마커(neutral maker)에 낮은 핵산 다양성과 하플로타입 다양성을 갖는 집단들은 대게 강한 선택압 아래 있습니다. 약한 선택압 아래에선, 이들의 유전적 다양성은 높을 것 입니다. 유전적 다양성은 .. 생물정보학/Genomics 2017.11.28
계통발생층서법으로 동물 계통의 주요 적응에 대한 유전체적 역사를 밝힘 계통발생층서법으로 동물 계통의 주요 적응에 대한 유전체적 역사를 밝힘 초록 대진화적 경향 연구 방법: 화석 분석, 비교 형태학, 진화 발생(evo-devo) 방법 등이 있다. 다양한 계통의 유전체가 사용 가능해짐에 따라 계통발생층서법이라는 새로운 접근 방법이 사용가능 해졌다. 초파리의 .. 생물정보학/Genomics 2017.07.29
GTF/GFF2 to GFF3 Cufflinks는 gtf output을 gff로 변환해주는 tool 인 gffread가 있습니다. gffread -E merged.gtf -o- > merged.gff3 이것은 에러(-E)와 standard out(-o-)을 해 줍니다. 출처: https://www.biostars.org/p/50445/ 그 외 유용한 perl 파일 올림 gtf2gff3.pl 연결된 링크 http://blog.daum.net/naturelove87/127 생물정보학/Genomics 2016.06.08
FASTQC – Raw Data Quality Control FASTQC – Raw Data Quality Control FASTAQC는 data 안에 bias 또는 문제가 있는지 확인하고 미가공 data가 좋은 상태인지 확인하는 quality control (QC)를 위해 사용하는 application/software 프로그램 입니다. 이 프로그램은 library material과 sequencer에서 유래되는 문제를 찾아내는 것을 목적으로 합니다. FASTQC.. 생물정보학/Genomics 2016.01.11
FASTQ format - Raw Data Read FASTQ format - Raw Data Read FASTQ format은 FASTA format에서 유래된 텍스트 파일(.txt) 입니다. 이 format은 FASTA 서열에 quality score를 합쳐서 Wellcome Trust Sanger Institute에서 개발 하였습니다. FASTQ는 서열 당 4개의 줄로 이루어진 flat txt file로 서열(Base call)과 quality score (아스키 문자)를 같은 파일에 담고 있습.. 생물정보학/Genomics 2016.01.11
FASTA format - Raw Data FASTA format - Raw Data FASTA format은 FASTA software package에서 유래된 텍스트 파일(.txt)로 같은 파일 안에 서열(base call)과 한 줄의 서열에 대한 설명(header)이 저장되어 있습니다. 이것은 text-processing tools 또는 프로그래밍 언어 (Perl, Python, Ruby 등)들이 서열에 대한 파싱(parsing)을 쉽게 할 수 있도록 해.. 생물정보학/Genomics 2016.01.11
BED format BED format BED (Browser Extensible Data) format은 annotation track 위에 보여지는 data lines를 정의하는데 유연한 방법을 제공합니다. BED lines는 3가지의 필수적 필드(Fields)가 있고, 추가적으로 9가지의 선택적 필드가 있습니다. Annotation track안의 모든 data의 line 당 필드의 숫자는 모두 균일해야 합니다. 선.. 생물정보학/Genomics 2016.01.11
BAM format BAM format BAM 포맷은 Sequence Aligment/MAP (SAM) 포맷의 압축 binary version으로 nucleotide sequence alignment의 소형화되고 색인가능한 표현입니다. 많은 NGS 분석 도구들이 SAM/BAM 형태의 파일들을 사용합니다. 예제 출처: USCS genome browser & http://www.beckmangenomics.com/genomic_services/bioinformatics/understanding_sequencing_da.. 생물정보학/Genomics 2016.01.07
SAM format (Sequence Alignment/MAP format) - Alignments SAM format (Sequence Alignment/MAP format) - Alignments SAM은 sequence alignment data를 담고 있는 tab으로 나누어진 텍스트 파일(.txt)로 alignment/mapping 정보를 보고하는 산업 기준 입니다. SAM은 자매 형태인 압축되고, 색인화 되고, binary 형태인 BAM format의 사람이 읽기 가능한 버전입니다. Samtools는 SAM 파일들을 .. 생물정보학/Genomics 2016.01.07
GFF/GTF 다른 점과 변환하는 방법 GFF/GTF 다른 점과 변환하는 방법 두 파일이 무엇이고, 어떻게 서로 변환하는지 알아보자! 원글: Damian Kao, 번역: 김기태 소개 GFF 와 GTF 는 데이터 형식들로서 annotation 정보를 저장하는데 사용된다. 우리는 매우 자주 이 두 가지의 형식이 호환되어 사용되는 것을 볼 수 있다. 그러나 GFFs (general.. 생물정보학/Genomics 2014.04.29