Circos plot 그리기.
여러 프로그램들이 circos plot을 지원하지만 아래 프로그램이 입력 데이터 포맷도 편하고 원하는 그림을 그릴 수 있어서 추천한다.
perl 기반으로 작동하기 때문에 perl 없다면 설치부터 해야한다.
2017/04/25 - [linux] - Perl 설치 및 실행하기
홈페이지 http://circos.ca/
다운로드 http://circos.ca/software/download/
설치 후 bin 폴더 안에 circos 실행 파일이 있으며 실행에 필요한 perl module이 다수 있다.
cpan Config::General Font::TTF GD List::MoreUtils Math::Bezier Math::Round Math::VecStat Params::Validate Readonly Regexp::Common Set::IntSpan Text::Format SVG Clone Statistics::Basic
default perl이라면 위의 모듈만 설치해도 아마 돌아갈 것이다.
워낙 많은 기능을 포함하고 있어서 다 써보지도 못했지만 기본적인 내용은 best practice에 가면 configure파일과 그림을 제공하고 있으므로 따라하면 된다.
제일 기본이 되는 내용만 몇 개 요약하고자 한다.
프로그램은 configure 파일을 읽어서 설정과 입력 데이터를 확인하고 plot을 그린다.
circos를 설치한 폴더에 circos.conf라는 파일이 있는데 참고하면 된다.
1. 가장 기본이되는 backbone이 되는 karyotype이 필요하다. 기본 path는 data/karyotype이며 human을 비롯한 몇 종의 chromosome 정보가 이미 들어가 있다.
circos.conf파일에서는 human 데이터를 아래와 같이 사용하고 있다.
karyotype = data/karyotype/karyotype.human.txt
여러 genome을 동시에 그리고 싶다면 comma(,)를 넣어서 구분해주면 된다.
karyotype = data/karyotype/karyotype.human.txt,data/karyotype/karyotype.chimp.txt
hg19의 파일을 열어보면 아래와 같은 포맷으로 되어있다.
chr - hs1 1 0 249250621 chr1
chr - hs2 2 0 243199373 chr2
chr - hs3 3 0 198022430 chr3
...
chr - hs22 22 0 51304566 chr22
chr - hsX x 0 155270560 chrx
chr - hsY y 0 59373566 chry
순서대로 크로모좀, 패스, 여러 종류의 genome데이터가 들어갈 때 각각을 구분하기 위한 표시, circosplot에서 보여주는 이름, 패스, 염색체 크기, color 이다.
3열의 경우 human과 침팬지를 같이 그리고자 할 때 들어가는 input data에서 hs1 이라면 사람을 chim1이라면 침팬지를 의미하는 것으로 구분을 하고 싶을 때 사용한다.
color는 이미 chr1이 어떤 color를 가지고 있다는 것을 etc/colors.ucsc.conf 에서 정의했기 때문에 저렇게 표시해도 color이며 RGB나 다른 방식으로 색을 주어도 된다.
'bioinformatics' 카테고리의 다른 글
NCBI BLAST+ 설치 및 실행하기 (0) | 2017.08.16 |
---|---|
Busco 설치 및 실행하기 (0) | 2017.08.16 |
GLOOME 설치 및 실행하기 (0) | 2016.12.19 |
bowtie2에서 mismatch 허용하기 (0) | 2016.09.13 |
miRNA 명명 규칙 (0) | 2016.09.01 |