반응형

Circos plot 그리기.



여러 프로그램들이 circos plot을 지원하지만 아래 프로그램이 입력 데이터 포맷도 편하고 원하는 그림을 그릴 수 있어서 추천한다.


perl 기반으로 작동하기 때문에 perl 없다면 설치부터 해야한다.


2017/04/25 - [linux] - Perl 설치 및 실행하기




홈페이지 http://circos.ca/


다운로드 http://circos.ca/software/download/



설치 후 bin 폴더 안에 circos 실행 파일이 있으며 실행에 필요한 perl module이 다수 있다.


cpan Config::General Font::TTF GD List::MoreUtils Math::Bezier Math::Round Math::VecStat Params::Validate Readonly Regexp::Common Set::IntSpan Text::Format SVG Clone Statistics::Basic


default perl이라면 위의 모듈만 설치해도 아마 돌아갈 것이다.


Application of Circos to displaying sequence conservation and similiarity. (800 x 693)



워낙 많은 기능을 포함하고 있어서 다 써보지도 못했지만 기본적인 내용은 best practice에 가면 configure파일과 그림을 제공하고 있으므로 따라하면 된다.



제일 기본이 되는 내용만 몇 개 요약하고자 한다.


프로그램은 configure 파일을 읽어서 설정과 입력 데이터를 확인하고 plot을 그린다.


circos를 설치한 폴더에 circos.conf라는 파일이 있는데 참고하면 된다.


1. 가장 기본이되는 backbone이 되는 karyotype이 필요하다. 기본 path는 data/karyotype이며 human을 비롯한 몇 종의 chromosome 정보가 이미 들어가 있다.


circos.conf파일에서는 human 데이터를 아래와 같이 사용하고 있다.

karyotype = data/karyotype/karyotype.human.txt


여러 genome을 동시에 그리고 싶다면 comma(,)를 넣어서 구분해주면 된다.

karyotype = data/karyotype/karyotype.human.txt,data/karyotype/karyotype.chimp.txt


hg19의 파일을 열어보면 아래와 같은 포맷으로 되어있다.

chr - hs1 1 0 249250621 chr1
chr - hs2 2 0 243199373 chr2
chr - hs3 3 0 198022430 chr3
...
chr - hs22 22 0 51304566 chr22
chr - hsX x 0 155270560 chrx
chr - hsY y 0 59373566 chry


순서대로 크로모좀, 패스, 여러 종류의 genome데이터가 들어갈 때 각각을 구분하기 위한 표시, circosplot에서 보여주는 이름, 패스, 염색체 크기, color 이다.


3열의 경우 human과 침팬지를 같이 그리고자 할 때 들어가는 input data에서 hs1 이라면 사람을 chim1이라면 침팬지를 의미하는 것으로 구분을 하고 싶을 때 사용한다.


color는 이미 chr1이 어떤 color를 가지고 있다는 것을 etc/colors.ucsc.conf 에서 정의했기 때문에 저렇게 표시해도 color이며 RGB나 다른 방식으로 색을 주어도 된다.



반응형

'bioinformatics' 카테고리의 다른 글

NCBI BLAST+ 설치 및 실행하기  (0) 2017.08.16
Busco 설치 및 실행하기  (0) 2017.08.16
GLOOME 설치 및 실행하기  (0) 2016.12.19
bowtie2에서 mismatch 허용하기  (0) 2016.09.13
miRNA 명명 규칙  (0) 2016.09.01
반응형

http://www.repeatmasker.org/RMDownload.html 에 접속


1. perl 버전이 5.8.0 이상인지 확인

2. Search Engine으로 사용할 프로그램 다운로드

3. Repeatmasker 다운로드.


tar zxf RepeatMasker-open-?-?-?.tar.gz 


cd RepeatMasker


perl ./configure


1. 사용할 perl의 PATH

2. Repeatmasker를 설치할 PATH

3. trf의 PATH ( trf 실행 파일의 주소까지 넣어야 함 )

4. 설치할 Search Engine. 적어도 한 가지를 설치하여야 하며 이번에는 bin folder를 경로에 입력.


으로 설치가 끝남.


Repeatmakser 4.0.6은 library의 업데이트를 필요로 하므로 작업이 더 필요한데 4.0.7은 그냥 진행 가능함.



설치가 끝나면 실행 명령은 


RepeatMasker -species <human> -q <hg38.fa>


human은 약 1주일 정도 소요됨.




※ RepeatMasker 사용시 simple repeat을 찾기 위해 trf를 사용하는데 4.0.6 기준으로 trf는 GLIBC_2.14 library를 필요로 함.


error message = trf409.linux64: /lib64/libc.so.6: version `GLIBC_2.14' not found


프로그램을 돌릴 때 trf가 제대로 안돌아 가더라도 결과가 나오기 때문에 프로그램이 정상적으로 돌아간다고 착각할 수 있음.


미리 trf를 따로 실행해서 제대로 결과가 나오는지 확인 필요함.



반응형

'Computer Science > linux' 카테고리의 다른 글

GCC 설치하기  (1) 2017.09.18
cURL 로컬 설치하기  (0) 2017.08.24
GBrowse2 설치하기  (0) 2017.04.25
Perl 설치 및 실행하기  (0) 2017.04.25
유닉스 명령어 grep, sed, awk 사용해보기  (0) 2016.08.24
반응형

Perl과 apache가 설치되어 있어야함.


windows버전은 GBrowse 1.70 버전까지 지원했다는 글이 있는데 현재는 확인 불가 ( 시도해 보았으나 성공하지 못함. )


Gbrowse2 다운로드 url : https://sourceforge.net/projects/gmod/files/Generic%20Genome%20Browser/


perl module을 다수 설치해야함.


perl Build.pl을 해서 초기 설정을 잡아주어야 함 이 때 module이라는 이름의 perl module이 설치되어 있지 않다면 cpan Module::Build 부터 해주어야 함.


그 이후에는 ./Build installdeps 를 하면 dependency를 알아서 설치해줌. but 수동 설치가 필요한 부분이 존재함


1. 

Please enter the location of Kent source tree: 

Can't find the bigWig.h and jkweb.a files at this location.

Try again, or hit <enter> to cancel: 


Kent source tree는 Kentutils를 설치해야 함.


[링크]

git clone https://github.com/ENCODE-DCC/kentUtils.git 

git에서 다운 받은 후 README.md를 읽으면 설치 방법이 있음.


cd kentuils && make


export KENT_SRC=/PATH/TO/INSTALL/kentUtils/src:$KENT_SRC


2.

Running install for module 'Bio::DB::Sam'

Checksum for /home/kyoungwoo/.cpan/sources/authors/id/L/LD/LDS/Bio-SamTools-1.43.tar.gz ok

Configuring L/LD/LDS/Bio-SamTools-1.43.tar.gz with Build.PL

This module requires samtools 0.1.10 or higher (samtools.sourceforge.net).

Please enter the location of the bam.h and compiled libbam.a files: 


samtools의 bin 파일이 아니라 소스 파일의 경로를 확인해서 넣어주면 됨.

필수 perl module 설치가 끝나면 ./Build test ./Build isntall을 해서 build를 하고 ./Build apache_config를 해서 화면으로 출력되는 config를 복사.
apache config 파일 내에 붙여넣기를 하면 끝남.

apache config파일은 /etc/httpd/conf/httpd.conf 이며 내용 수정 후 apache를 재시작 하면 됨. apachectl -k graceful

브라우저를 켜서 localhost/gbrowse2 로 접속.


반응형

'Computer Science > linux' 카테고리의 다른 글

GCC 설치하기  (1) 2017.09.18
cURL 로컬 설치하기  (0) 2017.08.24
Repeatmasker 설치  (0) 2017.05.05
Perl 설치 및 실행하기  (0) 2017.04.25
유닉스 명령어 grep, sed, awk 사용해보기  (0) 2016.08.24
반응형

다운로드는 공식 홈페이지 https://www.perl.org/get.html 에서 받으면 된다. (stable source code 추천)


wget http://www.cpan.org/src/5.0/perl-5.24.1.tar.gz (4/25/2017 stable 버전)


less README를 하면 설치 가이드를 볼 수 있다.



./Configure -des -Dprefix=$HOME/localperl -Dusethreads


-des = configure 과정 중에 질문이 있는데 항상 default로 진행 된다.

-Dprefix = 프로그램이 설치될 경로 이다.

-Dusethreads = 일부 프로그램을 perl의 multi threads를 요구하기때문에 compile단계에서 설정해주면 나중에 재설치할 필요가 없음. 단, 해당 옵션으로 설치했을 때 단일 thread 프로그램은 조금 느려질 수 있다. (사용을 추천)


make test && make install


make하는데 시간이 상당히 소요된다.


install 이 끝난 후에는 -Dprefix에 넣었던 PATH 안에 있는 의 bin과 lib 폴더를 export 해주면 끝.

반응형

'Computer Science > linux' 카테고리의 다른 글

GCC 설치하기  (1) 2017.09.18
cURL 로컬 설치하기  (0) 2017.08.24
Repeatmasker 설치  (0) 2017.05.05
GBrowse2 설치하기  (0) 2017.04.25
유닉스 명령어 grep, sed, awk 사용해보기  (0) 2016.08.24
반응형

line을 읽을 때 아래와 같이 구분자가 \t으로 되어 있지 않고 space로 되어 있는데다가 그 길이가 그때그때마다 다를 경우 parsing하기가 쉽지 않다. 


regular expression을 써서 구분하면 된다.


julia> a

" t= 0.2652  S=    38.3  N=    99.7  dN/dS=  0.5082  dN = 0.0697  dS = 0.1371\n"


julia> matchall(r"\d+.\d+",a)
6-element Array{SubString{String},1}:
 "0.2652"
 "38.3"  
 "99.7"  
 "0.5082"
 "0.0697"
 "0.1371"

아래의 list를 받아서 원하는 index에서 숫자를 가져오면 된다. string으로 되어 있기 때문에 float으로 바꿔서 가져와야 사용할 수 있다.

반응형

+ Recent posts