SyMap 설치 및 실행하기
SyMap은 university of arizona의 arizona genomics computational lab에서 개발한 프로그램으로
두 개 이상의 genome간의 synteny 분석을 하는데 사용되는 tool이다.
홈페이지 : http://www.agcol.arizona.edu/software/symap/index.html
Soderlund et al., 2006, SyMAP: A system for discovering and viewing syntenic regions of FPC maps, Genome Res. 16:1159-1168.
Soderlund et al., 2011, SyMAP v3.4: a turnkey synteny system with application to plant genomes, Nucleic Acids Res. 39(10):e68.
대부분의 synteny alignment 프로그램은 2개 이상의 genome을 지원하지 않는다.
SyMap은 아래와 같이 Rice의 Chr1을 기준으로 양 옆으로 genome을 놓고 alignment 결과를 비교할 수 있다.
하지만 Chromosome 하나씩 골라서 비교를 하고 있기 때문에 genome 전체적인 synteny map을 보고싶다면 circos plot을 그리는 것을 추천한다.
circos plot으로 그리면 아래와 같이 나온다.
3D version으로 여러개의 chromosome을 비교할 수도 있지만 아래의 결과는 서버 내에서 graphical support가 있어야 그릴 수 있다. (VGA 카드)
설치 및 실행 방법은
실행은 GUI를 쓰고 있기 때문에 DISPLAY가 필요하다.
terminal 프로그램을 통해서 리눅스 서버에서 작업을 하고 있다면 X11 DISPLAY가 필요하다고 나올 것이다.
xming 프로그램을 추천한다.
xming을 설치하고 실행한 후 다시 symap을 실행하면 열린다.
symap -20480N -no3d -p 16
으로 실행하면 20G의 메모리를 사용하며 CPU는 16개를 사용하고 3D plot은 찍지 않겠다는 의미로 실행이 된다.
메모리 디폴트 값이 매우 적기 때문에 large genome을 사용하고있다면 필히 메모리를 늘려야 하며 3d 는 서버에 VGA카드가 없으면 해당 옵션을 넣어주지 않으면 프로그램 실행 도중 에러가 날 수 있다. CPU는 프로그램 내에서도 바꿀 수 있기 때문에 넣지 않아도 무관하다.
실행이 정상적으로 되면 위와 같은 화면이 나온다.
여기서 팁을 주자면 모니터 좌측 상단에 실행이되며 이동이 불가능한 상태로 켜지는데 마우스를 창 가장 우측이나 하단에 놓고 사이즈를 조절하면
위와같이 최대화가 보이도록 조절 할 수 있게 된다!
Project로 각각의 genome과 annotation을 넣어서 Project끼리 비교를 하게 되는데 /PATH/TO/INSTALL/SYMAP/data/pseudo/ 안에 폴더를 생성하면 uncategorized 위치에 생성한 폴더 명과 일치하는 project가 생긴다.
Project를 로딩 후 각각 genome fasta 파일과 annotation 파일의 경로를 넣은 뒤 loading하면 alignment 준비는 끝난다.
Alignment는 전체 genome을 쪼개서 주어진 CPU를 사용하여 진행하는데 테스트로 한 번 돌리면 포유동물 2.5Gb가 30개로 쪼개진다. CPU를 3, 5, 6개로 주면 시간을 최적화 할 수 있다.
Align된 결과는 data/pseudo_pseudo/ 폴더 안에서 찾을 수 있다. block이나 anchor 파일을 찾으면 block단위로 찾을 수 있다.
'bioinformatics' 카테고리의 다른 글
Synteny Circos plot 그리기 (0) | 2017.08.30 |
---|---|
Arrow/Quiver 설치 및 사용하기 (0) | 2017.08.24 |
GMAP 설치 및 실행하기 (0) | 2017.08.22 |
AGOUTI 설치 및 실행하기 (0) | 2017.08.21 |
Augustus 설치 및 실행하기 (0) | 2017.08.16 |