반응형

MARS 설치 및 실행하기



Multiple sequence alignment를 할 때 Input은 항상 linear하게 줄 수 밖에 없는데 mitochondrial DNA, viroid, viral or other genome 같은 circular DNA의 경우 시작과 끝을 정의할 수 없기 때문에 기준 없이 넣었다가는 이상한 결과가 나온다.


MARS는 sequence shifting을 통해 이러한 문제를 해결하고자 만든 프로그램이다.



프로그램은 github에서 받을 수 있다.


git clone https://github.com/lorrainea/mars

cd mars

./pre-install.sh

make -f Makefile


순서대로 진행하면 mars 실행파일이 생성된다.


실행명령은 아래처럼 하면 된다.


mars -a DNA/PROT -i input.fasta -o output.fasta -m 1 -T threads


output.fasta파일은 start와 end가 맞추어 졌으니 다시 clustal omega와 같은 MSA 프로그램에 결과를 기다리면 된다.



밑에 예시에서는 5종의 mitochondria sequence를 넣고 바로 MSA를 했을 때 밑의 두 종의 sequence만 먼저 나오는 것을 확인할 수 있었지만 mars를 진행한 뒤 다시 MSA를 했을 땐 정상적으로 align되는 것을 확인할 수 있었다.





Reference -

https://github.com/lorrainea/mars

Lorraine A. K. Ayad and Solon P. Pissis, MARS: improving multiple circular sequence alignment using refined sequences, BMC Genomics, 2017 https://doi.org/10.1186/s12864-016-3477-5

반응형

'bioinformatics' 카테고리의 다른 글

Stem cell  (0) 2018.04.05
Single cell sequencing  (0) 2018.04.05
BEAGLE-LIB 설치하기  (0) 2017.09.27
BEAST 설치 및 실행하기  (0) 2017.09.27
MHAP 설치 및 실행하기  (0) 2017.09.19
반응형

MHAP 설치 및 실행하기




MHAP은 2015년 Nature Biotechnology에 출판된 논문(http://www.nature.com/nbt/journal/v33/n6/full/nbt.3238.html

)에서 소개하고 있는 프로그램이다.

Konstantin Berlin et al, Assembling large genomes with single-molecule sequencing and locality-sensitive hashing, Nature Biotechnology, 2015


K-mer의 Jaccard similarity를 계산하고 PacBio나 Nanopore long read를 빠르게 mapping할 수 있는 프로그램이다.


설치는 아래의 명령어를 따라하면 된다.

git clone https://github.com/marbl/MHAP.git
cd MHAP
mvn install

설치가 끝나면 target이라는 폴더가 생기고 그 안에 mhap-*.jar 이라는 파일이 생성되었을 것이다.

java -jar mhap-*.jar 으로 실행하면 된다.



간단하게 명령어를 설명하면 


java -server -Xmx300g -jar mhap-2.1.3.jar --num-threads 32 -q <long reads> -s <contigs>


300g의 메모리를 사용하고 32개의 쓰레드를 사용하며 long reads를 contigs에 mapping하겠다는 의미이다.



설명에 따로 index파일을 만드는 법이 나와있지 않고 매번 명령어를 실행할 때마다 임시로 index를 진행하기 때문에 indexing을 미리 해두면 여러 번 작업할때 시간을 단축할 수 있다. (그래도 mammalian genome을 indexing하는데 10분정도 밖에 안걸린다.)


java -server -Xmx300g -jar mhap-2.1.3.jar -p fastafile.fasta -q output_directory


결과로 fastafile.dat 파일이 생성되는데 alignment 할 때 fasta 파일 대신 dat 파일을 넣어주면 된다.






반응형

'bioinformatics' 카테고리의 다른 글

BEAGLE-LIB 설치하기  (0) 2017.09.27
BEAST 설치 및 실행하기  (0) 2017.09.27
Racon 설치 및 실행하기  (0) 2017.09.19
Phylip 설치 및 실행하기  (0) 2017.09.18
CAFE v4.0 설치 및 실행하기  (0) 2017.09.11

+ Recent posts