반응형

MHAP 설치 및 실행하기




MHAP은 2015년 Nature Biotechnology에 출판된 논문(http://www.nature.com/nbt/journal/v33/n6/full/nbt.3238.html

)에서 소개하고 있는 프로그램이다.

Konstantin Berlin et al, Assembling large genomes with single-molecule sequencing and locality-sensitive hashing, Nature Biotechnology, 2015


K-mer의 Jaccard similarity를 계산하고 PacBio나 Nanopore long read를 빠르게 mapping할 수 있는 프로그램이다.


설치는 아래의 명령어를 따라하면 된다.

git clone https://github.com/marbl/MHAP.git
cd MHAP
mvn install

설치가 끝나면 target이라는 폴더가 생기고 그 안에 mhap-*.jar 이라는 파일이 생성되었을 것이다.

java -jar mhap-*.jar 으로 실행하면 된다.



간단하게 명령어를 설명하면 


java -server -Xmx300g -jar mhap-2.1.3.jar --num-threads 32 -q <long reads> -s <contigs>


300g의 메모리를 사용하고 32개의 쓰레드를 사용하며 long reads를 contigs에 mapping하겠다는 의미이다.



설명에 따로 index파일을 만드는 법이 나와있지 않고 매번 명령어를 실행할 때마다 임시로 index를 진행하기 때문에 indexing을 미리 해두면 여러 번 작업할때 시간을 단축할 수 있다. (그래도 mammalian genome을 indexing하는데 10분정도 밖에 안걸린다.)


java -server -Xmx300g -jar mhap-2.1.3.jar -p fastafile.fasta -q output_directory


결과로 fastafile.dat 파일이 생성되는데 alignment 할 때 fasta 파일 대신 dat 파일을 넣어주면 된다.






반응형

'bioinformatics' 카테고리의 다른 글

BEAGLE-LIB 설치하기  (0) 2017.09.27
BEAST 설치 및 실행하기  (0) 2017.09.27
Racon 설치 및 실행하기  (0) 2017.09.19
Phylip 설치 및 실행하기  (0) 2017.09.18
CAFE v4.0 설치 및 실행하기  (0) 2017.09.11

+ Recent posts