반응형

MHAP 설치 및 실행하기




MHAP은 2015년 Nature Biotechnology에 출판된 논문(http://www.nature.com/nbt/journal/v33/n6/full/nbt.3238.html

)에서 소개하고 있는 프로그램이다.

Konstantin Berlin et al, Assembling large genomes with single-molecule sequencing and locality-sensitive hashing, Nature Biotechnology, 2015


K-mer의 Jaccard similarity를 계산하고 PacBio나 Nanopore long read를 빠르게 mapping할 수 있는 프로그램이다.


설치는 아래의 명령어를 따라하면 된다.

git clone https://github.com/marbl/MHAP.git
cd MHAP
mvn install

설치가 끝나면 target이라는 폴더가 생기고 그 안에 mhap-*.jar 이라는 파일이 생성되었을 것이다.

java -jar mhap-*.jar 으로 실행하면 된다.



간단하게 명령어를 설명하면 


java -server -Xmx300g -jar mhap-2.1.3.jar --num-threads 32 -q <long reads> -s <contigs>


300g의 메모리를 사용하고 32개의 쓰레드를 사용하며 long reads를 contigs에 mapping하겠다는 의미이다.



설명에 따로 index파일을 만드는 법이 나와있지 않고 매번 명령어를 실행할 때마다 임시로 index를 진행하기 때문에 indexing을 미리 해두면 여러 번 작업할때 시간을 단축할 수 있다. (그래도 mammalian genome을 indexing하는데 10분정도 밖에 안걸린다.)


java -server -Xmx300g -jar mhap-2.1.3.jar -p fastafile.fasta -q output_directory


결과로 fastafile.dat 파일이 생성되는데 alignment 할 때 fasta 파일 대신 dat 파일을 넣어주면 된다.






반응형

'bioinformatics' 카테고리의 다른 글

BEAGLE-LIB 설치하기  (0) 2017.09.27
BEAST 설치 및 실행하기  (0) 2017.09.27
Racon 설치 및 실행하기  (0) 2017.09.19
Phylip 설치 및 실행하기  (0) 2017.09.18
CAFE v4.0 설치 및 실행하기  (0) 2017.09.11
반응형

PacificBiosciences 에서 제공하는 Arrow/Quiver 설치 및 사용하기.




Pacbio only assembly는 Canu나 Falcon 등의 프로그램으로 진행됨. assembly가 끝나고 난 뒤 polish과정을 거쳐야 하는데 polish는 SNPs이나 small tandem repeat등으로 인해 assembly에 생기는 작은 오류를 수정하는 과정이다.


과거에는 Quiver라는 이름으로 제공되었으나 legacy가 되고 Arrow로 이름이 바뀌었다.

(정확히는 프로그램 이름은 여전히 Quiver이나 안에 있는 알고리즘이 Arrow가 쓰이는 것이다.)



git hub에서 GenomicConsensus라는 이름으로 제공되는 패키지를 받아서 설치해야한다.



GenomicConsensus는 Python 모듈이며 2.7+ 버전을 요구한다. (3.X버전은 안됨)


git clone 설치 후 


python setup.py install


로 설치 가능한데 


아래와 같은 dependency가 필요하다.


        'pbcore >= 1.2.9',

        'pbcommand >= 0.3.20',

        'numpy >= 1.6.0',

        'h5py >= 2.0.1',

        'ConsensusCore >= 1.0.1'

        # , 'ConsensusCore2 >= 0.9',

 

다른 모듈들은 pip 등으로 설치 가능하나 ConsensusCore는 따로 설치해 줘야 한다.


ConsensusCore2는 legacy로 들어간듯 하고 그냥 ConsensusCore를 설치하면 된다.



Pacbio에서 만든 파이썬 모듈같다. 위와 마찬가지로


Python setup.py install 


하면 되는데 이번엔 SWIG를 설치하라고 한다....



SWIG는 인터페이스 컴파일러라는데 정확히는 뭔지 파악 불가..


http://www.swig.org/download.html


설치방법은 일반적인 프로그램이랑 같다.


./configure --prefix=/PATH/TO/INSTALL/SWIG

make && make install


export PATH=/PATH/TO/INSTALL/SWIG/bin:$PATH


SWIG을 설치하고 다시 ConsensusCore2를 설치하면 된다.






반응형

'bioinformatics' 카테고리의 다른 글

CAFE v4.0 설치 및 실행하기  (0) 2017.09.11
Synteny Circos plot 그리기  (0) 2017.08.30
SyMap 설치 및 실행하기  (0) 2017.08.23
GMAP 설치 및 실행하기  (0) 2017.08.22
AGOUTI 설치 및 실행하기  (0) 2017.08.21

+ Recent posts