반응형

BEAGLE-LIB 설치하기



BEAST를 실행하는데 beagle-lib가 필요하여 설치방법을 소개하고자 한다.


README 파일에서는 svn으로 받으라고 되어있지만 해당 PATH를 찾지 못하여 그냥 git 주소와 같이 공개한다.


svn checkout http://beagle-lib.googlecode.com/svn/trunk BEAGLE

cd BEAGLE

or



./autogen.sh

./configure --prefix=/PATH/TO/INSTALL/BEAGLE-LIB

make

make install


순서로 진행하면 된다.


autogen.sh 시에 OS의 버전이 낮을 시 autoconf 버전이 맞지않아 configure파일이 생기지 않을 수 있는데 autoconf를 새로 설치하면 된다.



configure시에 아래와 같은 경고가 있을 수 있는데 GPGPU 연산이 불가능한 서버에서 작업 중이라면 무시하고 진행한다.


configure: WARNING: OpenCL not found or disabled.  OpenCL implementation  will not be built. If OpenCL support is desired, check the path to OpenCL and specify --with-opencl=/path/to/opencl

configure: WARNING: NVIDIA CUDA nvcc compiler not found or CUDA support disabled.  CUDA implementation will not be built. If CUDA support is desired, check the path to CUDA and specify --with-cuda=/path/to/cuda


make 와 make install까지 성공적으로 마쳤다면 PATH를 잡아주기만 하면 된다.


export LD_LIBRARY_PATH=/PATH/TO/INSTALL/BEAGLE-LIB/lib:$LD_LIBRARY_PATH 









반응형

'bioinformatics' 카테고리의 다른 글

Single cell sequencing  (0) 2018.04.05
MARS 설치 및 실행하기  (0) 2017.09.27
BEAST 설치 및 실행하기  (0) 2017.09.27
MHAP 설치 및 실행하기  (0) 2017.09.19
Racon 설치 및 실행하기  (0) 2017.09.19
반응형

BEAST 설치 및 실행하기



BEAST는 서열을 MCMC를 사용한 Bayesian analysis를 통해 phylogenetic tree를 그려주는 프로그램이다.


홈페이지 - http://beast.community/


JAVA 1.6 이상 버전에서 작동한다.


다운로드는 github를 통해서 할 수 있다. (https://github.com/beast-dev/beast-mcmc/releases/latest)


1.8.4 버전 기준으로 설치는 아래와 같다.


https://github.com/beast-dev/beast-mcmc/releases/download/v1.8.4/BEASTv1.8.4.tgz

tar -zxf BEASTv1.8.4.tgz


특별히 install 할 필요는 없고 압축을 풀면 bin 폴더가 나온다. 


GUI 기반으로 작동하니 Xming 등의 X server 프로그램과 동시에 실행해야 한다.


BEAGLE library plugin도 설치해야 한다.


2017/09/27 - [bioinformatics] - BEAGLE-LIB 설치하기


Beast 옵션 중에 beagle library가 불가능 할시 그냥 쓰지 않을 수도 있기는 하다. 정확히 무슨 차이가 있는지는 조사 필요함.



모두 설치하고나면 BEAUti, BEAST, TreeAnnotator, LogCombiner, TreeStat 다섯 개의 프로그램이 설치된다.



홈페이지에 있는 tutorial을 그대로 따라하면 tree를 그릴 수 있다.


간략하게 순서를 말하자면


먼저 NEXUS 포맷의 MSA (mulitiple seuquence alignment) 결과가 필요하다. 


web program인 clustal omega (http://www.ebi.ac.uk/Tools/msa/clustalo/)에 sequence를 넣고 output format만 NEXUS로 바꾸고 돌리면 MSA 결과는 쉽게 얻을 수 있다.


BEAUti 프로그램으로 MSA 결과와 BEAST를 어떤 parameter로 돌릴 지를 결정하고 저장하면 xml파일이 생기는데


이후에 BEAST 프로그램에 xml파일을 넣고 실행하면 trees파일이 생성되고 이 파일을


figtree(http://tree.bio.ed.ac.uk/software/figtree/) 등의 프로그램으로 확인하는 것이다.







반응형

'bioinformatics' 카테고리의 다른 글

MARS 설치 및 실행하기  (0) 2017.09.27
BEAGLE-LIB 설치하기  (0) 2017.09.27
MHAP 설치 및 실행하기  (0) 2017.09.19
Racon 설치 및 실행하기  (0) 2017.09.19
Phylip 설치 및 실행하기  (0) 2017.09.18
반응형

Fast and accurate de novo genome assembly from long uncorrected reads



제목과는 다르게 assembler가 아니라 consensus에 사용할 수 있는 RACON 프로그램을 소개하고 있다. QuiverNanopolish와 비슷한 프로그램이나 두 프로그램은 sequencer-specific인데 반해 RACON은 상관없이 사용할 수 있다. Table 1. 에서 6개의 small genome (lambda 에서 c.elegans 까지)을 가지고 성능을 비교하였다. Racon 이전의 step들은 miniasm(assembler), minimap(mapper)를 사용했으며 다른 프로그램을 사용해도 된다. Canu, FALCON과 비교했을 때 assembly된 결과와 reference간의 Aln. bases ref 등을 고려할 때 성능은 크게 차이 나지 않아 보인다. RaconQuiver, Nanopolish등을 중복해서 사용해도 결과는 거의 달라지지 않는다고 한다. 그러나 Table 2. 를 참고하면 속도는 최소 2~3배에서 최대 200~300배 정도 빠르다고 나와있다. 또한 Table 6. 에서는 비슷한 consensus 프로그램 Sparc와 비교했을 때는 IdentityCPU time 모두에서 확실히 좋은 결과를 보여주고 있다. Large genome에서도 사용할 수 있는지에 대해서는 assemblerminiasmlarge genome에 최적화 되어 있지 않아 miniasm+Racon pipeline 에서는 사용하지 않았다고 되어있는데 Racon만 사용하는 것에는 문제가 없어 보인다



resource -

Robert Vaser et al., Fast and accurate de novo genome assembly from long uncorrected reads, Genome research, 2017

반응형
반응형

MHAP 설치 및 실행하기




MHAP은 2015년 Nature Biotechnology에 출판된 논문(http://www.nature.com/nbt/journal/v33/n6/full/nbt.3238.html

)에서 소개하고 있는 프로그램이다.

Konstantin Berlin et al, Assembling large genomes with single-molecule sequencing and locality-sensitive hashing, Nature Biotechnology, 2015


K-mer의 Jaccard similarity를 계산하고 PacBio나 Nanopore long read를 빠르게 mapping할 수 있는 프로그램이다.


설치는 아래의 명령어를 따라하면 된다.

git clone https://github.com/marbl/MHAP.git
cd MHAP
mvn install

설치가 끝나면 target이라는 폴더가 생기고 그 안에 mhap-*.jar 이라는 파일이 생성되었을 것이다.

java -jar mhap-*.jar 으로 실행하면 된다.



간단하게 명령어를 설명하면 


java -server -Xmx300g -jar mhap-2.1.3.jar --num-threads 32 -q <long reads> -s <contigs>


300g의 메모리를 사용하고 32개의 쓰레드를 사용하며 long reads를 contigs에 mapping하겠다는 의미이다.



설명에 따로 index파일을 만드는 법이 나와있지 않고 매번 명령어를 실행할 때마다 임시로 index를 진행하기 때문에 indexing을 미리 해두면 여러 번 작업할때 시간을 단축할 수 있다. (그래도 mammalian genome을 indexing하는데 10분정도 밖에 안걸린다.)


java -server -Xmx300g -jar mhap-2.1.3.jar -p fastafile.fasta -q output_directory


결과로 fastafile.dat 파일이 생성되는데 alignment 할 때 fasta 파일 대신 dat 파일을 넣어주면 된다.






반응형

'bioinformatics' 카테고리의 다른 글

BEAGLE-LIB 설치하기  (0) 2017.09.27
BEAST 설치 및 실행하기  (0) 2017.09.27
Racon 설치 및 실행하기  (0) 2017.09.19
Phylip 설치 및 실행하기  (0) 2017.09.18
CAFE v4.0 설치 및 실행하기  (0) 2017.09.11
반응형


Racon 설치 및 실행하기




2017년 Genome Research에 나온 논문(http://genome.cshlp.org/content/early/2017/01/18/gr.214270.116)에서 소개하고 있는 프로그램으로 long read polish에 관련되어 있는 프로그램이다.

Robert Vaser et al, Fast and accurate de novo genome assembly from long uncorrected reads, Genom Research, 2017


2017/09/20 - [paper review] - Fast and accurate de novo genome assembly from long uncorrected reads



설치는 매우 간단하다.


git clone https://github.com/isovic/racon.git && cd racon && make modules && make tools && make -j  


한 줄만 입력하면 bin 폴더와 bin/racon 파일이 생성된다.


README.md 파일을 보면 어떻게 실행해야하는지 설명이 간략하게 쓰여있다.


quliay value가 포함된 reads (반드시 fastq파일이 있어야 함), mapping된 파일 (paf/mhap/sam) 그리고 contig파일(fasta/fastq/gfa) 이 필요하며 마지막으로 outputfile이름을 적어주면 된다.


mapping 파일에 따라 --mhap 또는 --sam 옵션을 넣어주어야 한다. 마지막으로 --erc 옵션을 넣어주면 error correction을 할 수도 있다고 쓰여있다. 


mhap format으로 진행을 하려다가 mhap은 fasta파일만을 받는데 racon에서는 fastq파일을 요구해서 충돌이 일어나기때문에 여러 차례 시도 후에 그냥 bwa로 맵핑해서 진행했다.


racon --sam reads.fastq alignment.sam scaffold.fasta consensus.fasta 


input값만 제대로 넣어줬다면 consensus파일이 정상적으로 생성되는 것을 확인할 수 있다.



tutorial에서는 각 방식대로 진행할 수 있게 되어있는데 mhap이 제대로 작동하는지 example1_2-mhap-lambda.sh 으로 테스트 해보려 했으나 에러가 난다.


심지어 mhap은 minimap으로 align한 결과는 paf to mhap로 변환을 하고 있기 때문에 제대로된 mhap format을 확인할 수 없었다.


또한 dnadiff라는 명령을 인식하지 못하는데 이 프로그램은 MUMmer를 설치하면 해결할 수 있다.


2017/09/21 - [bioinformatics] - MUMmer 설치 및 실행하기




반응형

'bioinformatics' 카테고리의 다른 글

BEAST 설치 및 실행하기  (0) 2017.09.27
MHAP 설치 및 실행하기  (0) 2017.09.19
Phylip 설치 및 실행하기  (0) 2017.09.18
CAFE v4.0 설치 및 실행하기  (0) 2017.09.11
Synteny Circos plot 그리기  (0) 2017.08.30
반응형

MPC 설치하기

 

 

 

GMP, MPFR과 마찬가지로 GNU에서 제공하는 C library이다.

 

반드시 GMP, MPFR 설치 후 진행해야 한다.

 

2017/09/19 - [linux] - GMP 설치하기

 

2017/09/19 - [linux] - MPFR 설치하기

 

 

홈페이지는 - http://www.multiprecision.org/ 이다.

 

다운로드는 다운로드 탭으로 들어가면 된다. http://www.multiprecision.org/index.php?prog=mpc&page=download

 

1.0.3 버전으로 진행하였다.

 

wget ftp://ftp.gnu.org/gnu/mpc/mpc-1.0.3.tar.gz
tar zxf mpc-1.0.3.tar.gz
cd mpc-1.0.3
./configure --prefix=/PATH/TO/INSTALL/MPC --with-mpfr=/PATH/TO/INSTALL/MPFR --with-gmp=/PATH/TO/INSTALL/GMP
make && make install

 

 

 

반응형

'Computer Science > linux' 카테고리의 다른 글

samba 설정하기  (0) 2018.02.02
awk 응용하기!  (0) 2017.10.18
MPFR 설치하기  (0) 2017.09.19
GMP 설치하기  (1) 2017.09.19
GCC 설치하기  (1) 2017.09.18
반응형

MPFR 설치하기

 

 

 

GMP와 비슷하게 GNU에서 제공하는 C library이다. GCC 설치에 필요하다.

 

반드시 GMP를 설치한 후에 진행해야 한다!!!

 

2017/09/19 - [linux] - GMP 설치하기

 

 

홈페이지 - http://www.mpfr.org/

 

최신버전은 http://www.mpfr.org/mpfr-current/ 에서 다운로드 받을 수 있으며

 

현재 최신버전인 3.1.6 버전으로 진행하겠다.

 

wget http://www.mpfr.org/mpfr-3.1.6/mpfr-3.1.6.tar.bz2
tar -xvf mpfr-3.1.6.tar.bz2
cd mpfr-3.1.6
./configure --prefix=/PATH/TO/INSTALL/MPFR --with-gmp=/PATH/TO/INSTALL/GMP
make && make install

 

gmp가 설치되어 있는 폴더를 넣어주어야 제대로 configure가 진행된다.

 

 

 

 

반응형

'Computer Science > linux' 카테고리의 다른 글

awk 응용하기!  (0) 2017.10.18
MPC 설치하기  (0) 2017.09.19
GMP 설치하기  (1) 2017.09.19
GCC 설치하기  (1) 2017.09.18
cURL 로컬 설치하기  (0) 2017.08.24
반응형

GMP 설치하기

 

 

 

GNU에서 제공하는 library로서 GCC 설치를 위해 필요하며 설치 방법을 소개하고자 한다.

 

최신 버전은 받기 위해서 홈페이지 - https://gmplib.org/ 에 접속한다. 

 

다운로드에 보면 여러 압축 방식으로 제공하고 있다.

 

tar.bz2 압축 파일을 받아서 진행하고자 한다.

 

wget https://ftp.gnu.org/gnu/gmp/gmp-6.1.2.tar.bz2
tar -xvf gmp-6.1.2.tar.bz2
cd gmp-6.1.2
./configure --prefix=/PATH/TO/INSTALL/GMP
make && make check && make install

 

정상적으로 설치되었다면 /PATH/TO/INSTALL/GMP/lib 폴더 안에 libgmp 파일을 확인할 수 있다.

 

 

 

반응형

'Computer Science > linux' 카테고리의 다른 글

MPC 설치하기  (0) 2017.09.19
MPFR 설치하기  (0) 2017.09.19
GCC 설치하기  (1) 2017.09.18
cURL 로컬 설치하기  (0) 2017.08.24
Repeatmasker 설치  (0) 2017.05.05
반응형

GCC 설치하기

 

 

 

GCC 홈페이지 - https://gcc.gnu.org/

 

GCC는 GNU C Compiler의 약자로서 일반적인 프로그램 설치를 위해 많이 쓰인다.

 

9/19/2017 기준으로 최신 버전은 7.2이다. 최근 1~2년 사이에 major update가 많이 진행되었는지 숫자가 높아졌다.

 

 

설치 방법은 어렵지 않지만 depedency가 있다.

 

gcc를 설치하기 위해서는 gmp 4.2+, mpfr 2.3.1+, mpc 0.8.0+ 가 필요하다. 

 

 

root권한이 있다면 libgmp-dev, libmpc-dev, libmpfr-dev를 시스템에 설치하면 되지만 local로 설치할 때는 각각 설치한 후 PATH를 잡아주는 번거로운 작업을 거쳐야 한다. 

 

Ubuntu

sudo apt-get install libgmp-dev libmpfr-devl libmpc-dev

 

Red Hat and Fedora

sudo yum install gmp gmp-devel mpfr mpfr-devel libmpc libmpc-devel

 

Manual install

 

gmp, mpfr, mpc은 아래의 포스팅에서 설치방법을 확인할 수 있다. gmp, mpfr, mpc 순서대로 설치해야 한다.

 

2017/09/19 - [linux] - GMP 설치하기

 

2017/09/19 - [linux] - MPFR 설치하기

 

2017/09/19 - [linux] - MPC 설치하기

 

 

이제 gcc를 설치하기 위해 가까운 미러 사이트인 일본 (http://ftp.tsukuba.wide.ad.jp/software/gcc/releases/)에 들어가서 원하는 버전을 다운 받자. 

 

현재 최신버전인 7.2 버전으로 진행하였다.

 

wget http://ftp.tsukuba.wide.ad.jp/software/gcc/releases/gcc-7.2.0/gcc-7.2.0.tar.gz

tar -zxf gcc-7.2.0.tar.gz

cd gcc-7.2.0

./configure --prefix=/PATH/TO/INSTALL/GCC--with-gmp=/PATH/TO/INSTALL/GMP --with-mpfr=/PATH/TO/INSTALL/MPFR --with-mpc=/PATH/TO/INSTALL/MPC 

make && make install

위의 명령어에서 gmp, mpfr, mpc를 Manual하게 설치하지 않았다면 configure할 때 PATH는 따로 잡아주지 않아도 된다.

 

 

 

make 할 때 에러가 떠서 아래처럼 fix했다.

 

1.

error: 'GATHER_STATISTICS' was not declared in this scope

 

라는 에러가 뜨면서 설치가 중단됐는데 아래와 같이 변수를 unset해주니 해결됐다.

 

unset LIBRARY_PATH CPATH C_INCLUDE_PATH PKG_CONFIG_PATH CPLUS_INCLUDE_PATH INCLUDE

출처 : https://stackoverflow.com/questions/29981492/gcc-4-9-2-installation-failed-on-linux

 

 

2.

 

libmpc.so.3가 잡히지 않아서 LD_LIBRARY_PATH로 library 경로를 따로 잡아주었다.

export LD_LIBRARY_PATH=/PATH/TO/INSTALL/GMP/lib:/PATH/TO/INSTALL/MPFR/lib:/PATH/TO/INSTALL/MPC/lib:$LD_LIBRARY_PATH 

 

3.

configure: error: I suspect your system does not have 32-bit development libraries (libc and headers). If you have them, rerun configure with --enable-multilib. If you do not have them, and want to build a 64-bit-only compiler, rerun configure with --disable-multilib. 

64bit only compiler로 하고싶지 않아서 --enable-multilib 옵션을 추가하였다.

 

 

반응형

'Computer Science > linux' 카테고리의 다른 글

MPFR 설치하기  (0) 2017.09.19
GMP 설치하기  (1) 2017.09.19
cURL 로컬 설치하기  (0) 2017.08.24
Repeatmasker 설치  (0) 2017.05.05
GBrowse2 설치하기  (0) 2017.04.25
반응형

Phylip 설치 및 실행하기




홈페이지 - http://evolution.genetics.washington.edu/phylip.html


University of Washington에서 만든 간단한 phylogenetic tree를 그려주는 프로그램이다.


몇 안되는데 True or False 값으로만 유전자 존재 유무를 체크하고 그려주는 binary phylogenetic tree 프로그램이다. MSA로 진행하는 프로그램을 Cluster Omega를 포함해서 많으니 그 쪽을 참고하기 바란다. binary input을 사용하는 모듈은 clique이다.


주의해야 할 점은 발현하는 유전자 FPKM cutoff를 주고 그 이상 발현되는 유전자만을 따로 추려내도록 해야 한다. 


mis-aligned된 reads로 인한 FPKM을 고려하지 않으면 결과가 의도치 않은 방향으로 나올 것이다.



윈도우 버전으로 사용할 때는 따로 설치는 필요 없고 다운받은 파일의 압축만 풀면 된다.


Linux 버전으로 사용할 때는 tar.gz 파일을 받아서


tar -zxf phylip-3.696.tar.gz

cd phylip-3.696/src/

make -f Makefile.unx install


하고 나면 phylip-3.696/exe 폴더 내에 실행파일이 생긴 것을 확인할 수 있다.



실행파일을 열면 바로 infile이 없다고 나오면서 inputfile의 이름을 넣으라고 나오는데 윈도우에서는 실행한 위치에 파일이 있어야 읽을 수 있다. linux에서는 실행한 곳에 파일이 있으면 된다.


inputfile의 format은 윈도우버전의 exe/testdata 폴더 안에서 확인할 수 있는데 프로그램이 오래 전에 만들어져서 tab으로 간격을 두지 않고 띄어쓰기의 숫자로 간격이 정해진다. 


반드시 testdata를 보고 띄어쓰기의 개수를 맞춰서 진행하면 에러 없이 진행되는 것을 확인할 수 있다.




반응형

'bioinformatics' 카테고리의 다른 글

MHAP 설치 및 실행하기  (0) 2017.09.19
Racon 설치 및 실행하기  (0) 2017.09.19
CAFE v4.0 설치 및 실행하기  (0) 2017.09.11
Synteny Circos plot 그리기  (0) 2017.08.30
Arrow/Quiver 설치 및 사용하기  (0) 2017.08.24

+ Recent posts