반응형

MultiQC 설치 및 실행하기




여태 Bioinformatics tools 중에 가장 높은 별점을 주고 싶은 프로그램을 발견해서 소개하고자 한다.
STAR와 ALLPATHS-LG 등도 매우 훌륭했지만 이 프로그램만큼은 별 다섯개를 주고 싶다.

프로그램의 목적은 여러 Bioinformatics tools을 사용해서 나온 log 파일들을 모아서 reporting 해주는 것이다. 프로젝트 폴더만 지정해주면 그 폴더 내에서 사용한 여러 프로그램에 대한 로그파일을 모두 수집하여 요약본을 만들어 준다.

현재까지 지원하는 프로그램은 아래 링크에서 확인할 수 있다. 약 63개정도....


http://multiqc.info/docs/#multiqc-modules


로그파일의 이름과 무관하게 형식만 맞으면 다 읽는 것으로 보이며 그럼에도 불구하고 실행시간은 오래걸리지 않는다. 

로그파일들의 크기가 대체로 작긴 하지만 폴더내에 있는 파일 중에 매치가되지 않으면 바로바로 점프하는 듯 하다.



설치 방법은 가장 간단한 방법은 PyPI을 사용하는 방법이다.

프로그램이 Python 기반이기 때문에 Python을 설치하고 PyPI를 사용하도록 하자.


2017/08/16 - [programming language/python] - Python 설치 및 실행하기


pip가 설치되어 있다면 아래처럼 입력하고


pip install multiqc


권한문제가 생긴다면 --user 옵션을 넣도록 하자.


pip install multiqc --user


--user 옵션을 사용했다면 실행 파일은 ~/.local/bin/multiqc 에 생겼을 것이다.



설치가 정상적으로 끝났다면 프로젝트 폴더에가서


multiqc .


명령을 수행하면 multiqc_report.html 파일이 생성된다.


html파일을 열면 프로젝트 폴더 안에 있는 대부분의 로그파일들이 올라와있는 것을 확인할 수 있다.



당연하게도 모든 중간작업마다 로그파일을 생성했어야만 정상적으로 파일을 읽고 작동한다.



table이나 plot 복사를 하면 report를 작성하는데 매우 유용하게 사용할 수 있을 것이다.



Reference-

http://multiqc.info/docs/#using-multiqc


반응형

'bioinformatics' 카테고리의 다른 글

RSeQC를 사용하여 stranded 데이터 확인하기  (0) 2018.08.06
RNA-seq 라이브러리 종류와 구별법  (1) 2018.08.03
RPKM, FPKM and TPM의 정의  (0) 2018.07.27
Remove duplicates  (0) 2018.07.24
Gene ontology analysis - DAVID  (0) 2018.07.16

+ Recent posts