반응형
MultiQC 설치 및 실행하기
여태 Bioinformatics tools 중에 가장 높은 별점을 주고 싶은 프로그램을 발견해서 소개하고자 한다.
STAR와 ALLPATHS-LG 등도 매우 훌륭했지만 이 프로그램만큼은 별 다섯개를 주고 싶다.
프로그램의 목적은 여러 Bioinformatics tools을 사용해서 나온 log 파일들을 모아서 reporting 해주는 것이다. 프로젝트 폴더만 지정해주면 그 폴더 내에서 사용한 여러 프로그램에 대한 로그파일을 모두 수집하여 요약본을 만들어 준다.
현재까지 지원하는 프로그램은 아래 링크에서 확인할 수 있다. 약 63개정도....
http://multiqc.info/docs/#multiqc-modules
로그파일의 이름과 무관하게 형식만 맞으면 다 읽는 것으로 보이며 그럼에도 불구하고 실행시간은 오래걸리지 않는다.
로그파일들의 크기가 대체로 작긴 하지만 폴더내에 있는 파일 중에 매치가되지 않으면 바로바로 점프하는 듯 하다.
설치 방법은 가장 간단한 방법은 PyPI을 사용하는 방법이다.
프로그램이 Python 기반이기 때문에 Python을 설치하고 PyPI를 사용하도록 하자.
2017/08/16 - [programming language/python] - Python 설치 및 실행하기
pip가 설치되어 있다면 아래처럼 입력하고
pip install multiqc
권한문제가 생긴다면 --user 옵션을 넣도록 하자.
pip install multiqc --user
--user 옵션을 사용했다면 실행 파일은 ~/.local/bin/multiqc 에 생겼을 것이다.
설치가 정상적으로 끝났다면 프로젝트 폴더에가서
multiqc .
명령을 수행하면 multiqc_report.html 파일이 생성된다.
html파일을 열면 프로젝트 폴더 안에 있는 대부분의 로그파일들이 올라와있는 것을 확인할 수 있다.
당연하게도 모든 중간작업마다 로그파일을 생성했어야만 정상적으로 파일을 읽고 작동한다.
table이나 plot 복사를 하면 report를 작성하는데 매우 유용하게 사용할 수 있을 것이다.
Reference-
http://multiqc.info/docs/#using-multiqc
반응형
'bioinformatics' 카테고리의 다른 글
RSeQC를 사용하여 stranded 데이터 확인하기 (0) | 2018.08.06 |
---|---|
RNA-seq 라이브러리 종류와 구별법 (1) | 2018.08.03 |
RPKM, FPKM and TPM의 정의 (0) | 2018.07.27 |
Remove duplicates (0) | 2018.07.24 |
Gene ontology analysis - DAVID (0) | 2018.07.16 |