반응형

oncotator 설치 및 실행하기




oncotator는 암 연구에서 point mutations이나 indels이 기능적으로 연관성이 있는지를 annotation 해주는 프로그램이다. COSMIC, Tumorscape, MutSig 결과를 조합하여 암 특이적 annotation을 해준다.


설치에 앞서 oncotator는 python 모듈인데 아래처럼 특정 버전의 모듈이 필요다. 


bx-python 0.8.2 requires six, which is not installed.

oncotator 1.9.9.0 requires biopython==1.66, which is not installed.

oncotator 1.9.9.0 requires pandas==0.18.0, which is not installed.

oncotator 1.9.9.0 requires pyvcf==0.6.8, which is not installed.

oncotator 1.9.9.0 has requirement bcbio-gff==0.6.2, but you'll have bcbio-gff 0.6.4 which is incompatible.

oncotator 1.9.9.0 has requirement numpy==1.11.0, but you'll have numpy 1.15.2 which is incompatible.

oncotator 1.9.9.0 has requirement pysam==0.9.0, but you'll have pysam 0.15.1 which is incompatible.


oncotator용 python-2.7.15를 새로 설치하였다. 


2017/08/16 - [programming language/python] - Python 설치 및 실행하기



oncotator 다운로드 페이지는 gatk에서 확인할 수 있다.

https://gatkforums.broadinstitute.org/gatk/discussion/4154/howto-install-and-run-oncotator-for-the-first-time#latest


oncotator와 data source를 모두 받는 것을 권장한다.


python은 pip까지 설치. oncotator는 압축만 풀고 난 뒤 설치를 진행하였다.


/data/Tools/system/Python-2.7.15-oncotator/bin/python setup.py build


아래와 같은 메시지가 떴다. mac이 아닌 환경에서는 직접 설치를 해줘야 한단다.


ngslib must be installed manually on non-mac: pip install --no-binary :all: ngslib==1.1.18


위의 메시지와 똑같이 입력하였다.


/data/Tools/system/Python-2.7.15-oncotator/bin/pip install --no-binary :all: ngslib==1.1.18


다시 빌드하였을 때 위와 같은 메시지가 없어진 것을 확인하였고 그대로 설치하였다.


/data/Tools/system/Python-2.7.15-oncotator/bin/python setup.py build

/data/Tools/system/Python-2.7.15-oncotator/bin/python setup.py install



install 과정에서 아래와 같은 에러 발생.


ImportError: No module named _build_utils.apple_accelerate


검색해보니 Numpy install 오류라고 한다. (https://github.com/andersbll/cudarray/issues/34)


oncotator를 install할 때 모듈을 설치하기는 하는데 미리 메뉴얼로 설치하는게 혹시 모를 오류가 안생기는듯 하다.


pip install bx-python==0.8.2

pip install pandas==0.18.0

pip install biopython==1.66 

pip install pyvcf==0.6.8

pip install bcbio-gff==0.6.2

pip install numpy==1.11.0

pip install pysam==0.9.0


근데 pysam 설치하다가 또 오류남.


    htslib/hfile_libcurl.c: In function ‘easy_errno’:

    htslib/hfile_libcurl.c:93:10: error: ‘CURLE_NOT_BUILT_IN’ undeclared (first use in this function)

    htslib/hfile_libcurl.c:93:10: note: each undeclared identifier is reported only once for each function it appears in

    error: command 'gcc' failed with exit status 1


아래처럼 해결함.

installed : /path-to/curl-7.50.3

export CFLAGS=-I/path-to/curl-7.50.3/include



Reference -

https://github.com/abishara/athena_meta/issues/1


반응형

'bioinformatics' 카테고리의 다른 글

Gene ID conversion  (0) 2018.11.15
SRA data 다운로드받기  (1) 2018.10.17
liftover하기  (0) 2018.09.28
DESeq2에서 heatmap, PCA, MA, volcano plot 그리기  (0) 2018.08.31
Optical duplicate와 Library duplicates  (0) 2018.08.27
반응형

Cancer cell line 정보 받기




https://cancer.sanger.ac.uk/cell_lines


Catalogue Of Somatic Mutations In Cancer (COSMIC) 홈페이지에서 cancer cell line에 대한 정보를 받는 법을 알아보려고 한다. 특히나 특정 cancer cell line으로 실험을 하였을 때 결과가 제대로 나왔는지 확인하기 위해 해당 cell line에 존재하는 variant를 검사해 볼 수 있다.




가장 먼저 홈페이지에서 genome version을 설정해주어야 한다. 이 후의 자료들은 다 위의 genome version을 기반으로 제공된다.


옆에 검색창에 "HeLa"를 검색해보자.


비슷한 이름의 다른 정보가 하나도 없기 때문에 Samples에 하나 나온다. 나머지 정보는 뻔한 것들이니 넘어가고 뒷부분에 존재하는 variants를 보면 HeLa가 가지고 있는 variants가 보인다.



Filters를 사용하면 더 specific한 변이들만 따로 고를 수 있다.


Reference - 

https://cancer.sanger.ac.uk/cell_lines


반응형

'bioinformatics > cancer genomics' 카테고리의 다른 글

somatic mutation과 germline mutation  (0) 2018.10.12
Clinical Cancer 데이터베이스  (0) 2018.07.09
Molecular disease  (0) 2018.07.05
암 분류법  (0) 2018.07.05
CancerSCAN  (0) 2018.07.04
반응형

Clinical Cancer 데이터베이스



CIViC 데이터베이스

CIViC는 Clinical Interpretation of Variants in Cancer의 약자로 암을 유발할 수 있는 유전체 내의 변이를 모은 데이터 베이스이다. 




CIViC의 목적은 암 환자의 가진 변이중에 pathogenic한 변이를 찾아내고 여기에 맞는 치료방법을 사용하는 정밀의학에 적용하기 위한 데이터베이스 구축이며 유사한 목적을 가진 데이터베이스보다 더 적극적인 방식으로 정보를 제공하며 토론을 장려한다고 밝히고 있다.


그래서 아래처럼 데이터 베이스의 통계를 주마다 갱신하여 보여주거나, Activity를 업데이트하여 실시간으로 정보가 더 쌓여가는 것을 홈페이지 시작 화면에서 보여주고 있다.



아래는 TP53에서 찾은 변이의 결과로 CIViC에서는 해당 변이에 대해 진행된 연구를 표시하고 있는데 해당 변이를 치료할 때 사용할 수 있는 DRUG를 표시해 주고 있으며 evidence level을 A,B,C,D 총 네 단계로 나누어 어떤 evidence가 서포트 해주고 있는지도 표시하고 있다.




OncoKB 데이터베이스

OncoKB는 특정 암 유전자 변이가 가져오는 효과와 이에 대한 치료 방법을 모아놓은 데이터베이스다. CIViC과 유사하게 evidence level을 나누고 있지만 좀 더 구체적으로 나누고 있다.



둘의 차이점은 데이터베이스 구성에 있어서 겹치지 않는 변이들이 있는데 아마도 데이터베이스에 변이가 등록되는게 일일히 확인하는 작업이 필요하기 때문에 차이가 있는 것으로 보인다.

개인적인 평가로는 시각화는 CIViC이 더 잘 되어 있어 특정 변이를 웹 검색을 통해 확인하고 싶으면 유용하나 같은 유전자라 하더라도 variants의 종류가 더 많고 Data download나 API등의 지원에 있어서는 OncoKB가 나은 것 같다.

source -

https://civicdb.org/home

https://www.nature.com/articles/ng.3774

http://oncokb.org/#/

반응형

'bioinformatics > cancer genomics' 카테고리의 다른 글

somatic mutation과 germline mutation  (0) 2018.10.12
Cancer cell line 정보 받기  (0) 2018.08.28
Molecular disease  (0) 2018.07.05
암 분류법  (0) 2018.07.05
CancerSCAN  (0) 2018.07.04

+ Recent posts