Molecular disease

겸형 적혈구 빈혈증은 1977년 β-globin 유전자의 손상에 의해 일어나는 최초의 분자 질환으로 기록되었으며 이 후로 유전자의 손상이 질병과 연관되어 있다는 것이 알려졌다. 이후 NGS의 발달로 sequencing 가격이 저렴해지면서 single nucleotide level의 mutation까지 측정할 수 있게 되었고 특정한 유전자 염기의 변이가 질병과 관련 있다는 연구가 진행되기 시작했다.

하지만 질병이 생길 수 있는 요인을 매우 다양하기 때문에 특정 변이와 질병관의 관계성을 특정짓기가 쉽지 않아 미국의학유전학회(American Medical College of Medical Genetics and Genomics, ACMG)는 이를 다섯가지 단계로 분류하기로 하였다.

Pathogenic

- 이미 신뢰할만한 데이터가 해당 변이와 질병간의 관계를 뒷받침 하고 있는 연구결과가 존재할 때

Likely pathogenic

- 이전에는 보고되지 않았지만 질병과 연관되어 있는 유전자의 단백질 구조에 영향을 주는 변이가 발견되었을 때

Uncertain significance

- 이전에는 보고되지 않았고 다른 포유동물에서 해당 아미노산이 보존되어 있지만 변이가 발견되었을 때

Likely benign

- 해당 변이가 이 전에 발견되었으며 in silico 실험 결과 영향력이 크지 않을 때

Benign

- 잦은 빈도로 변이가 발견되며 in silico 분석 결과 큰 영향이 없으며 또한 해당 변이를 친족이 가지고 있으나 같은 질병에 대해서 아무런 징후가 없을 때

위의 표기 방법을 따르는 것은 강제적인 것은 아니나 일반적으로 널리 쓰이는 방법이니 알아두는 것이 좋다.

source -

https://en.wikipedia.org/wiki/Variant_of_uncertain_significance#Classification

Sue Richards, PhD et al., Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology, Genetics in Medicine, 2015

저작자표시 비영리 변경금지 (새창열림)

'bioinformatics > cancer genomics' 카테고리의 다른 글

somatic mutation과 germline mutation (0)	2018.10.12
Cancer cell line 정보 받기 (0)	2018.08.28
Clinical Cancer 데이터베이스 (0)	2018.07.09
암 분류법 (0)	2018.07.05
CancerSCAN (0)	2018.07.04

암 분류법

암의 정의

- 암은 세포 주기 조절이 되지 않고 계속 세포 분열을 하는 질병의 통칭이다. 정상적인 세포는 일정한 주기를 가지고 분열하며 특정 조건이 만족되거나 한계 이상으로는 분열하지 않지만 암을 계속해서 분열하기 때문에 정상적인 기능을 하는 세포에 비해 수가 많으며 몸의 밸런스를 무너뜨리게 된다.

- 악성 종양이라고도 불리는데 양성 종양과는 구분을 해야한다. 일반적으로 종양은 비 정상적인 세포 덩어리를 의미하며 다른 조직으로 전이가 일어나면 악성 종양 그렇지 않으면 양성 종양이라고 부른다. 양성 종양은 발견시 제거하면 재발 위험이 낮지만 악성 종양은 이미 다른 조직으로 전이 했다면 찾기가 굉장히 어렵기 때문에 재발 위험이 높다.

- WHO에 의하면 neoplasm은 크게 4개의 범주로 구분할 수 있다.

1) benign neoplasms : 양성 종양

2) in situ neoplasms : 상피 내암

3) malignant neoplasms : 악성 종양

4) neoplasms of uncertain or unknown behavior :

암종과 육종

- 악성종양은 발생 부위에 따라 암종(Carcinoma)와 육종(Sarcoma)로 나뉜다.

- 암종은 점막, 피부 같은 상피성 세포에서 발생한 악성종양을 뜻하고 육종은 근육, 결합조직, 뼈, 연골, 혈관 등의 비상피성 세포에서 발생한 악성종양을 뜻한다.

- carcinoma는 기원한 세포에 따라 아래처럼 나눌 수 있다. (예시 외에도 존재하지만 드물게 나타남으로 생략한다.)

1) Adenocarcinoma : 선암종

점액 등 피복원주상피, 선상피 세포로부터 발생한다.

2) Squamous cell carcinoa : 편평세포암종

중층편평상피세포를 가진 피부, 구강, 인두, 식도, 질, 자궁질부 등의 점막에서 발생한다.

3) Adenosquamous carcinoma : 선편평세포암종

4) Large cell carcinoma : 대세포암종

5) Small cell carcinoma : 소세포암종

더 자세히 알고 싶으면 oncotree 사이트에 32개의 sample에 따른 685개의 암 종류를 확인할 수 있다.

고형암과 혈액암

- 고형암은 암 세포가 자라면서 덩어리를 이루는 암을 말한다. 간암, 폐암, 유방암, 위암 등 대부분의 암들이 여기에 해당하며 치료를 위해서는 해당 부위를 절제 후 항암, 방사선 치료 등을 시행한다.

- 혈액암은 혈액이나 조혈기관, 림프절, 림프 기관 등 혈액을 구성하는 성분에 발생한 암을 말한다. 백혈병, 악성림프종, 다발성골수증 등이 여기에 해당하며 전체 암의 약 5~10%정도의 비율을 차지한다.

Reference -

http://oncotree.mskcc.org/#/home

저작자표시 비영리 변경금지 (새창열림)

'bioinformatics > cancer genomics' 카테고리의 다른 글

somatic mutation과 germline mutation (0)	2018.10.12
Cancer cell line 정보 받기 (0)	2018.08.28
Clinical Cancer 데이터베이스 (0)	2018.07.09
Molecular disease (0)	2018.07.05
CancerSCAN (0)	2018.07.04

LoFreq: a sequence-quality aware, ultra-sensitive variant caller for uncovering cell-population heterogeneity from high- throughput sequencing datasets

0.05% 이하의 vary rare variants을 near-perfect specificity로 detect할 수 있는 tool LoFreq을 개발하였으며 이를 simulated and real dataset으로 성능 비교 해보았다.

sequencing error modeling

- Phred score에 기반하여 read의 각 base의 sequencing error probability를 Bernoulli trial로 계산한다. 그리고 variant으로 detect된 position을 Poisson-binomial distribution으로 계산하여 exact P-value를 구한다.

calling somatic|sample-specific variants

- tissue A와 B가 있을 때 A에서 variants로 확인된 포지션을 B에서 확인해보고, B에서 확인되지 않았다면 해당 영역의 coverage가 충분한지 여부를 binomial test에 기반하여 계산한다. coverage가 충분하다면 sample-specific 충분하지 않다면 somatic으로 분류한다.

Expreimental validation은 Fluidigm digital array와 Sequenom MassArray를 사용하였으며 Simulated population은 DENV2 sample에서 6개를 random sampling하여 구하였다.

결과를 보면 기존에 프로그램들과는 다르게 large genome에서도 작동할 수 있게 optimize되어 있으며 low-depth에서도 잘 작동하지만 충분한 depth에서 더 low-frequency variant를 찾아낼 수 있다.

source -

Andreas Wilm et al., LoFreq: a sequence-quality aware, ultra-sensitive variant caller for uncovering cell-population heterogeneity from high-througput sequencing datasets, Nucleic Acids Research, 2012

저작자표시 비영리 변경금지 (새창열림)

'Research > paper review' 카테고리의 다른 글

Genome-wide characterization of centromeric satellites from multiple mammalian genomes (0)	2017.12.07
NextSV (0)	2017.10.11
Fast and accurate de novo genome assembly from long uncorrected reads (0)	2017.09.20
De novo assembly of the Aedes aegypti genome using Hi-C yields chromosome-length scaffolds (0)	2017.09.06

CancerSCAN

LabGenomics에서 SGI로부터 기술이전을 받아 서비스 하고 있는 Cancer Scan의 method에 관한 리뷰이다.

Cancer Scan (Cancer Somatic mutation call for Clinical reports with ANnotation)의 궁극적인 목적은 암환자의 종양 샘플에서 주요 유전자의 변이를 검출하여 맞춤형 치료를 가능하도록 하는 것이다.

잘 알려진 pathogenic gene 381개를 타겟하는 패널을 제작하여 mean 800x 이상을 sequencing하고 여기에 SNVs, INDELs, Fusion gene, CNV를 찾아내는 tools을 사용한다.

사용하는 tool로는 Mutect, LoFreq, pindel과 local script를 사용한다.

파이프라인은 tumor purity, treatment-induced mutation 등으로 발생한 low variant allele frequency도 잘 찾아낼 수 있으며 약 800X의 depth를 생산하여 FFPE등의 정제도가 떨어지는 검체에서도 높은 sensitivity를 가진다는 것이 장점이다.

실제 clinical samples에서는 tumor purity가 매우 낮기 때문에 이러한 low-variant allele frequency를 가지는 변이를 찾아내는것이 매우 중요하다.

이미 7,000명 이상의 한국인 환자의 데이터 분석을 통해 한국인에게 맞는 분석 데이터 베이스를 확보하였으며 지속적인 Annotation 데이터베이스 업데이트로 질병 변이가 일어난 유전자에 따른 최신의 표적 항암제 정보도 제공하고 있다.

Reference -

Hyun-Tae Shin et al, Prevalence and detection of low-allele-fraction variants in clinical cancer samples, NatureCommunications, 2017

DOI: 10.1038/s41467-017-01470-y

저작자표시 비영리 변경금지 (새창열림)

'bioinformatics > cancer genomics' 카테고리의 다른 글

somatic mutation과 germline mutation (0)	2018.10.12
Cancer cell line 정보 받기 (0)	2018.08.28
Clinical Cancer 데이터베이스 (0)	2018.07.09
Molecular disease (0)	2018.07.05
암 분류법 (0)	2018.07.05

CRISPR editing

CRISPR는 1세대 ZFN과 2세대 TALEN이 갖는 cost와 sensitivity 문제를 개선한 3세대 Genetic editing 기술로서 약 20nt의 서열을 인지하여 서열을 절단하는 기술이다.

원래는 박테리아의 방어 기제 중에 하나로서 바이러스 침입 등으로 인한 외부 DNA를 절단하기 위한 시스템을 인공적으로 만든 염기 서열을 단백질과 같이 넣어줌으로서 특정 부위를 절단하는데 유전자의 기능을 밝히거나 기능을 제한하고자 할 때 쓰인다. 하지만 아직은 원하지 않는 부위도 절단하는 부작용이 있으며 이것이 어떻게 영향을 미칠 지 정확히 예측하기 힘들기 때문에 실용화까지는 해결해야 할 문제가 많이 남았다.

- CRISPR-Cas9

Streptococcus에서 발견한 시스템으로 crRNA와 tracrRNA로 이루어진 endonuclease를 가지고 있다. 이 두 RNA를 이어 붙인 single guide RNA를 Cas9과 함께 넣어주면 target DNA를 절단하게 된다.

- CRISPR-Cpf1

Francisella에서 발견된 시스템으로 'T rich' PAM을 가지게 되고 crRNA만을 필요로 하며 가장 Cas9과의 가장 큰 차이는 Cpf1은 sticky ends를 만들게 되고 Cas9은 blunt ends를 만들게 된다.

crRNA만 가지기 때문에 size가 작아 한 vector만을 사용할 수 있으며 sticky ends를 가지기 때문에 특정 유전자를 만들어 넣는데 더 유용하다는 장점이 있다.

- CRISPR-C2c2

많은 바이러스가 DNA가 아닌 RNA를 유전정보로 사용하고 있기 때문에 DNA가 아닌 RNA를 조절하는 C2c2 유전자를 fusobacteria에서 발견하였다. 위의 Cas9이나 Cpf1과는 다르게 RNA를 대상으로 작용한다.

저작자표시 비영리 변경금지 (새창열림)

'bioinformatics' 카테고리의 다른 글

_PAR_Y in Genecode annotation (0)	2018.07.13
HLAtyping (0)	2018.07.06
Stem cell (0)	2018.04.05
Single cell sequencing (0)	2018.04.05
MARS 설치 및 실행하기 (0)	2017.09.27

Be great

전체 글