반응형

DESeq2에서 연속적인 값을 condtion으로 받기




DESeq2에서는 2가지 이상의 condition에 대한 차이를 보고 Differentially Expressed Genes를 구할 수도 있지만 시간이나 약물 투여 농도에 따른 DEGs도 계산할 수 있다.


아래의 예시처럼 약물 농도는 0nM, 0.1nM, 1nM을 투여하고 이에 따른 유전자의 변화를 가지고 p-value를 구하게 된다.


sampleTable<-data.frame(sampleName=sampleFiles, fileName=sampleFiles, dose=I(dose), drug=drug, cell_line=cell_line)


ddsHTSeq<-DESeqDataSetFromHTSeqCount(sampleTable=sampleTable, directory=directory, design=~dose)


dose=I(dose) 이 부분에서 I가 연속적인 value를 의미한다. 물론 dose안의 모든 값은 숫자로만 저장되어야 하며 dose에 기반하여 DEG를 구하여야 하기 때문에 밑에design=~dose가 되는 것이다.

design에 여러가지 factor를 넣어서 같이 계산할 수도 있지만 실험설계를 그렇게 해본 적은 없기 때문에 아래 참조 페이지에서 직접 확인하길 바란다.


그림이 너무 작은데 계속 진행하면 아래와 같은 결과를 얻을 수 있다.


내용은 임의로 채워놓았기때문에 크게 신경쓰지 말고 보면 마지막 6개의 column이 의미하는 것은 농도가 0, 1, 3으로 올라갔을 때 normalized readcount가 급격히 감소하는 것을 볼 수 있으며 log2FoldChange도 -값으로 크고, 당연히 결과적으로 adjust p-value도 낮은것을 확인할 수 있다.



Reference -

https://support.bioconductor.org/p/97262/


반응형

+ Recent posts