반응형

Stem cell



stem cell의 정의는 self-renewal, a capacity to differencitate가 가능한 세포를 말하며 배아줄기세포, 성체줄기세포, iPSCs 세 종류로 구분할 수 있다. 

배아 줄기 세포

- 수정 4-5일 후의 초기 배아 상태 세포를 말하며 사람을 기준으로 200종류가 넘는 cell type으로 분화할 수 있는 pluripotent를 가진 세포를 말한다. 면역 거부반응이 없어 타인과 타종에게 이식이 가능하나 윤리적인 문제가 존재한다.


성체 줄기 세포

- pluripotent adult stem cell은 신체 내에 소량만 존재하는데 특정 세포로만 분화가 가능하며 면역 거부반응이 있어서 타인 타종에게 이식이 불가능하다.


유도 만능 줄기 세포

- 성체 세포를 야마나카 factor라고 불리는 Oct4, Sox2, cMyc and Klf4을 넣어주면 역분화하여 pluripotent 세포가 된다는 것을 교토대의 야마나카 신야가 2006년 쥐에서 최초로 발견하였으며 후에 사람에게서도 가능하다는 것을 2007년에 밝혔는데 동일한 시기에 winsconsin-madison 대학에서도 Oct4, Sox2, Nanog, Lin28으로 사람의 세포에서 동일하게 적용할 수 있다는 것을 발견하였다.


iPSCs와 ESC는 비슷하지만 엄연히 다른 세포이다. 유전자, epigenetic 패턴, teratoma formation 등이 비슷하지만 methlated에 대해 iPSCs가 더 닫혀 있는 것으로 보이는 연구가 있으며 유전자 발현 패턴에 대해서 ESCs와 iPSCs끼리, 또는 같은 iPSCs라고 하더라도 원래 세포 종류가 달라도 같은지에 대한 정보가 부족한 상황이다.


그럼에도 불구하고 iPSCs는 윤리적인 문제나 이식등에 있어서 자유롭기 때문에 활용 가능성이 매우 높으며 이러한 점 때문에 2012년 존 거든과 함께 노벨 생리학 의학상을 수상했다.



배아 줄기 세포의 분화능은 다섯 가지로 분류할 수 있다.


전능성  

- 개체를 형성할 수 있는 분화능이며 세포 하나하나가 한 개체로 분화가 가능하다. 수정란이 이에 해당된다.


만능성

- 태아나 성체의 모든 세포로 가는 분화능을 말한다. 초기 수정란 세포가 분열하면서 여러 장기로 분화되기 전 단계의 세포를 말한다.


다분화성

- 세포계에 속한 몇몇 세포종으로 분화가 가능하며 성체 줄기세포에서 추출한다.


이분화성

- 두 종류의 세포로 분화가 가능한 줄기세포를 말한다

 

단일 분화성

- 한 종류의 특정 세포로 분화 가능한 줄기세포를 말한다.


반응형

'bioinformatics' 카테고리의 다른 글

HLAtyping  (0) 2018.07.06
CRISPR editing  (0) 2018.04.05
Single cell sequencing  (0) 2018.04.05
MARS 설치 및 실행하기  (0) 2017.09.27
BEAGLE-LIB 설치하기  (0) 2017.09.27
반응형

single cell sequencing



individual cell을 따로 분리하여 sequencing 하는 NGS 기술이다.

기존의 sequencing은 각각의 cell을 따로 분리할 기술이 없었기 때문에 bulk sequencing이었고 여러 종류의 세포가 섞여있었기 때문에 각각의 세포의 transcriptome을 분리하여 계산할 수 없었다.

이러한 single cell sequencing이 필요한 분야는 microbial meatagenomics, cancer genomics 등이 있다.


NGS의 장점 중에 하나는 배양할 수 없는 균을 sequencing 할 수 있다는 것인데 (일반적으로 균에 특성을 파악하려면 실험실에서 키워야 한다.) 여기에 각각의 균을 single cell 수준으로 분리할 수 있다면 각각의 균의 genome까지 profiling까지 할 수 있게 되는 것이다.

cancer genomics에서는 tumor heterogenity를 고려한 genomic profiling이 가능해진다는 장점이 있다.


하지만 아직까지는 single cell sequencing에서 해결해야 할 단점이 존재한다.

1. cost가 비싸다. single cell isolation이라는 추가 스텝이 필요하고 여기에서 나오는 데이터는 depth가 적기 때문에 실험을 여러 번 반복해서 데이터를 뽑아야 한다.

2. single cell에서 나오는 DNA는 pico gram 수준인데 sequencing하기위해서는 증폭이 더 많이 필요하다. 여기에 따른 uneven한 bias가 생길 수 있다.



Reference - 

https://en.wikipedia.org/wiki/Single_cell_sequencing


반응형

'bioinformatics' 카테고리의 다른 글

CRISPR editing  (0) 2018.04.05
Stem cell  (0) 2018.04.05
MARS 설치 및 실행하기  (0) 2017.09.27
BEAGLE-LIB 설치하기  (0) 2017.09.27
BEAST 설치 및 실행하기  (0) 2017.09.27
반응형

MARS 설치 및 실행하기



Multiple sequence alignment를 할 때 Input은 항상 linear하게 줄 수 밖에 없는데 mitochondrial DNA, viroid, viral or other genome 같은 circular DNA의 경우 시작과 끝을 정의할 수 없기 때문에 기준 없이 넣었다가는 이상한 결과가 나온다.


MARS는 sequence shifting을 통해 이러한 문제를 해결하고자 만든 프로그램이다.



프로그램은 github에서 받을 수 있다.


git clone https://github.com/lorrainea/mars

cd mars

./pre-install.sh

make -f Makefile


순서대로 진행하면 mars 실행파일이 생성된다.


실행명령은 아래처럼 하면 된다.


mars -a DNA/PROT -i input.fasta -o output.fasta -m 1 -T threads


output.fasta파일은 start와 end가 맞추어 졌으니 다시 clustal omega와 같은 MSA 프로그램에 결과를 기다리면 된다.



밑에 예시에서는 5종의 mitochondria sequence를 넣고 바로 MSA를 했을 때 밑의 두 종의 sequence만 먼저 나오는 것을 확인할 수 있었지만 mars를 진행한 뒤 다시 MSA를 했을 땐 정상적으로 align되는 것을 확인할 수 있었다.





Reference -

https://github.com/lorrainea/mars

Lorraine A. K. Ayad and Solon P. Pissis, MARS: improving multiple circular sequence alignment using refined sequences, BMC Genomics, 2017 https://doi.org/10.1186/s12864-016-3477-5

반응형

'bioinformatics' 카테고리의 다른 글

Stem cell  (0) 2018.04.05
Single cell sequencing  (0) 2018.04.05
BEAGLE-LIB 설치하기  (0) 2017.09.27
BEAST 설치 및 실행하기  (0) 2017.09.27
MHAP 설치 및 실행하기  (0) 2017.09.19
반응형

BEAGLE-LIB 설치하기



BEAST를 실행하는데 beagle-lib가 필요하여 설치방법을 소개하고자 한다.


README 파일에서는 svn으로 받으라고 되어있지만 해당 PATH를 찾지 못하여 그냥 git 주소와 같이 공개한다.


svn checkout http://beagle-lib.googlecode.com/svn/trunk BEAGLE

cd BEAGLE

or



./autogen.sh

./configure --prefix=/PATH/TO/INSTALL/BEAGLE-LIB

make

make install


순서로 진행하면 된다.


autogen.sh 시에 OS의 버전이 낮을 시 autoconf 버전이 맞지않아 configure파일이 생기지 않을 수 있는데 autoconf를 새로 설치하면 된다.



configure시에 아래와 같은 경고가 있을 수 있는데 GPGPU 연산이 불가능한 서버에서 작업 중이라면 무시하고 진행한다.


configure: WARNING: OpenCL not found or disabled.  OpenCL implementation  will not be built. If OpenCL support is desired, check the path to OpenCL and specify --with-opencl=/path/to/opencl

configure: WARNING: NVIDIA CUDA nvcc compiler not found or CUDA support disabled.  CUDA implementation will not be built. If CUDA support is desired, check the path to CUDA and specify --with-cuda=/path/to/cuda


make 와 make install까지 성공적으로 마쳤다면 PATH를 잡아주기만 하면 된다.


export LD_LIBRARY_PATH=/PATH/TO/INSTALL/BEAGLE-LIB/lib:$LD_LIBRARY_PATH 









반응형

'bioinformatics' 카테고리의 다른 글

Single cell sequencing  (0) 2018.04.05
MARS 설치 및 실행하기  (0) 2017.09.27
BEAST 설치 및 실행하기  (0) 2017.09.27
MHAP 설치 및 실행하기  (0) 2017.09.19
Racon 설치 및 실행하기  (0) 2017.09.19
반응형

BEAST 설치 및 실행하기



BEAST는 서열을 MCMC를 사용한 Bayesian analysis를 통해 phylogenetic tree를 그려주는 프로그램이다.


홈페이지 - http://beast.community/


JAVA 1.6 이상 버전에서 작동한다.


다운로드는 github를 통해서 할 수 있다. (https://github.com/beast-dev/beast-mcmc/releases/latest)


1.8.4 버전 기준으로 설치는 아래와 같다.


https://github.com/beast-dev/beast-mcmc/releases/download/v1.8.4/BEASTv1.8.4.tgz

tar -zxf BEASTv1.8.4.tgz


특별히 install 할 필요는 없고 압축을 풀면 bin 폴더가 나온다. 


GUI 기반으로 작동하니 Xming 등의 X server 프로그램과 동시에 실행해야 한다.


BEAGLE library plugin도 설치해야 한다.


2017/09/27 - [bioinformatics] - BEAGLE-LIB 설치하기


Beast 옵션 중에 beagle library가 불가능 할시 그냥 쓰지 않을 수도 있기는 하다. 정확히 무슨 차이가 있는지는 조사 필요함.



모두 설치하고나면 BEAUti, BEAST, TreeAnnotator, LogCombiner, TreeStat 다섯 개의 프로그램이 설치된다.



홈페이지에 있는 tutorial을 그대로 따라하면 tree를 그릴 수 있다.


간략하게 순서를 말하자면


먼저 NEXUS 포맷의 MSA (mulitiple seuquence alignment) 결과가 필요하다. 


web program인 clustal omega (http://www.ebi.ac.uk/Tools/msa/clustalo/)에 sequence를 넣고 output format만 NEXUS로 바꾸고 돌리면 MSA 결과는 쉽게 얻을 수 있다.


BEAUti 프로그램으로 MSA 결과와 BEAST를 어떤 parameter로 돌릴 지를 결정하고 저장하면 xml파일이 생기는데


이후에 BEAST 프로그램에 xml파일을 넣고 실행하면 trees파일이 생성되고 이 파일을


figtree(http://tree.bio.ed.ac.uk/software/figtree/) 등의 프로그램으로 확인하는 것이다.







반응형

'bioinformatics' 카테고리의 다른 글

MARS 설치 및 실행하기  (0) 2017.09.27
BEAGLE-LIB 설치하기  (0) 2017.09.27
MHAP 설치 및 실행하기  (0) 2017.09.19
Racon 설치 및 실행하기  (0) 2017.09.19
Phylip 설치 및 실행하기  (0) 2017.09.18
반응형

MHAP 설치 및 실행하기




MHAP은 2015년 Nature Biotechnology에 출판된 논문(http://www.nature.com/nbt/journal/v33/n6/full/nbt.3238.html

)에서 소개하고 있는 프로그램이다.

Konstantin Berlin et al, Assembling large genomes with single-molecule sequencing and locality-sensitive hashing, Nature Biotechnology, 2015


K-mer의 Jaccard similarity를 계산하고 PacBio나 Nanopore long read를 빠르게 mapping할 수 있는 프로그램이다.


설치는 아래의 명령어를 따라하면 된다.

git clone https://github.com/marbl/MHAP.git
cd MHAP
mvn install

설치가 끝나면 target이라는 폴더가 생기고 그 안에 mhap-*.jar 이라는 파일이 생성되었을 것이다.

java -jar mhap-*.jar 으로 실행하면 된다.



간단하게 명령어를 설명하면 


java -server -Xmx300g -jar mhap-2.1.3.jar --num-threads 32 -q <long reads> -s <contigs>


300g의 메모리를 사용하고 32개의 쓰레드를 사용하며 long reads를 contigs에 mapping하겠다는 의미이다.



설명에 따로 index파일을 만드는 법이 나와있지 않고 매번 명령어를 실행할 때마다 임시로 index를 진행하기 때문에 indexing을 미리 해두면 여러 번 작업할때 시간을 단축할 수 있다. (그래도 mammalian genome을 indexing하는데 10분정도 밖에 안걸린다.)


java -server -Xmx300g -jar mhap-2.1.3.jar -p fastafile.fasta -q output_directory


결과로 fastafile.dat 파일이 생성되는데 alignment 할 때 fasta 파일 대신 dat 파일을 넣어주면 된다.






반응형

'bioinformatics' 카테고리의 다른 글

BEAGLE-LIB 설치하기  (0) 2017.09.27
BEAST 설치 및 실행하기  (0) 2017.09.27
Racon 설치 및 실행하기  (0) 2017.09.19
Phylip 설치 및 실행하기  (0) 2017.09.18
CAFE v4.0 설치 및 실행하기  (0) 2017.09.11
반응형


Racon 설치 및 실행하기




2017년 Genome Research에 나온 논문(http://genome.cshlp.org/content/early/2017/01/18/gr.214270.116)에서 소개하고 있는 프로그램으로 long read polish에 관련되어 있는 프로그램이다.

Robert Vaser et al, Fast and accurate de novo genome assembly from long uncorrected reads, Genom Research, 2017


2017/09/20 - [paper review] - Fast and accurate de novo genome assembly from long uncorrected reads



설치는 매우 간단하다.


git clone https://github.com/isovic/racon.git && cd racon && make modules && make tools && make -j  


한 줄만 입력하면 bin 폴더와 bin/racon 파일이 생성된다.


README.md 파일을 보면 어떻게 실행해야하는지 설명이 간략하게 쓰여있다.


quliay value가 포함된 reads (반드시 fastq파일이 있어야 함), mapping된 파일 (paf/mhap/sam) 그리고 contig파일(fasta/fastq/gfa) 이 필요하며 마지막으로 outputfile이름을 적어주면 된다.


mapping 파일에 따라 --mhap 또는 --sam 옵션을 넣어주어야 한다. 마지막으로 --erc 옵션을 넣어주면 error correction을 할 수도 있다고 쓰여있다. 


mhap format으로 진행을 하려다가 mhap은 fasta파일만을 받는데 racon에서는 fastq파일을 요구해서 충돌이 일어나기때문에 여러 차례 시도 후에 그냥 bwa로 맵핑해서 진행했다.


racon --sam reads.fastq alignment.sam scaffold.fasta consensus.fasta 


input값만 제대로 넣어줬다면 consensus파일이 정상적으로 생성되는 것을 확인할 수 있다.



tutorial에서는 각 방식대로 진행할 수 있게 되어있는데 mhap이 제대로 작동하는지 example1_2-mhap-lambda.sh 으로 테스트 해보려 했으나 에러가 난다.


심지어 mhap은 minimap으로 align한 결과는 paf to mhap로 변환을 하고 있기 때문에 제대로된 mhap format을 확인할 수 없었다.


또한 dnadiff라는 명령을 인식하지 못하는데 이 프로그램은 MUMmer를 설치하면 해결할 수 있다.


2017/09/21 - [bioinformatics] - MUMmer 설치 및 실행하기




반응형

'bioinformatics' 카테고리의 다른 글

BEAST 설치 및 실행하기  (0) 2017.09.27
MHAP 설치 및 실행하기  (0) 2017.09.19
Phylip 설치 및 실행하기  (0) 2017.09.18
CAFE v4.0 설치 및 실행하기  (0) 2017.09.11
Synteny Circos plot 그리기  (0) 2017.08.30
반응형

Phylip 설치 및 실행하기




홈페이지 - http://evolution.genetics.washington.edu/phylip.html


University of Washington에서 만든 간단한 phylogenetic tree를 그려주는 프로그램이다.


몇 안되는데 True or False 값으로만 유전자 존재 유무를 체크하고 그려주는 binary phylogenetic tree 프로그램이다. MSA로 진행하는 프로그램을 Cluster Omega를 포함해서 많으니 그 쪽을 참고하기 바란다. binary input을 사용하는 모듈은 clique이다.


주의해야 할 점은 발현하는 유전자 FPKM cutoff를 주고 그 이상 발현되는 유전자만을 따로 추려내도록 해야 한다. 


mis-aligned된 reads로 인한 FPKM을 고려하지 않으면 결과가 의도치 않은 방향으로 나올 것이다.



윈도우 버전으로 사용할 때는 따로 설치는 필요 없고 다운받은 파일의 압축만 풀면 된다.


Linux 버전으로 사용할 때는 tar.gz 파일을 받아서


tar -zxf phylip-3.696.tar.gz

cd phylip-3.696/src/

make -f Makefile.unx install


하고 나면 phylip-3.696/exe 폴더 내에 실행파일이 생긴 것을 확인할 수 있다.



실행파일을 열면 바로 infile이 없다고 나오면서 inputfile의 이름을 넣으라고 나오는데 윈도우에서는 실행한 위치에 파일이 있어야 읽을 수 있다. linux에서는 실행한 곳에 파일이 있으면 된다.


inputfile의 format은 윈도우버전의 exe/testdata 폴더 안에서 확인할 수 있는데 프로그램이 오래 전에 만들어져서 tab으로 간격을 두지 않고 띄어쓰기의 숫자로 간격이 정해진다. 


반드시 testdata를 보고 띄어쓰기의 개수를 맞춰서 진행하면 에러 없이 진행되는 것을 확인할 수 있다.




반응형

'bioinformatics' 카테고리의 다른 글

MHAP 설치 및 실행하기  (0) 2017.09.19
Racon 설치 및 실행하기  (0) 2017.09.19
CAFE v4.0 설치 및 실행하기  (0) 2017.09.11
Synteny Circos plot 그리기  (0) 2017.08.30
Arrow/Quiver 설치 및 사용하기  (0) 2017.08.24
반응형

CAFE v4.0 설치 및 실행하기




CAFE v4.0 Software for Computational Analysis of gene Family Evolution


gene gain and loss를 계산하기 위해 CAFE 설치를 해보기로 했다.


homepage - https://hahnlab.github.io/CAFE/index.html



다운로드는 홈페이지 내의 다운로드 탭에서 github 링크를 따라가서 cafe-version.tar.gz을 다운받는다.


tar xf cafe*tar.gz 


./configure 

make


CAFE/release/cafe 실행파일이 생성된다.



tutorial.pdf 파일을 보고 따라해 보자.


1. ensembl biomarket에서 종의 protein sequence를 받아야 한다.



ensembl genes, species를 고르고 attributes에서 sequence->peptide를 고르고 header information에서 trascript ID를 빼고 CDS length를 넣어주면 된다.


Results를 누르고 이메일로 받거나 그냥 다운받으면 된다.


다운받으면 모두 한 폴더에 넣은 뒤 압축을 풀면 된다.



2. longest isoform 만을 추려내야 한다.


cafe/manual/tutorial files에 가면 script가 존재한다.  (https://iu.box.com/v/cafetutorial-files)


튜토리얼 파일 전부를 받으면 용량이 5Gb가 넘어가니 필요한 부분만 따로 받는것이 좋다.


python python_scripts/cafetutorial_longest_iso .py -d twelve_spp_proteins/

cat twelve_spp_proteins/longest*.fa > makeblastdb_input.fa


-d 뒤에는 sequence가 있는 폴더명을 적어주면 되고 폴더 안에있는 .fa 확장자 파일을 읽어서 longest 파일만을 가져온다.

여러 종의 longest 파일이 각각 존재하니 한 파일로 묶어 주어야 한다.



3. blast로 align하기.


makeblastdb -in makeblastdb_input.fa -dbtype prot -out blastdb

blastp -num_threads 4 -db blastdb -query makeblastdb_input.fa -outfmt 7 -seg yes > blast_output.txt


시간이 상당히 많이 걸린다. tutorial에서는 align된 결과도 위의 tutorial files에서 제공하고 있다.



4. clustering 하기


mcl이 설치되어 있어야 한다. 


wget https://www.micans.org/mcl/src/mcl-latest.tar.gz

tar -zxf mcl-latest.tar.gz 

./configure --prefix=/PATH/TO/INSTALL/MCL

make && make install

export PATH=/PATH/TO/INSTALL/MCL/bin:$PATH


이후에 mcl를 사용해서 gene family 레벨에서 clustering을 진행한다.


grep -v "#" blast_output.txt | cut -f 1,2,11 > blast_output.abc

mcxload -abc blast_output.abc --stream-mirror --stream-neg-log10 -stream-tf 'ceil(200)' -o blast_output.mci -write-tab blast_output.tab

mcl blast_output.mci -I 3

mcxdump -icl out.blast_output.mci.I30 -tabr blast_output.tab -o dump.blast_output.mci.I30


tutorial에 있던 python script를 사용해서 결과를 만든다.

cafetutorial_mcl2rawcafe.py -i dump.blast_output.mci.I30 -o unfiltered_cafe_input.txt -sp "ENSAPLG ENSFALG ENSGALG ENSTGUG ENSMGAG"

cafetutorial_clade_and_size_filter.py -i unfiltered_cafe_input.txt -o filtered_cafe_input.txt -s



5. tree 계산하기


((( cow :0.09289 ,( cat :0.07151 , horse :0.05727) :0.00398) :0.02355 ,(((( orang

:0.01034 ,( chimp :0.00440 , human :0.00396) :0.00587) :0.00184 , gibbon

:0.01331) :0.00573 ,( macaque :0.00443 , baboon :0.00422) :0.01431)

:0.01097 , marmoset :0.03886) :0.04239) :0.03383 ,( rat :0.04110 , mouse

:0.03854) :0.10918) ;


위와 같은 NEWICK 포맷의 종간 거리가 계산되어 있는 파일이 필요하다.


튜토리얼에서는 이미 계산되어 있는 경우 그냥 가져다 쓰면 된다고 나와있지만 그런 경우는 별로 없을 것 같다.


ultrametric으로 새로 계산하기 위해서 r8s 라는 프로그램을 소개하고있다.



phylogenetic tree를 계산하는 방법은 세 가지 인데


Cladogram - branch의 길이는 의미 없음. 대략적으로 어떻게 분류되는지만 보여준다.

Phylogram - 길이는 유전적인 관계를 나타낸다. 같은 종류에 묶여있더라도 길이에 따라 더 가까운 관계가 존재한다.

Ultrametirc - Phylogram과 비슷하나 유전적인 관계보다 시간적인 요소에 가중치를 두었다. 



r8s는 phylogram으로 계산한 방식을 ultrametric으로 바꿀 수 있는 프로그램인데 링크가 다 깨져 있어서 접속 불가.



ultrametric tree를 그려주는 BEAST 프로그램으로 대체하였다.


2017/09/27 - [bioinformatics] - BEAST 설치 및 실행하기










반응형

'bioinformatics' 카테고리의 다른 글

Racon 설치 및 실행하기  (0) 2017.09.19
Phylip 설치 및 실행하기  (0) 2017.09.18
Synteny Circos plot 그리기  (0) 2017.08.30
Arrow/Quiver 설치 및 사용하기  (0) 2017.08.24
SyMap 설치 및 실행하기  (0) 2017.08.23
반응형

Synteny Circos plot 그리기.




2017/08/23 - [bioinformatics] - SyMap 설치 및 실행하기

2017/08/15 - [bioinformatics] - Circos plot 그리기.


두 프로그램을 사용하여 synteny circos plot을 그려보고자 한다.



SyMap에서는 


symap결과는 align이 끝난 뒤 SyMAP Queries 로 들어가 받을 수 있는 CSV 파일을 쓴다.


받을 때 반드시 Select columns에 가서 각 assembly의 start와 end를 체크해서 block의 시작과 끝을 다운받는다.


이제 csv 파일을 circos의 link 포맷으로 바꿔야 하는데 link의 포맷은 아래와 같다.


...
hs1 100 200 hs2 250 300
hs1 400 550 hs3 500 750
hs1 600 800 hs4 150 350
...


assembly1 start1 end1 assembly2 start2 end2


의 양식으로 바꾸면 된다. 여기서 assembly1과 assembly2는 당연히 circos의 karyotype을 설정할 때 넣어줬던 이름과 같아야한다.


또한 link의 개수가 25000개를 넘어가면 너무 많다는 경고와 함께 너무 많은 링크는 해석하기 어려울 것이라고 하면서 실행되지 않는다. 


  but the maximum is currently set at [25000]. To increase this number change

  max_links in etc/housekeeping.conf. Keep in mind that drawing that many links

  may create an image that is too busy and uninterpretable.


etc/housekeeping.conf에서 변수 조절 할 수 있으나 별로 추천하지 않는다. 차라리 block의 사이즈에 제한을 두고 link의 개수를 줄이는 것이 좋다.



Circos에서는 configure파일을 조정해줘야 하는데


1. 두 assembly의 karyotype을 모두 불러오기.

2. 위의 파일을 불러오기.

3. color, orientation 조절하기.


등을 모두 설정하면 아래와 같은 그림을 그릴 수 있다.




실제로 위의 그림을 그릴 때 사용한 옵션은 각각


1.


karyotype = circos/circos-0.69-/data/karyotype/assembly1.txt,circos/circos-0.69-3/data/karyotype/assembly2.txt


2.


<links>


<link>

ribbon = no

file          = assembly1_to_assembly2.link

color         = black_a5

radius        = 0.95r

#bezier_radius = 0.1r

thickness     = 1

</link>


</links>


3. 


chromosomes_order = assemblya1,assemblya2,assemblya3,assemblya4,assemblya5,assemblya6,assemblya7,assemblya8,assemblya9,assemblya10,assemblya11,assemblya12,assemblya13,assemblya14,assemblya15,assemblya16,assemblya17,assemblya18,assemblya19,assemblya20,assemblya21,assemblya22,assemblya23,assemblya24,assemblya25,assemblya26,assemblya27,assemblya28,assemblya29,assemblya30,assemblya31,assemblyaX,assemblybX,assemblyb31,assemblyb30,assemblyb29,assemblyb28,assemblyb27,assemblyb26,assemblyb25,assemblyb24,assemblyb23,assemblyb22,assemblyb21,assemblyb20,assemblyb19,assemblyb18,assemblyb17,assemblyb16,assemblyb15,assemblyb14,assemblyb13,assemblyb12,assemblyb11,assemblyb10,assemblyb9,assemblyb8,assemblyb7,assemblyb6,assemblyb5,assemblyb4,assemblyb3,assemblyb2,assemblyb1

chromosomes_reverse = assemblybX,assemblyb31,assemblyb30,assemblyb29,assemblyb28,assemblyb27,assemblyb26,assemblyb25,assemblyb24,assemblyb23,assemblyb22,assemblyb21,assemblyb20,assemblyb19,assemblyb18,assemblyb17,assemblyb16,assemblyb15,assemblyb14,assemblyb13,assemblyb12,assemblyb11,assemblyb10,assemblyb9,assemblyb8,assemblyb7,assemblyb6,assemblyb5,assemblyb4,assemblyb3,assemblyb2,assemblyb1


그리고 input으로 넣는 link파일에서 크로모좀이 같으면 color=크로모좀을 넣고

다르면 color=black을 넣는다.


assemblya8 64927554        64987328        assemblyb8 67051330        67111104        color=chr8

assemblya26        372029  420198  assemblyb4 25320273        25373211        color=black


3번이 조금 헷갈릴 수 있을거 같은데 assembly a와 assembly b를 각각 assembly 이름으로 바꿔놓으면 된다.




반응형

'bioinformatics' 카테고리의 다른 글

Phylip 설치 및 실행하기  (0) 2017.09.18
CAFE v4.0 설치 및 실행하기  (0) 2017.09.11
Arrow/Quiver 설치 및 사용하기  (0) 2017.08.24
SyMap 설치 및 실행하기  (0) 2017.08.23
GMAP 설치 및 실행하기  (0) 2017.08.22

+ Recent posts