반응형

AGOUTI 설치 및 실행하기




AGOUTI: improving genome assembly and annotation using transcriptome data 


https://doi.org/10.1186/s13742-016-0136-3



transcriptome data로 genome assembly와 gene annotation을 ipmorving 시키는 프로그램 이다.


RNAPATH 라는 유사 프로그램이 2010년 genome research에 있다.


RNAPATH와의 가장 큰 차이는 denoise 방식을 거친다는 것이다.


Python 2.7+ 버전에서 실행 가능 하다.


git clone https://github.com/svm-zhang/AGOUTI.git


폴더 안에 agouti.py 스크립트가 있다.



python agouti.py scaffold -assembly FILE -bam FILE -gff FILE


input file은

1. genome (fasta)

2. paired-end RNA-seq mapping file (bam)

3. annotation (gff)




반응형

'bioinformatics' 카테고리의 다른 글

SyMap 설치 및 실행하기  (0) 2017.08.23
GMAP 설치 및 실행하기  (0) 2017.08.22
Augustus 설치 및 실행하기  (0) 2017.08.16
HMMER 설치 및 실행하기  (0) 2017.08.16
NCBI BLAST+ 설치 및 실행하기  (0) 2017.08.16
반응형

Genome으로부터 sequence 가져오기.




gtf, gff, bed format 등으로부터 sequence를 가져와야 할 때가 자주 생긴다.


julia에서 주의해야할 점은 start index가 0이 아니라 1이라는 것이다.


Plus strand일 경우 그냥 가져오면 되지만


Minus strand 일 때는 reverse complimentary한 sequence를 가져와야 한다.


comp = ['G' => 'C', 'T' => 'A', 'A' => 'T', 'C' => 'G', 'g' => 'c', 't' => 'a', 'a' => 't', 'c' => 'g']


if strand == '+'

sequence = reference[chromosome][startpos:endpos]

elseif strand == '-'

sequence = reverse(map(x -> comp[x] , reference[chromosome][startpos:endpos])

end


comp라는 dictionary를 만들어서 각각 대응되는 염기를 넣는다.


strand가 + 일 경우 genome sequence를 넣어둔 reference라는 dictionary에서 chromosome을 넣고 start와 end coordinate를 넣어주는 것으로 sequence를 가져오면 되지만, - 일 경우 +와 동일한 방법으로 가져온 sequence를 complimantary하게 바꾼 뒤 reverse함수를 사용해서 뒤집는다.




반응형
반응형

Julia 설치 및 실행하기




Julia. 아직 배우는 중이라 어떤 부분에서 장점이 있는지 파악하는 중이다.


Python과 C의 장점만을 가져와서 만드려고 했고 계산과학쪽에서 다루기 위하여 만들어졌다.


적어도 Python 보다는 배우기가 어렵다. but, 파이썬이 지나치게 쉬운거지 Julia가 어려워서는 아니다.



설치를 위해 홈페이지 https://julialang.org/ 에서 최신버전 linux binary 파일을 다운로드 한다. 아직 개발 -ing 중이기 때문에 버전이 1 이상으로 올라가지 않았으며 약 6개월 주기로 버전이 업데이트 되는듯 하다.


wget https://julialang-s3.julialang.org/bin/linux/x64/0.6/julia-0.6.0-linux-x86_64.tar.gz


압축을 풀고 나면 bin 폴더 안에 julia 실행 파일이 있다.



julia는 module을 설치할 때 Pkg.add("MODULE") 으로 설치할 수 있으며 $HOME/.julia/ver/MODULE 로 설치된다.


Julia에서의 장점은 module을 각자 개별 설치가 가능하다는 것이다. python 같은 경우 내 local 안에 python을 설치한 것이 아니라면 내가 module을 설치할 수 없다. but, julia는 그냥 설치하면 된다. 


내가 만든 프로그램을 남이 설치할 때 편하다. module이 있는지 체크하고 없다면 그냥 Pkg.add(MODULE) 되도록 코드를 짜면 된다.



나중에 따로 정리하겠지만 plotting 하는 모듈들을 테스트 해보고 있다. Python을 쓸 때는 rpy를 써야 했고 개인적으로 안익숙해져서 R과 Python을 번갈아 사용하면서 plotting을 하는 귀찮음이 있었는데 julia는 쉽게 할 수 있을 것으로 보인다.

반응형
반응형

Python 설치 및 실행하기




Python은 프로그래밍 언어의 일종으로 배우기 쉽기 때문에 입문용으로 많이 사용된다.


Data science 분야에서 전반적으로 사용하고 있다. 


다운로드 경로 https://www.python.org/downloads/ 에서 원하는 버전을 다운로드 받는다.


tar -zxf Python-*.tgz

cd Python-3.5.1

./configure --prefix=/PATH/TO/INSTALL/PYTHON

make && make install



Python 2.X 버전은 python 모듈을 쉽게 설치할 수 있는 easy_install이나 pip를 기본적으로 제공하고 있지 않다.


setuptools를 다운로드 받아서 설치해 줘야 한다.



setuptools를 다운 받았으면 설치한 python을 사용하여 아래와 같이 입력 한다.


python setup.py install


그러면 python/bin 폴더에 easy_install이 생긴다.


pip를 설치하기 위해서는 다시 한 번 아래처럼 입력 한다.


easy_install pip


bin 폴더에 pip도 생겼다.



pip를 사용하여 모듈을 설치할 때 pip install <MODULE> 를 입력하면 된다.


반응형

'Computer Science > python' 카테고리의 다른 글

Primer 서열 분석을 위한 python 코드  (0) 2021.08.17
String Format으로 길이 고정하기  (0) 2020.06.24
python multi-level argparse  (0) 2019.07.12
python 파일 입출력  (0) 2019.07.12
cannot mkdir R_TempDir 에러  (0) 2016.09.07
반응형

Augustus는 HMMER를 사용한 eukaryotic genomic sequence로 유전자를 예측하는 프로그램이다? (업데이트 필요)


홈페이지 http://bioinf.uni-greifswald.de/augustus/


최신버전 링크 http://bioinf.uni-greifswald.de/augustus/binaries/augustus.current.tar.gz


다운받은 파일을 압축을 풀면 폴더 명이 augustus로 고정되어 있기 때문에 버전관리를 위해 폴더명을 바꿔주는것을 권장한다.



압축을 푼 폴더로 가서 make 하고 PATH를 연결해 주어야 한다.



export AUGUSTUS_CONFIG_PATH=/PATH/TO/INSTALL/AUGUSTUS/config/

export PATH=/PATH/TO/INSTALL/AUGUSTUS/bin/:$PATH

export PATH=/PATH/TO/INSTALL/AUGUSTUS/scripts/:$PATH


아래는 3.3 버전 기준으로 현재 지원중인 종 목록이다.


  - Homo sapiens (human), 

  - Drosophila melanogaster (fruit fly), 

  - Arabidopsis thaliana (plant),

  - Brugia malayi (nematode),

  - Aedes aegypti (mosquito),

  - Coprinus cinereus (fungus),

  - Tribolium castaneum (beetle)

  - Schistosoma mansoni (worm)

  - Tetrahymena thermophila (ciliate)

  - Galdieria sulphuraria (red algae)

  - Zea mays (maize)

  - Toxoplasma gondii (parasitic protozoa)

  - Caenorhabditis elegans (worm)

  - Aspergillus fumigatus

  - Aspergillus nidulans

  - Aspergillus oryzae

  - Aspergillus terreus

  - Botrytis cinerea

  - Callorhinchus milii

  - Candida albicans

  - Candida guilliermondii

  - Candida tropicalis

  - Chaetomium globosum

  - Coccidioides immitis

  - Cryptococcus neoformans gattii

  - Cryptococcus neoformans neoformans

  - Danio rerio

  - Debaryomyces hansenii

  - Encephalitozoon cuniculi

  - Eremothecium gossypii

  - Fusarium graminearum

  - Gallus gallus

  - Histoplasma capsulatum

  - Kluyveromyces lactis

  - Laccaria bicolor

  - Lodderomyces elongisporus

  - Magnaporthe grisea

  - Neurospora crassa

  - Nicotiana attenuata (coyote tobacco)

  - Petromyzon marinus (sea lamprey)

  - Phanerochaete chrysosporium

  - Pichia stipitis

  - Rhizopus oryzae

  - Saccharomyces cerevisiae

  - Schizosaccharomyces pombe

  - Homo sapiens (human), 
  - Drosophila melanogaster (fruit fly), 
  - Arabidopsis thaliana (plant),
  - Brugia malayi (nematode),
  - Aedes aegypti (mosquito),
  - Coprinus cinereus (fungus),
  - Tribolium castaneum (beetle)
  - Schistosoma mansoni (worm)
  - Tetrahymena thermophila (ciliate)
  - Galdieria sulphuraria (red algae)
  - Zea mays (maize)
  - Toxoplasma gondii (parasitic protozoa)
  - Caenorhabditis elegans (worm)
  - Aspergillus fumigatus
  - Aspergillus nidulans
  - Aspergillus oryzae
  - Aspergillus terreus
  - Botrytis cinerea
  - Callorhinchus milii
  - Candida albicans
  - Candida guilliermondii
  - Candida tropicalis
  - Chaetomium globosum
  - Coccidioides immitis
  - Cryptococcus neoformans gattii
  - Cryptococcus neoformans neoformans
  - Danio rerio
  - Debaryomyces hansenii
  - Encephalitozoon cuniculi
  - Eremothecium gossypii
  - Fusarium graminearum
  - Gallus gallus
  - Histoplasma capsulatum
  - Kluyveromyces lactis
  - Laccaria bicolor
  - Lodderomyces elongisporus
  - Magnaporthe grisea
  - Neurospora crassa
  - Nicotiana attenuata (coyote tobacco)
  - Petromyzon marinus (sea lamprey)
  - Phanerochaete chrysosporium
  - Pichia stipitis
  - Rhizopus oryzae
  - Saccharomyces cerevisiae
  - Schizosaccharomyces pombe

BUSCO에서 -sp에 들어갈 수 있는 종도 위의 목록에서 선택할 수 있다.



반응형

'bioinformatics' 카테고리의 다른 글

GMAP 설치 및 실행하기  (0) 2017.08.22
AGOUTI 설치 및 실행하기  (0) 2017.08.21
HMMER 설치 및 실행하기  (0) 2017.08.16
NCBI BLAST+ 설치 및 실행하기  (0) 2017.08.16
Busco 설치 및 실행하기  (0) 2017.08.16

+ Recent posts