岁月的尽头?你探索的,从来只是来时路。
——abysw
snpEff似乎还是经常被用来注释变异的软件之一。
$ ls 查看目录下文件
data examples exec galaxy LICENSE.md scripts snpEff.config snpEff_genes.txt snpEff.jar snpEff_summary.html SnpSift.jar
编辑配置文件:
——————————————————————————-
Third party databases
——————————————————————————-
MpTak1v5
MpTak1v5.genome : diqian
yugu1.genome : yugu
Setaria_italica.genome : Setaria_italica
Setaria_viridis.genome : Setaria_viridis
Medicago_sativa.genome : Medicago_sativa
Marchantia_polymorpha.genome : Marchantia_polymorpha
然后进入data目录准备原始文件:
先新建一个物种名文件(.genome之前的前缀),将物种的注释文件拷贝为genes.gff,将物种的蛋白文件拷贝为protein.fa;
然后进入genomes目录,将基因组文件拷贝进去;
建库:
Usage: snpEff build [options] genome_version
Build DB options:
Database format option (default: Auto detect):
-embl : Use Embl format.
-genbank : Use GenBank format.
-gff2 : Use GFF2 format (obsolete).
-gff3 : Use GFF3 format.
-gtf22 : Use GTF 2.2 format.
-knowngenes : Use KnownGenes table from UCSC.
-refseq : Use RefSeq table from UCSC.
最后直接run就行了。