生信-群体遗传学-snpEff的使用


岁月的尽头?你探索的,从来只是来时路。

——abysw

snpEff似乎还是经常被用来注释变异的软件之一。

$ ls 查看目录下文件
data examples exec galaxy LICENSE.md scripts snpEff.config snpEff_genes.txt snpEff.jar snpEff_summary.html SnpSift.jar

编辑配置文件:

——————————————————————————-

Third party databases

——————————————————————————-

MpTak1v5

MpTak1v5.genome : diqian
yugu1.genome : yugu
Setaria_italica.genome : Setaria_italica
Setaria_viridis.genome : Setaria_viridis
Medicago_sativa.genome : Medicago_sativa
Marchantia_polymorpha.genome : Marchantia_polymorpha

然后进入data目录准备原始文件:

先新建一个物种名文件(.genome之前的前缀),将物种的注释文件拷贝为genes.gff,将物种的蛋白文件拷贝为protein.fa;

然后进入genomes目录,将基因组文件拷贝进去;

建库:

Usage: snpEff build [options] genome_version

Build DB options:

Database format option (default: Auto detect):
-embl : Use Embl format.
-genbank : Use GenBank format.
-gff2 : Use GFF2 format (obsolete).
-gff3 : Use GFF3 format.
-gtf22 : Use GTF 2.2 format.
-knowngenes : Use KnownGenes table from UCSC.
-refseq : Use RefSeq table from UCSC.

最后直接run就行了。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注