生信分析软件总结合集

如题所述

第1个回答  2022-06-18

持续更新中
EDTA :TE 注释工具。是一个可以从头注释全基因组中的TE并且评估已有TE库注释优劣的工具包。该工具的主要步骤是过滤掉原始TE中注释错误的,从而注释出全基因组中较高质量的非冗余TE库。
OrthoFinder :做进化、基因家族分析、比较基因组使用。它查找直系群和直系同源物,推断所有直系群的根源基因树,并识别这些基因树中的所有基因重复事件。 它还为要分析的物种推断出一个有根的物种树,并将基因复制事件从基因树映射到物种树中的分支。
TRF :是基因组注释中常用于检测序列中串联重复序列的软件。
cafe :基因家族收缩和扩张。
GMATA :分析基因组中的SSR序列(SSR:微卫星序列,串联重复)
RepeatMasker :鉴别转座子(TE)屏蔽转座子(TE)。
PASA :是一种真核生物基因组注释工具,利用转录组数据的可变剪接比对自动构建的基因结构模型,从而保持基因结构注释与转录组实验数据一致。(基于转录组测序)
GeMoMa :是基于同源性进行基因预测的软件。通过近缘物种蛋白编码基因对本物种的序列进行基因结构的预测,主要是根据氨基酸和内含子的保守性。此外,也可以整合转录组比对数据进行可变剪接位点的分析。
AUGUSTUS :是真核基因组结构从头预测软件,主要运用广义隐马尔可夫的概率模型(GHMM)进行基因结构的预测。通过分析DNA序列在概率模型中最有可能的基因结构,从而发现目标DNA序列中的基因。此外软件自身包含常见模式生物训练集,可利用这些物种直接进行基因预测;也可以利用同源预测和转录组最优结果生成训练集,预测基因。
EVM :对收集到的这些数据进行整合,获得非冗余外显子集合,从而定义出更加可靠的基因结构。(整合基因结构)
fastp :最新的质控软件。
Hisat2 :质控之后的比对软件。
Stringtie :将比对信息转为转录本坐标文件。
MUSCLE :蛋白质水平多序列比对软件,和ClustalW、T-coffee相比速度最快。
hasit2、STRA :基因组比对软件,STRA更准确,但计算速度慢,所需内存大。
bowtie2 :转录组比对软件。

相似回答