• 邮箱

    info@e-omics.com
  • 电话

    4006321322
  • 微信

    18515913365
  • QQ

    47422642

当前位置:首页>关于我们>公司新闻

一键串烧式自动化蛋白质组学生信分析报告生成软件

发布时间:2021-03-17

近日,我司文章“obaDIA: one-step biological analysis pipeline for data-independent acquisition and other quantitative proteomics data”在bioinformatics正式发表,obaDIA内置完整的分析工具,并自动依次调用相关分析工具,自动生成完整的蛋白质组学生信分析报告。基于我们公司内部一年多的使用与打磨,现将第一版正式开源,供学术用户免费使用。本文章的链接为:https://www.biorxiv.org/content/10.1101/2020.05.28.121020v3
本工具软件的特点如下: 1、内部集成并定义蛋白质组学分析的主要分析模块,导入蛋白质组学搜库结果,几句命令行,直接生成预定义好的蛋白质组学生信报告;2、除了利用开源的背景做富集分析外,我们实现了基于本地化背景的富集工具,丰富了富集分析的选择性(可以直接用鉴定到的蛋白质列表做富集分析也可以用对照样品鉴定蛋白质列表做富集分析;3、引入了一个新的工具,可以在信号通路里,直接显示鉴定到的差异蛋白质定量结果。
 
研究背景:
现有的蛋白质组学生物信息学分析软件通常只提供独立的分析模块和相对单一的分析结果,要完成包括数据质控、差异表达分析、功能注释和富集分析等分析内容,需要依赖于多个不同软件,也难以实现批量化和快速分析。obaDIA软件为快速实现蛋白质组学数据的生物信息学挖掘提供了解决方案。
 
obaDIA软件的流程实现

图1. obaDIA软件的流程实现
 
obaDIA以TSV格式的表达丰度矩阵和FASTA格式蛋白序列作为输入,自动进行表达丰度归一化、差异表达分析、功能注释和富集分析。它支持DIA技术产生的片段级、肽段级和蛋白级的表达丰度矩阵,也支持其他定量蛋白质组学技术(如iTRAQ/TMT, Lable Free等)产生的蛋白级的表达丰度矩阵。obaDIA软件流程通过三个核心模块执行。“AB & DE”模块用于表达丰度矩阵处理和统计,以及批量蛋白差异表达分析。“注释”模块用于根据SWISS-PROT、PFAM、GO、KEGG、eggNOG和signalP等数据库对蛋白序列进行功能注释和分类统计。“富集”模块接收“AB & DE”和“Annotation”的输出文件作为输入,对差异表达蛋白进行批量的基于GO、KEGG、PFAM和Rectome数据库的功能富集分析(图1)。
 
obaDIA软件的功能特点
1、简单易用,支持以容器(Docker)方式进行依赖环境的安装;
2、支持片段级、肽段级和蛋白级的表达丰度矩阵作为输入;
3、生成HTML格式的KEGG通路富集报告,交互展示差异表达蛋白的信息;
4、提供两种富集策略供用户选择,一种是以总蛋白为背景,另一种是以全部表达蛋白为背景;
5、支持快速分析模式,可以在几分钟内得到主要的分析结果。
 
obaDIA软件的下载地址:
https://github.com/yjthu/obaDIA.git
 
核心模块结果详述
AB & DE模块
       该模块用于表达丰度矩阵处理和统计,以及批量蛋白差异表达分析。主要结果包含箱线图、小提琴图、密度图、样品相关矩阵分析图、样品相关性热图、样品蛋白聚类热图,以及用于差异蛋白质分析的火山图。
 

      

  
 
Annotation模块
       该模块用于对蛋白质序列进行功能注释和分类统计。主要结果包含GO、KEGG和eggNOG注释结果分类统计柱状图。

      
 
Enrichment模块
       该模块以 “AB & DE”和“Annotation”模块的输出结果作为输入文件,对差异表达蛋白质进行批量功能富集分析。主要结果包含GO富集柱状图、GO富集DAG图、KEGG富集气泡图、KEGG富集通路图。

 

              尤其值得一提的是KEGG富集通路图的展示形式,我们通过自编程序,在KEGG通路图中除了显示蛋白质的上下调变化信息、相应数据库的链接,还将蛋白质的相对表达量以及在不同样品中的表达差异倍数情况一并呈现出来,便于读者更直观的获悉各蛋白质的相关信息。
 
参考文献:
Yan J., et al. obaDIA: one-step biological analysis pipeline for data-independent acquisition and other quantitative proteomics data, Bioinformatics, 2020:btaa893
Zhang, F., et al. Data-Independent Acquisition Mass Spectrometry-Based Proteomics and Software Tools: A Glimpse in 2020. Proteomics 2020:e1900276.
 
明德正康公司简介:
明德正康成立于2016年,是国家高新技术企业和中关村高新技术企业。公司主要从事基于质谱的蛋白质组学,抗体全序列解析,生物药表征和代谢组学研究,为科研机构,医疗机构和企事业单位,提供蛋白质组学,代谢组学类的定制合作研究服务。基于业内领先的蛋白质组学与代谢组学技术能力,公司致力于开发基于临床质谱的疾病早期筛查,诊断与分型,预后预测等临床质谱全方位解决方案。公司结合“学研产”一体化的思路,创新引领蛋白质组学与代谢组的发展,致力于将前沿的多组学科研成果应用于疾病研究、生物科研、农学育种与食品领域。

北京明德正康医学研究有限公司 © 2021 京ICP备2021006034号-1