靶点预测与验证平台
赛业生物
靶点预测与验证平台
赛业生物积累了大量的生物信息及基因编辑方面的数据,结合AI人工智能技术,建立了数据集和算法模型,目前开发的罕见病数据中心(RDDC)可进行人类基因突变的致病风险预测,通过预测模型还可得到导致疾病表型的突变位点,进而构建相关的细胞或动物模型进行验证,为基因治疗研究开展提供极大便利。
罕见病数据中心
罕见病数据中心(Rare Diseases Data Center, RDDC),是由清华珠三角研究院人工智能创新中心和赛业生物联合开发的关于罕见病相关研究的数据中心,涵盖了全球已公布的确诊疾病的流行病学数据、药物发展概况、疾病相关基因图谱、基因突变位点、疾病相关实验大小鼠模型等数据信息。同时,RDDC在对罕见病数据信息进行搜集整理和重构的基础上,又以疾病、基因和动物模型为主线,对相关数据信息进行了多维度的展示。此外,RDDC还充分利用现有已公开的遗传大数据资源,布局了基于人工智能与生物信息技术的遗传疾病相关基因诊断工具,包括突变致病性预测(PathoPredic)、突变剪接预测(RNA Splicer)等多种线上工具。
罕见病数据库优势
关注治疗靶点:综合性生物医药研究数据库,重点关注医药研发上游致病机理和靶点发现。
AI工具开发:基于海量二代测序和疾病数据,利用机器学习和深度学习算法模型,构建以突变致病性预测和突变剪切改变预测为代表的基因数据辅助诊断模型。
核心信息切入:通过疾病、基因和动物模型三个切入点为生物医药研发提供信息获取便利。
高度可视化:提高研发者信息获取效率,颠覆传统生物类数据库只重数据,不重用户体验的弊端。
模块化设计:高度简洁性和交互性,模块化展示结合可视化,满足轻度用户提供快速直观了解所需信息的同时,通过大量交互设计,让深度用户也能便利挖掘深度信息,同时提供直观的相似数据比对相关的展示和筛选工具。
罕见病数据库开发背景
罕见病占所有疾病种类的2/3以上,在不同类型的疾病中,遗传性疾病,神经系统疾病和婴幼儿疾病中的罕见病种类最多,此外,除了肿瘤以外,所有类型疾病中的罕见病占比都达到了50%以上。另一方面,遗传病占据了罕见病种类中的大多数,遗传病和基因突变息息相关,因此对罕见病数据进行系统化的整理和分析有助于基因靶点的系统化研究,并为后续基因治疗手段的开发提供助力。
罕见病占疾病总数超过2/3
Malacards疾病分类中罕见病占比
以上数据来自于MalaCards
中国生物医药研究人员使用的数据库大多来源于欧美,数据库重要性不亚于“芯片”,一旦国外实现封锁的话,这类核心数据就会成为生物医药产业发展的“卡脖子”问题。另外,由于人种差异,国外罕见病发病人群与中国人群发病数据并不完全一样,建立中国自己的罕见病数据库尤为重要。
RDDC数据库对生物医学研究中的主要数据库中疾病,基因,突变,临床表型,疾病模型等的信息进行了清理、重构和优化,构建了庞大而全面的罕见病基础信息系统。
RDDC罕见病数据库使用指南
全外报告:从报告中选择基因突变信息进行预测。
输入全外报告中的信息
输入基因名称
选择转录本编号
输入突变位置
突变前氨基酸自动匹配
选择突变后的氨基酸
选择密码子
点击“预测按钮”进行预测
预测结果展示
基于38版本参考基因组进行预测
致病可能性为0.95
分级为致病突变(Pathogenic)
结论总结:突变致病性预测模型结果符合临床诊断。
全外报告:从报告中选择基因突变信息进行预测。
输入全外报告中的信息
输入基因名称
选择转录本编号
输入突变位置
突变前氨基酸自动匹配
选择突变后的氨基酸
选择密码子
点击“预测按钮”进行预测
预测结果展示
显示突变后有两种剪切可能
第一种为21号外显子左侧左移36bp
第二种保持原有剪接方式
结论总结:RNA剪接模型预测的可变剪接符合湿实验结果。
技术指标
应用
货号 | 名称 | 品牌 | 购买 |
---|