beat365亚洲官方网站

当前位置: 学院首页>>新闻公告>>学院新闻>>正文

beat365亚洲官方网站郑智捷教授团队在多种冠状病毒进化基因索引图示研究领域取得进展

时间:2021年03月13日 15:07

    2020年7月,国际先进材料协会(International Association of Advanced Materials IAAM)颁发给郑智捷教授终身会士(Fellow of IAAM FIAAM),其中利用变值体系研究团队在量子序列检测项目中发展出的精密测量模型和方法,作为特邀讲座的论文组成部分。

    2021年2月16日IAAM协会的会刊-先进材料通讯杂志(Advanced Materials Letters)正式出版的研究论文中提到:“针对多组冠状病毒基因组的基因索引图示”(Viral Evolution of Multiple Coronavirus Genomes on Genomic Index Maps)1

    相关的内容还有2020年10月Webleo线上国际材料科学工程与技术会议的特邀会士讲座:“在信息熵表示的基因索引图中展现全球新冠病毒序列分布”(Spread of multiple SARS-CoV-2 genomes worldwide on genomic index maps of information entropy)2 ;以及2020年11月在昆明召开的“第七届国际新型光电探测技术及其应用研讨会”的特邀报告中提出的“利用信息熵分析模型和方法描述基因序列的高维概率谱精细特征分布”,随后在云南省医疗信息化联盟学术沙龙和其它多个网上/线下的学术讨论会中做过广泛交流。

 该论文基于分段基因数据形成统计分布,利用信息熵形成两种新型熵测度:平均熵(Mean Entropy)和集成熵(Integrated Entropy)形成基因索引为序列的整体不变量测度,标记序列之间的4种核苷酸的16种组合整体概率测度,分别形成垂直和水平两个方向的坐标网格,两组基因索引之间的差值与基因组本身的变异成比例,两组基因序列相同则必然投影在同一个位置。

 基础病毒数据源于NCBI和GISAID病毒数据库,选择的43组病毒序列:17组冠状病毒+26组新冠病毒。17组病毒包括:3组普通型人类冠状病毒{Hcov1, Hcov2, Hcov3}, 3组流感病毒{IBV,H1N1, H3N3},3组蝙蝠病毒{Yunnan Bat, Eidolon Bat, Scotophilus Bat},5组动物病毒{Duck, Mink, Murine, Pangolin, PDCov},3组严重型冠状病毒{SARS, MERS, Ebola} ;26组新冠病毒:不同区域采集到的新冠病毒{SARS-CoV-2}。论文的核心结果展示在图1和选择区域100倍放大的图2中。

 在图1中所有43组全基因组冠状病毒序列,在伴随熵测度之下投影到对应的位置水平坐标位置为[2.48,2.64]可以区分熵差值范围为0.16,垂直坐标位置为[3.97,4.04]可以区分熵差值范围为0.07。

图1. 在基因索引图中展示43组冠状病毒信息熵测度分布(标尺精度:0.01),平均熵:水平坐标,集成熵:垂直坐标, 图中中部的黑框选择部分在图2中放大展示

    观察图1中的分布结构,可以看到新冠病毒位于核心部分在对整个基因索引水平和垂直两个方向的平均值附近(黑十字标记)。离黑框右侧较近的分别是从云南采集到的蝙蝠病毒 Bat,以及3组流感病毒{IBV,H1N1,H3N2},其次为Mink,Duck 和 Ebola。离黑框左侧较近的分别是马来西亚穿山甲Pangolin,田鼠 Murine,Hcov1, Eidolon Bat, SARS, MERS, 距离较远的为 PDcov, Hcov2, Hcov3。


图2. 27组序列:源于26个区域的新冠病毒和1组苏格兰采集的蝙蝠病毒在基因索引图中展示(标尺精度:0.0001),图2比图1精度增加100倍。

    在图2中,水平坐标位置为[2.5355,2.5400]可以区分熵差值范围为0.0045,垂直坐标位置为[3.9995,4.0016]可以区分熵差值范围为0.0021。

 从图示分布中可以看到云南蝙蝠和马来西亚穿山甲携带的冠状病毒,的确与新冠病毒序列的基因索引测度差值较小,即相似度较大。

 观察图2中的分布,可以看到26组新冠基因索引图中的分布都位于苏格兰蝙蝠病毒的左边区域垂直方向[4.0002,4.0010]条状区域差值为0.0008。大部分新冠序列分布在整体平均值(黑十字)上面部分,可以观察到若干的序列相距较小。由于信息熵测度对应着实数坐标,从原理而言,可以进行任意精度的测量操作。对于有限长度的基因序列,基因索引度量具有最小单位测度。对长度为30K新冠病毒,观察到的最小长度差值单位为0.0000001。从精细图示分辨的角度,还能继续在图2的基础上放大上千倍。

 该论文作者为郑智捷教授和朱明涵硕士。研究成果在beat365亚洲官方网站,云南省量子信息重点实验室和云南省软件工程重点实验室中获得。生命科学学院张志刚教授为项目组提供了批量病毒基因序列数据。

 感谢国家自然科学基金,云南省科技厅重大专项和云南省海外高层次人才项目,对变值体系基础理论和前沿应用研究的多年持续基金支持。



1:参阅全文:https://www.vbripress.com/aml/articles/details/1596

2:参阅视频:https://vebleo.com/speakers-lecture/



供稿:beat365亚洲官方网站

编辑:王雨海,郭嘉皓,卢真帝

责任编辑:季启律


关闭