进入21世纪以来,生命科学逐渐成为备受追捧的热门学科,而那些将基因组学、生物信息学等现代生命科学技术转化成实际生产力的学者,更是这股现代科技革命浪潮的实践者。来自东南大学生命科学与技术学院的李健教授,长期致力于基因组学以及测序技术、生物信息学,聚焦于使用测序技术、基因组学、深度学习工具解决复杂疾病与健康问题的研究。同时,积极推进科研创新成果的转化,为全民健康做出了突出贡献,获得“2020年产学研合作创新奖”。
聚焦前沿,执着创新
从高通量生物信息获取技术,到测序技术与装备研发,再到使用测序与深度学习技术用于分析人体健康状况评估、疾病风险管控等领域的研究,李健团队一直专注于国家需求,开展了多项国家级和省部级课题,取得了众多颇具前瞻性的科研成果。
发现了基于基因组特定区域DNA拷贝数目作为鉴别临床上两种难以鉴别的皮肤肿瘤良恶性的客观生物标记物;并且临床实践可以通过比较基因组杂交和DNA测序的方法快速地确定相应拷贝数目变化的信息,从而为鉴别良性角化棘皮瘤和恶性的皮肤鳞状细胞癌提供了方法。
通过将便携式设备测序产生的大量的数据进行压缩,使用智能手机作为数据的接收和传输端,利用5G通信的短延时和广覆盖,将数据分析的工具在云端完成,技术上实现了“端-边-云”的结合,实现了测序及分析的实时、现场化。
基于生物医学大数据的时代背景与数字经济的前景,选取了未来最具价值的数据,构建了数据库、在线工具,云平台,尝试了一系列基于云平台而非传统的计算资源的应用场景设计;使用爬虫工具、自然语言处理工具以及深度学习挖掘、研究热点分析等工具和手段,实现了数据库不仅是数据汇集地,并且是在线分析方法以及热点追踪的云平台、云工具。
建立了世界上首个纳米抗体数据库;中国人群的HLA数据库;国内首个、世界第二个器官芯片数据库;脑科学研究热点追踪数据库等,同时构建纳米孔测序分析云平台,二代测序数据分析云平台等工作;完成多个重要数据资源的产业布局,逐渐形成了完备的数据分析流程和参考数据库。
提出了基于表观组学DNA甲基化信息,使用深度学习的方法用于临床抑郁症的诊断,以及判断抑郁症病人的治疗效果;选择DNA甲基化位点信息,构建了有效的深度学习模型,综合临床心理量表和DNA甲基化数据等多维度的信息,有效判断抑郁症患者以及抑郁症服药后的治疗效果。
提出了一种基于测序和数据分析的肥胖风险预测的模型;在方法上,针对SNP创建初步模型,包括对肥胖进行分类和对身高体重进行回归性分析;并引入集成学习的肥胖预测模型,提高了模型的准确性。
建立了一种基于Android平台的血压健康数据管理系统;在方法上,采用新的方法:血压的压力信号通过压力传感器转换为电信号,经过运算放大器放大、整流、直放输出到通信电路模块和语音播报模块,通信电路模块和Android手机端数据连接,语音播报模块和数据显示模块分别对检测到的血压值进行语言播报和数据显示。
使用基因测序技术及深度学习方法寻找自闭症早期诊断的生物标记物,目前该工作已经发现13个印记基因与自闭症相关,这些基因有希望成为用于自闭症早期诊断的生物标记物。
发现了在中国和欧美人群中,HBV病毒在C和S编码区的关键突变将会影响对其抗原肽与MHC I类分子之间的亲和力,可以推测候选的关键突变基因将会导致免疫逃逸,这可能与HBV病毒感染相关的肝癌发生有关。将为临床上检测HBV感染者的病程发展变化提供了重要的线索,目前正在进行产业的转化。
工匠本色,奉献社会
“二十年磨一剑”,这里的“磨”是“工匠”对品质的一种追求。李健和团队在科研领域的“磨”,彰显了工匠本色,更实现了奉献社会的初心。
在科研创新的同时,李健团队一直坚持产学研合作。李健团队已经与中国移动(成都)产业研究院建立合作,在东南大学与中国移动战略合作协议框架下,共同成立了东南大学-中国移动(成都)产业研究院未来医疗健康科技联合实验室。通过校企合作共同促进中国便携式测序技术与医疗、公共卫生和5G技术相融合,推动医疗和公共卫生领域的发展。通过高校与企业、政府的合作与共同努力,最终在实现“全民健康”伟大目标的进程中,做出自己的贡献,体现自身的价值。
为了解决边缘计算领域的核心关键技术问题和行业痛点,李健带领团队提出了基于边缘计算的解决方案。同时,团队主要关注如何利用边缘计算的特点,以数据在终端本地为前提,实现面向可穿戴设备与便携式测序应用的端边云协同高精度、大规模、高效率数据分析处理。
李健团队结合端云学习和边缘计算的特点,提出一种面向便携式测序应用的新型端边云协同分析处理模式。其中,云和边缘协同指在云中预训练较高精度的初始分析模型并将其分发缓存至边缘,各边缘通过云进行全局同步,实现分析精度可保障。边缘和边缘协同主要指在面对大量预训练分析模型数据缓存、大规模终端设备接入和大量分析任务的计算时,通过边缘间的存储、网络和计算协同,突破单个边缘服务器的资源和性能瓶颈,实现处理规模可扩展。边缘和端协同指在终端从边缘快速获取预训练分析模型的基础上,以终端为主体并协同边缘高效执行分析任务,实现处理分析效率可提升。
目前,李健与浪潮集团合作正在推广该技术,并建立起基于生物医学大数据云平台。项目已经实现了基因测序数据在云端的传输、分析和存储的关键技术等多项关键技术,完成了器官芯片、中国人群HLA、纳米抗体数据库等数据库构建,并部署到浪潮云平台。基于该项目的产业转化。2019年,李健成功入选江苏省科技厅双创人才“科技副总”。同年,他还与江苏浪潮信息科技有限公司签订横向合同,该项目进一步被江苏省科技厅立项为产学研合作项目,位列全省第一。
曲终余音在,未来尤可期。得益于东南大学厚重的产学研合作力量支撑和多年的经验积累,李健带领团队取得了多项创新和应用成果。但成绩属于过去,以李健教授为核心的整个团队并未停下脚步,大家怀着“积跬步以行千里”的愿景,期望能在祖国生命科学与健康医疗事业发展的雄关漫道上,做得更好,走得更远。
……