夯实材料大数据库,以新材料定制推动材料强国
- 来源:中国高新科技 smarty:if $article.tag?>
- 关键字:大数据,材料,蛋白质 smarty:/if?>
- 发布时间:2021-05-31 19:22
2019年6月,一则科技新闻在业内引起轰动,中国科学技术大学微尺度物质科学国家研究中心的研究团队,成功地通过人工智能机器学习中的神经网络技术,模拟了蛋白质肽键结构与性质之间的构效关系,将计算量一下降低了上万倍,相关成果发表在《美国科学院院报》上。这是人工智能技术首次用于理论计算预测蛋白质光谱的研究,从而确立了机器学习模拟蛋白质肽键骨架紫外吸收光谱的可行性和优势,可以更加轻松地解读蛋白质的“光学指纹”。
此刻,该论文的共同第一作者李鑫,就坐在记者面前,与记者兴致勃勃地聊起他的材料之梦。
李鑫博士,毕业于瑞典皇家工学院,美国加州伯克利大学劳伦斯国家实验室访问学者,中国科学技术大学微尺度物质科学国家研究中心副研究员、材料基因课题组副组长,主持及参与多项国家自然科学基金项目。研究领域为功能材料理论研究,涵盖新能源、新材料等方向;应用第一性原理方法调控材料的微观与宏观物理化学性质。
其实,李鑫还有另外一个身份,就是合肥机数科技有限公司(以下简称“机数科技”)的副总经理,是材料大数据库这一纽带,将李鑫的材料事业,与机数科技的快速发展,紧密地联系起来。
顺势而生,数据驱动材料研发
机数科技成立于2017年6月,是一家位于合肥市的从事材料数据研发及应用的创新型企业。核心团队人员包括入选国家“千人计划”的世界知名材料科学家、入选国家青年“千人计划”的知名教授博导、国家科技部重大基础研究计划的首席科学家等。目前,以数据驱动的材料研发模式已逐渐成为主流,李鑫和机数科技的管理团队,以“用信息科技引领时代发展”为愿景,汇聚了国内外一流材料科学家,在材料模拟、数据库建设、检索平台前端、大数据分析、人工智能等方面获取了丰富的实践经验,率先建立了材料基因创新研究平台,开发了第一个物理化学的知识图谱,打造了系列材料数据库。作为数据驱动新材料开发的领航者,打破了旷日已久的材料研发试错模式,为企业和科研院所提供新材料定制、材料大数据检索等系列产品服务。
我国作为全球最大的新兴经济体,新材料产业正处于强劲发展阶段,预计到2020年,新材料总产值将超过6万亿元。面对如此明朗的前景,材料的研发和应用却存在着明显的数据稀缺性,使用国外数据需要支付大量的服务费,以中国科学技术大学图书馆的反馈数据为例,每年订阅Springer Materials材料服务费约100万元。
在此客观背景下,李鑫强烈地意识到,数据作为材料更新和创新方面的重要性,为此,他提出并建立了材料基因创新研究平台和拥有自主知识产权的材料科学数据库平台,包含9000万条分子以及晶体数据、90万余条含磷晶体数据、600万条化学反应数据、1万余条热点催化材料、20万半导体性能参数等的材料数据库,目前数据的存储量已达5TB。数据实用价值高,为企业节约了时间和成本,提高了研发效率。
目前而言,国内尚没有同一级别的竞争对手,机数科技的产品呈现一枝独秀的局面,其产品特点具有数据稀缺性、数据量大且全面、数据实用价值高等优点,并且经过一系列实用案例的市场验证,已经为企业和科研用户获取了丰厚的回报。而李鑫计划在两年内将材料数据达到50TB以上,建成全球最大的材料数据库平台。
新材料定制,打造材料界的工业4.0
据资料统计,2017年中国新材料年产值2.6万亿,材料设计领域估值千亿以上,在轻质高强合金设计、生物医学材料、微电子与半导体材料、环境友好型高稳定性太阳能电池材料设计、高分子材料和磷矿选矿材料设计与研制等方面,还存在着广阔的开发前景。
对此,李鑫设想并建立了一个强大的新材料工场,以材料大数据工场为纽带,集材料基因研发单位、材料制备科研单位和材料生产企业三方资源为一体,形成综合性的新型材料定制系统,可以提供多种组合方案。包括针对具体应用的分子与固体材料设计、针对特征性能参数优化的材料基因数据服务、实用器件性能仿真。依据材料所需要的性质,在数据库里筛选出目标候选材料的基因信息,结合材料需求制定配方和合成方案。
基于目前国内的行业状况,李鑫计划在未来的两年时间内,在微电子、催化、合金、太阳能、塑料、采矿等新材料定制服务领域占据最大市场份额。
服务客户,实现社会经济效益双丰收
尽管机数科技成立时间不长,但管理团队已经与多家公司成功合作,与某飞机集团合作的项目,能够加快研发进度约5个月,节省直接成本4320余万元,积累产生100,000种各类合金演化结构数据。与振华集团开发的《太阳能电池纳米银层状电阻设计》,成功优化了银粉的生产工艺,新增营收2700万元,利税670万元。与瓮福集团合作的《定制浮选药剂的数据服务和材料表界面分子吸附数据》,成功优化磷矿生产工艺与药剂设计,提升生产药剂的效率与环保兼容性,节约研发与生产成本950万余元。
2018年12月,美国因政客恶斗,陷入了史上最长政府关门期,美国国家标准与技术研究院(NIST)也随之停摆。在此期间,机数科技管理团队及时调整资源,快速跟上,为国内用户提供了数据服务,在业内引发了广泛的影响。
在李鑫心中,一直有一个梦想,就是将我国建设成为“材料强国”,改变目前被动挨打的局面。为此,李鑫以机数科技为实施阵地,经过不断研发积累,形成了通往数据驱动材料创新模式的全流程产业化能力。在国家的战略方向引导下,李鑫会以机数科技为纽带,以材料大数据库为基石,以新材料定制为驱动,以服务产业应用为己任,为推动我国从“材料大国”向“材料强国”的转变而砥砺前行,奋发不已。
