科研动态 - 人工智能学院

　　信息的“洪流”可能很快就会超过硬盘的承载能力。

　　大数据正像发动机一样赋能千行百业，随之而来的是数据体量的爆炸式增长。然而，当前用于存储数据的设备，比如用光、电、磁介质和闪存，使用寿命通常不到 20 年，并且还需要消耗大量能量来维护。

　　尽管科学家们始终在探索以高密度和无能耗的方式来存储信息的新方法，比如 DNA或其他分子聚合物存储技术，但这些技术相对成本高、读写速度慢等瓶颈仍未突破。近日，几项关于存储技术的新进展给数据存储带来了一丝亮光。

　　新的光学分子存储

　　近日，哈佛大学化学与化学生物系 George Whitesides 教授团队及其合作者，开发了一种全新，且原理简单的光学分子存储方法。他们使用荧光染料分子编码二进制信息，成功将各类文字、图像信息写入并读取出来，其读、写速度分别达到每秒128比特和 469 比特，甚至可以读写视频或其他信息。相关研究已在ACS Central Science上发表。

　　光学分子存储技术不需要对分子内部的结构或序列进行复杂编码，且在理论上具有较高的存储密度、无需能耗维护。然而，长期以来读、写速度慢，读取次数有限等问题也成为这些分子系统的劣势。

　　为解决此类问题，Whitesides 等人使用荧光分子将目标信息编码成二进制并存储，并使用荧光显微镜来读取信息。使用这种方法，他们成功在一块小至 7.2 平方毫米的基板上存储了约 14KB 的信息，空间信息密度达到每平方毫米271.5 字节。此外，通过重复读取信息 1000 次以上，研究团队发现荧光信号强度的损失较少（低于 20%），且每次都能成功读取。

　　“Whitesides教授的存储方法原理简单，概念新颖，在信息存储方面具有一定的意义。”华中科技大学化学与化工学院教授吉晓帆告诉《中国科学报》。

　　中国科学院大学人工智能学院教授、中国科学院自动化研究所模式识别国家重点实验室研究员杨戈同样认为，“这是一个创新的方法”。

　　“它实际上是个基于化学荧光分子的存储技术。”杨戈对《中国科学报》说，“但它用喷墨打印来实现，存储密度、读取速度可能会受到影响。此外，通过荧光标记的方式，会面临荧光分子的发光衰减问题，从而可能限制读取次数。”

　　按需开发存储材料

　　“信息存储手段多种多样，不同存储手段有不同的优点，可以应用于不同场景。”北京化工大学材料科学与工程学院教授郭金宝告诉《中国科学报》，“人们可以根据自己的需求，存储信息的内容、安全性要求选择存储手段，开发不同的存储材料。”

　　近日，郭金宝团队在《先进功能材料》发表论文，使用具有可重写荧光图案和可重构3D形状的液晶弹性体材料来实现多重信息存储与加密。他们利用材料特性产生的两种信息存储方式，可以进一步拓展存储信息的数据量；另一方面，该体系在读取信息时需要两步不同的解密方式，使存储信息的安全性大大提高。

　　“需要指出的是，我们这个工作为基础研究，旨在拓展液晶弹性体在信息存储方面的应用，距离实际应用还存在较大差距，仍需进一步探索。”郭金宝说。

　　而华中科技大学化学与化工学院教授吉晓帆团队在线发表于《先进材料》的成果，则展示了利用AIE超分子水凝胶实现信息大量存储的可能。

　　“AIE超分子水凝胶是以信息码技术为基础，结合AIE分子、超分子凝胶的优良性能，从而实现光、通信和网络技术融为一体的新型存储技术。”吉晓帆告诉《中国科学报》，“它与传统磁介质、光介质、DNA存储均不一样，AIE超分子水凝胶是一种有机介质，为信息码提供了优良的载体而实现了信息的大量存储。”

　　因此，AIE超分子水凝胶可以存储大量的信息，或许不久的将来，信息码材料能够像硬盘一样存储无限多的信息。

　　近年来，DNA存储技术领域也屡屡取得新进展，不少科学家认为，从地球生命诞生至今，DNA已经进化到可以以极高的密度存储大量信息，“理论上一个装满DNA的咖啡杯就可以存储世界上所有的数据”，作为存储介质，DNA稳定、存储密度高耗费能量少等特点让其广受追捧。

　　中国科学院化学研究所研究员宋延林认为，尽管DNA存储技术相关研究已经有些年头了，但离实际应用还有不小距离，目前的技术路线并不清楚。

　　“DNA存储在理论上有很多优势，但它还有很多关键技术难题需要解决。” 宋延林说，“不管传统的光、电、磁介质存储技术还是功能分子、DNA存储，一项能够实际应用的技术，除了存取密度、速度、使用寿命和安全性外，还要考虑其稳定性、方便性和低成本。”

　　以市场机制加速产业化

　　“现在确实面临一个问题。”杨戈说，“我们生活在一个信息化的社会，对数据的需求越来越多，产生的数据量越来越大。比如腾讯、阿里、字节跳动等信息技术公司，在能源价格低廉的偏远省区建了很多数据中心，但能源消耗仍然是个大问题。而且理论上，现在的主流存储方式都有其物理上的限制，人们迫切需要寻找新的存储技术。”

　　杨戈介绍说，DNA存储技术用构成遗传密码的4种核苷酸（A、T、G和C，即腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶）编码信息在DNA中。其基本原理是一次写入、多次读出，它是一种长期存储的技术，目前DNA存储技术虽然有很多不同的实现方式，但基本的技术路线是一致的。

　　借助现代生命科学领域的成熟技术，比如合成和测序等，DNA存储技术得到快速发展。美国微软、因美纳公司（基因组学研究领域的技术与市场领导者）、希捷、西部数据等数据存储、生物技术等领域公司还成立了DNA存储技术联盟，共同推动该技术的发展。

　　杨戈认为，数据存储技术有很多种，单DNA存储技术来说也有多种实现方式，将来谁做得比较好，可能就会闯出一条路来。美国的DNA存储技术联盟现在参与的公司和大学已经有三四十家，“从长远看，这有可能又会成为一项卡脖子技术”。

　　“DNA作为数据存储材料具有存储量大，存储密度高，存储周期长等优点。”郭金宝说，“然而，该技术在当前面临的挑战还很大，如合成成本高，读取过程复杂等，并且其相关研究主要停留在实验室层面，距离真正的应用还有很长的路要走。”

　　目前，我国在DNA存储上已经有了布局，中科院纳米中心、天津大学、南方科技大学等单位都有课题组在做相关研究。

　　“我们在基础研究方面有不错的积累，在纳米技术方面也走在国际前列。”杨戈说，“但在实验室里做出一个原理性的东西，发几篇论文，跟最后真正能投入实际应用的距离还很远，其中有很多复杂的工程问题需要解决。下一步，最好是成立技术联盟，通过研究机构和企业的结合，加速技术产业化。”

　　https://doi.org/10.1002/adma. 202105418

　　https://doi.org/10.1002/adfm.202107145

新闻链接：http://news.sciencenet.cn/htmlnews/2021/10/467757.shtm

中国科学院大学  人工智能学院

【中国科学报】数据存储呼唤新技术

【中国科学报】“自组织”让“电老虎”少吃多干

【中国科学报】人工智能伦理迈向全球共识新征程

中国科学院大学 人工智能学院

【中国科学报】数据存储呼唤新技术

【中国科学报】“自组织”让“电老虎”少吃多干

【中国科学报】人工智能伦理迈向全球共识新征程

中国科学院大学人工智能学院