信息的“洪流”可能很快就会超过硬盘的承载能力。

  大数据正像发动机一样赋能千行百业,随之而来的是数据体量的爆炸式增长。然而,当前用于存储数据的设备,比如用光、电、磁介质和闪存,使用寿命通常不到 20 年,并且还需要消耗大量能量来维护。

  尽管科学家们始终在探索以高密度和无能耗的方式来存储信息的新方法,比如 DNA或其他分子聚合物存储技术,但这些技术相对成本高、读写速度慢等瓶颈仍未突破。近日,几项关于存储技术的新进展给数据存储带来了一丝亮光。

  新的光学分子存储 

  近日,哈佛大学化学与化学生物系 George Whitesides 教授团队及其合作者,开发了一种全新,且原理简单的光学分子存储方法。他们使用荧光染料分子编码二进制信息,成功将各类文字、图像信息写入并读取出来,其读、写速度分别达到每秒128比特和 469 比特,甚至可以读写视频或其他信息。相关研究已在ACS Central Science上发表。

  光学分子存储技术不需要对分子内部的结构或序列进行复杂编码,且在理论上具有较高的存储密度、无需能耗维护。然而,长期以来读、写速度慢,读取次数有限等问题也成为这些分子系统的劣势。

  为解决此类问题,Whitesides 等人使用荧光分子将目标信息编码成二进制并存储,并使用荧光显微镜来读取信息。使用这种方法,他们成功在一块小至 7.2 平方毫米的基板上存储了约 14KB 的信息,空间信息密度达到每平方毫米271.5 字节。此外,通过重复读取信息 1000 次以上,研究团队发现荧光信号强度的损失较少(低于 20%),且每次都能成功读取。

  “Whitesides教授的存储方法原理简单,概念新颖,在信息存储方面具有一定的意义。”华中科技大学化学与化工学院教授吉晓帆告诉《中国科学报》。

  中国科学院大学人工智能学院教授、中国科学院自动化研究所模式识别国家重点实验室研究员杨戈同样认为,“这是一个创新的方法”。

  “它实际上是个基于化学荧光分子的存储技术。”杨戈对《中国科学报》说,“但它用喷墨打印来实现,存储密度、读取速度可能会受到影响。此外,通过荧光标记的方式,会面临荧光分子的发光衰减问题,从而可能限制读取次数。”

  按需开发存储材料 

  “信息存储手段多种多样,不同存储手段有不同的优点,可以应用于不同场景。”北京化工大学材料科学与工程学院教授郭金宝告诉《中国科学报》,“人们可以根据自己的需求,存储信息的内容、安全性要求选择存储手段,开发不同的存储材料。”

  近日,郭金宝团队在《先进功能材料》发表论文,使用具有可重写荧光图案和可重构3D形状的液晶弹性体材料来实现多重信息存储与加密。他们利用材料特性产生的两种信息存储方式,可以进一步拓展存储信息的数据量;另一方面,该体系在读取信息时需要两步不同的解密方式,使存储信息的安全性大大提高。

  “需要指出的是,我们这个工作为基础研究,旨在拓展液晶弹性体在信息存储方面的应用,距离实际应用还存在较大差距,仍需进一步探索。”郭金宝说。

  而华中科技大学化学与化工学院教授吉晓帆团队在线发表于《先进材料》的成果,则展示了利用AIE超分子水凝胶实现信息大量存储的可能。

  “AIE超分子水凝胶是以信息码技术为基础,结合AIE分子、超分子凝胶的优良性能,从而实现光、通信和网络技术融为一体的新型存储技术。”吉晓帆告诉《中国科学报》,“它与传统磁介质、光介质、DNA存储均不一样,AIE超分子水凝胶是一种有机介质,为信息码提供了优良的载体而实现了信息的大量存储。”

  因此,AIE超分子水凝胶可以存储大量的信息,或许不久的将来,信息码材料能够像硬盘一样存储无限多的信息。

  近年来,DNA存储技术领域也屡屡取得新进展,不少科学家认为,从地球生命诞生至今,DNA已经进化到可以以极高的密度存储大量信息,“理论上一个装满DNA的咖啡杯就可以存储世界上所有的数据”,作为存储介质,DNA稳定、存储密度高耗费能量少等特点让其广受追捧。

  中国科学院化学研究所研究员宋延林认为,尽管DNA存储技术相关研究已经有些年头了,但离实际应用还有不小距离,目前的技术路线并不清楚。

  “DNA存储在理论上有很多优势,但它还有很多关键技术难题需要解决。” 宋延林说,“不管传统的光、电、磁介质存储技术还是功能分子、DNA存储,一项能够实际应用的技术,除了存取密度、速度、使用寿命和安全性外,还要考虑其稳定性、方便性和低成本。”

  以市场机制加速产业化 

  “现在确实面临一个问题。”杨戈说,“我们生活在一个信息化的社会,对数据的需求越来越多,产生的数据量越来越大。比如腾讯、阿里、字节跳动等信息技术公司,在能源价格低廉的偏远省区建了很多数据中心,但能源消耗仍然是个大问题。而且理论上,现在的主流存储方式都有其物理上的限制,人们迫切需要寻找新的存储技术。”

  杨戈介绍说,DNA存储技术用构成遗传密码的4种核苷酸(A、T、G和C,即腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶)编码信息在DNA中。其基本原理是一次写入、多次读出,它是一种长期存储的技术,目前DNA存储技术虽然有很多不同的实现方式,但基本的技术路线是一致的。

  借助现代生命科学领域的成熟技术,比如合成和测序等,DNA存储技术得到快速发展。美国微软、因美纳公司(基因组学研究领域的技术与市场领导者)、希捷、西部数据等数据存储、生物技术等领域公司还成立了DNA存储技术联盟,共同推动该技术的发展。

  杨戈认为,数据存储技术有很多种,单DNA存储技术来说也有多种实现方式,将来谁做得比较好,可能就会闯出一条路来。美国的DNA存储技术联盟现在参与的公司和大学已经有三四十家,“从长远看,这有可能又会成为一项卡脖子技术”。

  “DNA作为数据存储材料具有存储量大,存储密度高,存储周期长等优点。”郭金宝说,“然而,该技术在当前面临的挑战还很大,如合成成本高,读取过程复杂等,并且其相关研究主要停留在实验室层面,距离真正的应用还有很长的路要走。”

  目前,我国在DNA存储上已经有了布局,中科院纳米中心、天津大学、南方科技大学等单位都有课题组在做相关研究。

  “我们在基础研究方面有不错的积累,在纳米技术方面也走在国际前列。”杨戈说,“但在实验室里做出一个原理性的东西,发几篇论文,跟最后真正能投入实际应用的距离还很远,其中有很多复杂的工程问题需要解决。下一步,最好是成立技术联盟,通过研究机构和企业的结合,加速技术产业化。”

  相关论文信息: 

  https://doi.org/10.1021/acscentsci.1c00728

  https://doi.org/10.1002/adma. 202105418

  https://doi.org/10.1002/adfm.202107145

   新闻链接http://news.sciencenet.cn/htmlnews/2021/10/467757.shtm

 
 

  云计算、大数据、人工智能等技术的快速发展和广泛应用,让这些领域成了“电老虎”。新思界产业研究中心的《2021年全球及中国数据中心加速器产业深度研究报告》预测,到2025年,仅全球数据中心消耗的电能将占全球总发电量的五分之一。

  近日,中科院脑智卓越中心研究员徐波、蒲慕明联合研究团队在线发表于《科学进展》的研究,利用介观尺度自组织反向传播机制(SBP),在更高效率、更灵活的类脑局部学习方面取得了重要进展。该技术能在机器学习过程中,降低计算能耗的同时又不损失精度,也许能让这些“电老虎”少吃多干。

  能耗的瓶颈 

  人工智能在某些领域表现出巨大的优势,比如在围棋方面,阿尔法狗(AlphaGo) 完胜人类世界围棋冠军;在电子游戏《星际争霸2》的竞技中,阿尔法星际(AlphaStar)以10:1的总比分“狂虐”职业玩家。

  近年来,随着数据量越来越大、算力越来越强、大规模预训练模型对能源的要求也越来越高。据伦敦大学学院教授David Attwell团队对单个神经元耗能的计算,大脑的能耗约16.6瓦,对于人体而言, 大脑只需要不到20瓦的功率就可以应对复杂思考任务。与之相比,战胜柯洁的阿尔法狗,耗电量相当于12760个人类大脑。

  “预训练模型的参数提高以后,人工智能的性能确实更强了,但能耗问题也不容忽视。”该论文第一作者、中国科学院自动化所副研究员张铁林对《中国科学报》说,“研究者普遍认为,人工智能的表现还应更好一些。比如,进行同样运算而消耗更少的能源。”

  模拟人类大脑运行过程是人工智能的一个重要途径,在人工智能研究领域,目前人工神经网络中被广泛使用的反向传播算法(BP)采用全局优化策略,这种端到端的学习方法性能卓越,但学习过程能量消耗大,且缺乏灵活性。

  “在精度不受影响的前提下,降低能耗是我们这项研究的目的之一。”徐波告诉《中国科学报》,“现在很多的算法、包括人工智能的大模型也远未达到人脑的参数量。大脑维持这么多神经元运算,其实是非常节能的。如果我们在算法设计之初,让机器能像人那样去学习,也许我们的模型就不必那么大,学习训练的时候也不会那么耗电。”

  向大脑学习 

  “我们想借用一些生物学领域取得的进展,弄清楚大脑是怎么在低能耗的情况下高效学习的。”张铁林说,“所以蒲慕明老师给徐波老师团队推荐了很多算法,并保持着非常深入的合作研究。”

  1997年,蒲慕明团队在《自然》杂志发表论文,揭示了海马体内神经元可以将长时程抑制(LTD)可塑性自组织地传播到三个方向,分别是突触前侧向传播、突触后侧向传播、反向传播,这个发现就是自组织反向传播神经可塑性机制(SBP)。

  进一步的研究证实,SBP现象具有普遍性,不仅覆盖更多的神经区域如视网膜-顶盖系统,还覆盖更多的可塑性类型,如长时程增强。该机制的发生归结于生物神经元内分子调制信号的天然逆向传递,被认为是可能导致生物神经网络高效反馈学习的关键。

  研究团队受到该机制的启发,对SBP的反向传播方向(第三个方向)单独构建数学模型,重点描述了神经元输出突触的可塑性可以反向传播到输入突触中,可塑性的发生可以通过时序依赖突触可塑性,也可以通过人工局部梯度调节。在标准三层脉冲神经网络(SNN)的学习过程中,SBP机制可以自组织地完成前一层网络权重的学习,且可以结合短时突触可塑性、膜电位平衡等,形成更强大的SNN组合学习方法。

  由于涉及前沿生物技术,有很多生物机制计算机验证起来非常困难。

  “蒲老师讲完这一机制,我们读完相关论文,刚开始觉得这个工作并不复杂。”张铁林说,“但真正应用到模型上时却困难重重、一筹莫展。”

  张铁林等人是搞计算机研究的,读生物领域的论文比较难,“很多时候并不完全懂”。而且大脑中有多个关联机制,要不要跟SBP结合?要怎么结合?神经元的突触往前传多少?传给谁?有没有什么倾向性?所有这些问题都没有答案, 感觉“有很多缺失的信息需要去补”。

  没有标准答案,研究人员只能先结合网络情况进行论证分析,再设置一个可优化的参数,用一些特殊的方法构建“能量函数”来约束一些变量,然后把这个机制放到脉冲网络里去验证。

  然而经过多次尝试,结果却并不理想。他们只好在回过头来重新认识“生物学规则”。随着学习的深入,蒲慕明也建议他们做一些小实验来模仿类似生物的小网络。慢慢地,这种机制就逐步明确起来了。

  “从科研的角度来讲,要先做减法,把它的重要性弄清楚、体现出来,后面再做加法,加更多的机制、变量和条件。”张铁林说,“目前我们只是在一些标准的简单模型上进行了验证。因为如果模型太复杂,会说不清楚SBP在其中到底贡献了什么。下一步我们会在更大规模的模型上进行验证。”

  研究团队针对性地提出一种统计训练过程中能量消耗的新方法。在图片分类、语音识别、动态手势识别等多类标准数据集上,SBP机制通过组合其它可塑性机制,实现了更低能耗和更高精度的SNN局部学习。在一些人工网络的学习中,SBP机制也可以大量的替换BP机制实现全局和局部交叉学习,在降低计算能耗同时却不损失精度。

  “自组织”的优势 

  “生物智能计算的本质,很可能就是灵活融合多类微观、介观等可塑性机制的自组织局部学习,结合遗传演化赋予的远程投射网络结构,实现高效的全局优化学习效果。”蒲慕明告诉《中国科学报》,“该工作可以进一步引导生物和人工网络的深度融合,最终实现能效比高、可解释性强、灵活度高的新一代人工智能模型。”

  目前,反向传播机制已经是一种优化的结果,作为一种标准模型,它基本上覆盖了脉冲和人工网络模型,效果也不错。

  “但其能耗和学习效率方面,还可以再优化一些,从各个尺度上再提升一下。”张铁林说,“我们在训练时,也采取混合式的训练方法,一部分采用BP(人工反向传播)的方法,一部分采取SBP(自组织反向传播)的方法。”

  研究人员认为,SBP是一类介观尺度的特殊生物可塑性机制,具有自平衡、自组织、可传播等特点,因此在神经网络学习中可以展示出较好的组合优化优势。

  “人工的反向传播算法靠整体目标函数去驱动,每次计算时既慢又耗能,特别是在网络比较大的时候,问题就更明显了。”张铁林说,“如果一个算法是自组织的,它就可以像大脑一样无监督学习,可以进行局部运算,就比较节能了。”

  目前,该团队已经在一些小型、浅层的人工网络上做过测试。结果表明,最好的时候,可以在保持原来性能的基础上,把能耗降到原来的21%左右。

  “比如,原来需要100块GPU去训练,现在只需要21块就够了。”张铁林说,“这在进行大模型训练的时候就比较重要了。”

  SBP只是一个开始,它对进一步深入探索类脑局部计算具有很大的启示。

  “将来还有很多和脑智卓越中心生物科学团队的交叉合作研究。”徐波说,“相信人工智能领域未来还有很大的进步空间,这些受生物启发的学习法则可以帮助人们更好地填补这些空白。”

  相关论文信息:https://www.science.org/doi/10.1126/sciadv.abh0146

 

  日前,联合国教科文组织(UNESCO)正式发布《人工智能伦理建议书》(以下简称《建议书》),这是关于人工智能伦理的首份全球性规范文书。 

  作为UNESCO人工智能伦理特设专家组成员,中科院自动化研究所中英人工智能伦理与治理研究中心主任、国家新一代人工智能治理专委会委员曾毅参与了《建议书》的起草与修改。 

  曾毅在接受《中国科学报》采访时表示,“《建议书》是目前全世界在政府层面达成的最广泛的共识,是全球人工智能发展的共同纲领,将为进一步形成人工智能伦理有关的国际标准、国际法等提供强有力的参考。” 

  走向全球共识 

  隐私、安全、公平、对人类的潜在风险……人工智能在飞速发展的同时,也给社会带来了根本性的挑战。 

  虽然不同国家、政府间组织、科研和产业界已经发布了不少关于人工智能发展、伦理与治理原则,但这些原则并没有形成统一观念,人工智能伦理亟待达成全球共识。 

  UNESCO总干事阿祖莱在《建议书》发布会上表示,“我们呼吁所有的成员国立即行动起来开始实施这份建议书。民众、企业等全社会都应当行动起来。这项工作已经开始了,20余个国家已经表态当《建议书》被采纳后,将受《建议书》的启发开启评估。UNESCO将推进务实的评估落地工作。” 

  此次发布的《建议书》的核心是价值观、伦理原则及相关的政策建议、监测与评估。在价值观方面,《建议书》从尊重、保护和促进人权和基本自由以及人的尊严,环境和生态系统蓬勃发展,确保多样性和包容性,以及在和平、公正与互联的社会中共生等4部分进行了阐述。 

  曾毅认为,《建议书》囊括了针对现代人工智能(人工智能作为信息处理工具和赋能技术)伦理考虑的最重要方面。 

  例如,虽然大规模数据处理及算力的提升促进了现代人工智能的发展,但也带来了潜在的环境问题。 

  为此,《建议书》在价值观“环境和生态系统蓬勃发展”部分指出,应减少人工智能系统对环境的影响,包括但不限于碳足迹,以确保将气候变化和环境风险因素降到最低,防止会加剧环境恶化和生态系统退化的对自然资源的不可持续开采、使用和转化。 

  此外,《建议书》还考虑了不适用人工智能的场景,并在“相称性与不损害”的原则部分提出,人工智能技术本身并不一定能确保人类、环境和生态系统蓬勃发展。在有可能对人类、人权和基本自由、个别社区和整个社会,或者对环境和生态系统造成损害时,应确保落实风险评估程序并采取措施,以防止发生此类损害。 

  不仅如此,《建议书》在此部分还明确提出人类应当确保在关键领域进行有意义的控制,并确保人类的决策权,并对高风险领域进行了警示。 

  “和谐共生”价值观被部分采纳 

  在曾毅看来,《建议书》在一定程度体现了全球不同文化的包容性思想。其中“在和平、公正与互联的社会中共生”的价值观充分体现了来自亚洲和非洲等国专家的共同愿景与贡献。 

  在UNESCO特设专家组撰写草案期间,鉴于部分国家和政府间组织的人工智能原则强调自身的价值观和利益优先,曾毅提议纳入“和谐共生”的价值观。 

  在曾毅看来,“和谐共生”的价值观,是倡导人类社会与人工智能技术和谐发展,人工智能赋能人类、社会、生态之间的和谐发展,号召各个国家通过人工智能促进人类命运共同体的构建。 

  他告诉记者,“和谐共生”的思想在由国家新一代人工智能治理专委会制定的《新一代人工智能治理原则》以及《新一代人工智能伦理规范》中以“和谐友好”等形式和内容体现相似表述,是我国发展人工智能技术,处理技术与社会关系的总纲。 

  虽然“和谐共生”的提议被来自亚洲和非洲等多国的特设专家组专家及部分政府间磋商代表所赞同,但在随后的环节,由于部分国家代表未能接受“和谐”“人类命运共同体”的提法,随后改为“在和平、公正与互联的社会中共生”,“和谐共生”的核心要义得以部分保留和采纳。 

  例如,《建议书》在“在和平、公正与互联的社会中共生”的部分强调“每个人都属于一个更大的整体,当这个整体中的组成部分都能够繁荣兴旺时,整体才会蒸蒸日上”等内容。 

  曾毅对此感到有些遗憾,“‘和平共生’与‘和谐共生’的意义并不完全相同。‘和谐共生’在和而不同、和舟共济的基础上还有发展的意义,倡导优化共生,而‘和平共生’这种表述难以表达求同存异,谋求发展的意义。” 

  但他也表示,虽然《建议书》没有直接采纳“和谐共生”的表述,但相关思想得以保留,被各国专家认为是《建议书》中融入非西方价值观的重要体现。 

  “‘和谐共生’的理念已经作为我国人工智能伦理与治理原则的特色,未来必然会成为中国对世界的贡献。”曾毅表示。 

  可持续发展的共同愿景 

  可持续发展目标是联合国各机构力推的全球发展共同愿景,我国发布的《新一代人工智能治理原则》以及《新一代人工智能伦理规范》都将可持续发展作为新一代人工智能的总体愿景和赋能全球人工智能发展的重要途径。然而很多国家在人工智能发展和伦理原则中并没有明确提出可持续性。 

  因此,在《建议书》原则部分的撰写阶段,曾毅提出,虽然可持续的理念隐含在文本中的若干方面,但作为全球共同愿景,发展人工智能必须赋能可持续发展目标的实现,同时还要密切关注人工智能应用于可持续发展相关目标领域时,是否带来阻碍该目标实现的风险,寻求发展与治理的协同。“‘可持续’应当作为原则明确列入《建议书》。” 

  最终,该意见被《建议书》不同阶段广泛接受,并在政策部分,特别针对环境和生态系统领域如何通过人工智能赋能实现可持续性给出了具体建议。 

  实际上,除了参与起草和修改《建议书》,曾毅还在UNESCO组织的区域性专家咨询会上代表UNESCO特设专家组向亚太地区各国政府专家代表宣讲了《建议书》草案,并作为政府间专家磋商的中方专家代表参加磋商。 

  曾毅告诉记者,起草和宣讲《建议书》时,他从未感到紧张,因为在那个阶段,他的角色更多的是贡献学术观点的独立的学者。但在政府间代表磋商阶段,特别是被称为“成员国中国代表”时,他倍感责任重大。 

  目前,UNESCO正在依据《建议书》建立伦理评估工具和针对国家人工智能伦理完备指数评估的辅助系统,以敦促和帮助各国落实伦理规范。 

  在曾毅看来,人工智能的国际协作是通过技术赋能助力实现人类命运共同体,而人工智能伦理与治理的国际交流与协作是确保人工智能国际合作能够达成共识,并持续推进的基石。 

  “因此,十分有必要推进形成由类似于UNESCO这样的政府间机构、各国政府、学术界、产业、公众紧密交互的多利益相关方人工智能治理体系,通过深度协同扩大共识、避免误解、减小分歧,确保人工智能的全球发展及其治理最终促进人类和生态的整体协同发展。”曾毅表示。 

  新闻链接:https://news.sciencenet.cn//htmlnews/2021/12/470064.shtm?id=470064