11月10日上午,中国科学院大学人工智能学院有幸邀请到了北京理工大学计算机学院教授袁野老师,在雁栖湖校区教一楼108教室为同学们带来科学前沿讲座——《神经符号数据库技术及应用》。讲座围绕神经符号数据库展开,以剖析神经符号数据库的关键技术问题为核心,深入探讨了神经符号数据库在处理各类复杂数据类型和模式下的应用潜力,揭示了其在数据密集型领域的广阔应用前景,并对神经符号数据库面临的技术挑战和解决思路进行了介绍。
人工智能目前已经由单媒体分析与文本推理发展为跨越语言、视觉、听觉等不同类型的媒体数据,但人工智能模型知识受预训练语料与模型能力限制,导致出现知识记忆有限、知识推理较弱、知识更新困难等问题。那么怎样解决这些问题呢?袁老师首先介绍了神经符号和神经符号数据库,并指出神经符号计算范式具有强可解释性和精确可调可控等优点,为解决上述问题提供了思路。
面对多方主体加速推进人工智能发展、AI时代的大数据体量更大类型更杂以及数据湖管理、视频数据分析更加广泛的时代背景,神经符号数据库愈发显得重要。那么神经符号数据库的作用是什么呢?袁老师讲到它可以联合AI模型和SQL指令来实现复杂数据分析操作。
神经符号数据库的架构层次可以分为表达层、计算层和存储层,对问题的解决思路可以从三个层次分别入手,即在表达层实现基于自然语言的模型调用;在计算层可以用CPU执行内核串行优化和结构化数据计算,用GPU执行并行计算和结构化数据计算;在存储层采用多粒度数据分割存储。
神经符号数据库可以分为神经符号关系数据库和神经符号图数据库,那么后者又是什么呢?袁老师首先向我们介绍了传统知识图谱和多模态知识图谱的区别和联系,然后提到了符号计算的不足,进而引出了神经符号图数据库的概念。神经符号图数据库由内容向量和结构向量组成,结合了神经网络和符号图数据库的特性,用于处理复杂的数据结构和关系。这种类型的数据库设计是为了解决传统图数据库在处理大规模数据和复杂查询时的困难,同时利用深度学习技术进行优化。最后袁老师又向我们介绍了神经符号图谱查询和图谱推荐的具体算法,加深了我们对神经符号图数据库知识的理解。
通过本次讲座,同学们了解了神经符号数据库的基本概念和针对现存问题用神经符号数据库进行解决的基本思路等知识,受益匪浅。
更多专家信息:
袁野,现为北京理工计算机学院教授、博士生导师。主持国家自然基金重点项目,科技部重点研发项目。曾获中国电子学会自然一等奖,教育部和辽宁省科技进步一等奖、全国优秀博士论文提名奖、中国计算机学会优秀博士论文奖。袁博士是中国计算机学会数据库专业委员会副主任、大数据专家委员会委员、中国计算机学会高级会员,IEEE、ACM高级会员。香港科技大学、香港中文大学、英国爱丁堡大学访问学者。主要研究方向为大数据管理与分析(包括图数据管理、区块链数据管理、众包数据管理、不确定数据管理、数据隐私保护等)。在SIGMOD、VLDB、ICDE、 VLDB Journal、IEEE Trans.TKDE、IEEE Trans.TPDS等重要学术会议和期刊上发表论文100余篇。