11月4日上午,中国科学院大学人工智能学院有幸邀请到了来自北京航空航天大学计算机学院的教授、国家杰青、大数据专委委员马帅老师,在雁栖湖校区教一楼009教室为同学们带来科学前沿讲座——《大数据近似计算》。
本次讲座聚焦于大数据领域的一个重要挑战性问题,即如何设计近似的计算方法,从而在大数据中快速准确地搜索有价值的信息。讲座一开始,马帅老师首先介绍了大数据近似计算的研究方向与机构设置,罗列出研究方向中遇到的三大问题——计算的有效性遇到障碍、能耗成为突出问题、学习效率和灵活性不高,引导同学们主动思考传统方法的劣势所在。
随后,讲座进一步具体深入研究方向面临的机遇与挑战。马帅老师指出,互联网改变人们的交流方式,而大数据的处理则能改变经济和社会的方式,当前大数据应用虽然存在计算数据量大、计算复杂度高、数据价值密度低的挑战,但是通过从无序数据到信息关联、从信息关联到知识图谱、关系网谱形成的转变,大数据近似计算将获得很大的机遇,从而高效处理大数据问题,摆脱找不到最优解或者最优解成本高的困境。
接着,马帅老师从对近几年社会生产生活影响最大的新冠肺炎疫情出发,介绍了疫情期间基于大数据的复工复产分析实例,同学们也是非常认真在思考。马教授从分析逻辑出发,分析了各个变量的实际意义,给出了复工率和复产率的计算公式,表明在该实例下找不到最优解,进一步引出了近似算法,具体阐述了“近似”这个词的含义,解释其包含了近似算法、大数据近似查询处理、近似计算等重要方面,并详细介绍了近似查询技术、数据近似技术的主要思想和挑战,以最短路问题为例,分析了这两个技术的应用。
最后,马帅老师围绕两个核心要素,算法和数据,介绍了大数据算法研究的历史进程。从70年代的算法初期研究到确定性多项式时间算法,从随机化算法再到近似算法,再到现如今深度学习与算法的融合,同学们深刻感受到技术的进步以及深度学习在大数据领域的兴起。马老师深入浅出的讲座介绍激发了在场同学的兴趣,在他的引导下,同学们对于大数据近似计算有了更深刻的认识。
更多专家信息:
马帅博士,北京航空航天大学计算机学院教授,国家杰青,获得北京大学(2004)和英国爱丁堡大学(2011)两个博士学位,爱丁堡大学博士后,并曾在美国贝尔实验室总部实习,在微软亚洲研究院访问;数据库专委常委、大数据专委委员,VLDB Journal、Knowl-edge and Information Systems、IEEE Transactions on Big Data编委等;获国际顶级数据库会议VLDB'2010唯一最佳论文奖、数据挖掘知名会议ICDM'2019候选最佳论文、2017年中国电子学会科技进步特等奖等。