中科院自动化所博士生罗曜儒在AAAI上发表文章

人工智能学院
创建时间: 2022-01-10
3687

个人情况

罗曜儒，中国科学院自动化研究所2019级在读博士生，模式识别国家重点实验室，计算生物与机器智能团队。导师：杨戈教授。研究领域：图像语义分割。

AAAI发表文章链接：https://arxiv.org/abs/2103.11594

论文背景

深度神经网络（DNN）在计算机视觉领域的成功，离不开高质量的训练数据，尤其是对于基于监督学习的DNN而言，错误的标注信息会极大的影响模型最终的泛化性能。虽然目前有各式各样的机制把控数据集构建的质量，但即使是领域内被广泛使用的标准数据集，也依然无法完全杜绝噪声标签，例如ImageNet数据集存在约10万错误标签。因此研究DNN在噪声标签下的学习行为并提升模型对噪声标签的鲁棒性具有很强的现实意义。

然而对噪声标签的研究，目前大部分聚焦于图像分类而不是语义分割。迄今为止，我们对于DNN在噪声分割标签下的学习行为仍然知之甚少，例如精准的语义分割是否需要精准的像素标注？DNN由不同噪声标签训练后泛化能力如何？如何度量噪声标签中的语义信息？回答这些问题不仅能有效的增加对标签本质的理解，还能增强对DNN在噪声标签下学习行为的可解释性。

结合以上问题，本研究致力填补这一空白。在生物显微图像二类语义分割与自然场景图像多类语义分割任务中，深入分析多种DNN模型在不同噪声标签下的学习行为，并借鉴空间模式分析方法，利用空间分布函数对标签中的语义信息进行数学建模，从标签本质出发理解语义分割。

论文概要

本研究聚焦图像语义分割任务，探讨深度神经网络（DNN）在不同噪声标签下的分割性能。我们将标签分为四类，包括（1）干净标签：领域专家进行人工标注的金标准；（2）随机化干净标签：像素级随机翻转或采样干净标签；（3）扰动化干净标签：结构性噪声扰动干净标签；（4）随机标签：像素级完全随机化标签。我们在生物显微图像与自然场景图像进行语义分割实验。

我们发现，当训练标签中语义类别的结构信息被正确保留时，即使存在大量像素级错误标注（如以10%采样率或90%翻转率生成的随机化干净标签），DNN的分割性能并不会出现明显下降。当语义类别的结构信息被轻微扰动时（如通过腐蚀或膨胀等形态学操作合成的扰动化干净标签），DNN的分割性能则出现一致性下降。当语义类别的结构信息被完全破坏时（如随机标签），DNN出现过拟合。以上证明，DNN是从语义类别中的结构信息学习分割，而不仅仅是像素标签。我们将标签中隐藏的结构信息称为元结构。基于元结构，我们提出一种无监督二类语义分割模型，达到与监督学习类似的分割性能。同时我们在数学上将元结构定义为点集的空间分布函数，并在理论上和实验中证明该数学模型可以很好的解释DNN在不同噪声标签下的学习行为。

科研支撑

本研究依托于中国科学院自动化研究所以及中国科学院大学强大的科研平台，得到国家自然科学基金与中国科学院战略性先导科技专项支持，在计算生物与机器智能实验室全体老师与同学的帮助与支持下完成。导师杨戈教授在计算生物领域扎根多年，具有丰富的计算机与生物交叉领域的科研经验，对本研究提供了实质性帮助与指导性意见。计算生物与机器智能实验室对本研究提供了丰富的硬件设备与计算资源，其中包括1台桌面电脑，4台服务器，每台服务器包含4块NVIDIA RTX 2080Ti显卡。

AAAI会议介绍

AAAI的全称是人工智能促进协会（Association for the Advancement of Artificial Intelligence），它是人工智能领域的主要学术组织之一。该组织成立于1979年，原名“美国人工智能协会(American Association for Artificial Intelligence)”，这一协会在早期由计算机科学和人工智能的创始人 Allen Newell, Marvin Minsky 和John McCarthy 等人首创，并于2007年更名为“人工智能促进协会（AAAI）”。现在在全球有超过6000名会员，汇集了全球最顶尖的人工智能领域专家学者，一直是人工智能界的研究风向标，在学术界久负盛名。

AAAI是国际顶级学术会议——AAAI人工智能大会（AAAI Conference on Artificial Intelligence）的组织者，旨在推动智能思维与行为机制的科学理解及机器实现，并促进人工智能的科学研究和规范应用。同时，AAAI还旨在增加公众对人工智能的理解，改善人工智能从业者的教学和培训，并就当前人工智能发展和未来方向的重要性和潜力为研究计划者和资助者提供指导。AAAI主办的“AAAI人工智能会议”，被认为是人工智能领域的顶级会议之一。

文字/罗曜儒