2022年9月,计算机科学与技术学科在人工智能领域国际顶尖期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(IEEE TPAMI, 影响因子:24.314)在线刊发了题为《Generalization Performance of Pure Accuracy and Its Application in Selective Ensemble Learning》的研究论文。青年教师王婕婷为第一作者,钱宇华教授为通讯作者,青年教师李飞江与梁吉业教授、香港城市大学张青富教授为合作者。
本研究通过构建可消除随机一致性的一致性度量范式,导出纯准确度度量,通过理论和实验得出了其相对于准确度指标的三大优势:类别分布不敏感性、低偏差性和高辨识性。这些性质为基于纯准确度的可学习理论与方法提供了理论支撑。
本研究将进一步提出的随机一致性可学习理论用于集成学习类方法的重构,提出了优化纯准确度的选择性集成模型PASE,并通过分式规划和一维全局最优搜索方法求解模型,基准测试集和图像数据集表明,PASE比现有的基于准确度的选择性集成方法更有效。与现有可以优化纯准确度的方法相比,PASE能够更好地优化PA值。通过高维图像数据集,验证了PASE适用于提升弱分类器。
研究工作得到计算智能与中文信息处理教育部重点实验室、山西省机器视觉与数据挖掘工程研究中心、国家自然科学基金重点基金、国家重点研发计划、国家自然科学基金青年基金、山西省三晋学者人才计划的支持。