|
|
fcs 文章精要:南京大学叶翰嘉副教授团队——从维度角度重新审视多维分类问题 |
|
论文标题:
期刊:
作者:yi shi1, hanjia ye, dongliang man, xiaoxu han, dechuan zhan, yuan jiang
发表时间:15 jan 2025
doi:
微信链接:
引用格式:
yi shi, hanjia ye, dongliang man, xiaoxu han, dechuan zhan, yuan jiang. revisiting multi-dimensional classification from a dimension-wise perspective. front. comput. sci., 2025, 19(1): 191304
阅读原文:
问题概述
虽然类别不平衡问题在多分类范式中得到了广泛的研究,但由于不平衡偏移现象,其在多维度分类(mdc)背景下的研究受到了限制。当样本属于一个标签维度(ld) 中的次要类而属于另一个 ld 中的主要类时,样本作为次要类或主要类实例的分类变得不明确。以前的 mdc 方法主要强调实例方面的标准,忽略了维度方面的预测能力,即跨 ld 的平均分类性能。我们强调了维度指标在现实 mdc 应用中的重要性,并引入了两个这样的指标。此外,我们观察每个 ld 内的不平衡类别分布,并提出一种新颖的不平衡感知融合模型(imam)来解决 mdc 问题。
图 1. 我们展示了从一个 ld 到另一个 ld 的不平衡转移。图中计算 zappos 数据集上两个 ld 上的实例数量。图中彩色块标注的数值表示对数后的值转型。当 ld 更改时,许多主要类实例会变成次要类实例。换句话说,实例的主要/次要类属性很难跨 ld 保留。
技术步骤
1. 我们首先将任务分解为多个多类分类问题,为每个 ld 分别创建不平衡感知深度模型。这种简单的方法在 ld 上表现良好,并且不会牺牲实例标准的性能。
2. 随后,我们采用 ld-wise 模型作为多个教师,并将他们跨所有 ld 的知识转移到统一的学生模型。
图 2. 我们提出的 imam 方法的图示,该图展示了基于具有两个 ld 的 mdc 问题。在分解步骤 (a) 中,我们为每个 ld 构建不平衡感知深度模型。在融合步骤(b)中,我们使用前一步中的模型作为教师,并将他们的知识融合到一个学生模型中。特征(绿色)和分类器(红色)蒸馏都有助于匹配模型之间的知识。下标“t”表示教师部分。“ce”表示交叉熵。
实验结果
结果表明,所提出的 imam 显著优于其他方法。
表 1. 四种传统 mdc 方法、四种深度 mdc 方法以及我们的 imam 在四个真实数据集上的性能。我们计算了实例和标签方面的四个评估指标。
文章推荐
frontiers of computer science
frontiers of computer science (fcs)是由教育部主管、高等教育出版社和北京航空航天大学共同主办、springernature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 ae 团队由国内外知名学者及优秀青年学者组成。本刊被 sci、ei、dblp、inspec、scopus 和中国科学引文数据库(cscd)核心库等收录,为 ccf 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;入选“中国科技期刊卓越行动计划项目”。
《前沿》系列英文学术期刊
由教育部主管、高等教育出版社主办的《前沿》(frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被sci收录,其他也被a&hci、ei、medline或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。
中国学术前沿期刊网
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负米乐app官网下载的版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。