我们使用最初来自OpenML的表格数据集,这些数据集被编译成HuggingFace上Inria-Soda团队的一组基准数据集。我们在28,855个训练样本上进行训练,并在剩余的9,619个样本上进行测试。所有MLP都使用批量大小为64、64和0.0005进行训练,我们研究了每层有100个神经元的3层结构。我们在此定义了我们工作中使用的六个主要指标。我们使用最初来自OpenML的表格数据集,这些数据集被编译成HuggingFace上Inria-Soda团队的一组基准数据集。我们在28,855个训练样本上进行训练,并在剩余的9,619个样本上进行测试。所有MLP都使用批量大小为64、64和0.0005进行训练,我们研究了每层有100个神经元的3层结构。我们在此定义了我们工作中使用的六个主要指标。

极客的机器学习实验指南

摘要和1. 引言

1.1 事后解释

1.2 分歧问题

1.3 鼓励解释共识

  1. 相关工作

  2. Pear: 事后解释器一致性正则化器

  3. 共识训练的有效性

    4.1 一致性指标

    4.2 改进共识指标

    [4.3 一致性的代价是什么?]()

    4.4 解释是否仍然有价值?

    4.5 共识和线性

    4.6 两个损失项

  4. 讨论

    5.1 未来工作

    5.2 结论、致谢和参考文献

附录

A 附录

A.1 数据集

在我们的实验中,我们使用了最初来自OpenML的表格数据集,这些数据集由Inria-Soda团队编译成一组基准数据集并发布在HuggingFace上[11]。我们提供每个数据集的一些详细信息:

\ 银行营销 这是一个二元分类数据集,具有六个输入特征,类别大致平衡。我们在7,933个训练样本上进行训练,并在剩余的2,645个样本上进行测试。

\ 加州房价 这是一个二元分类数据集,具有七个输入特征,类别大致平衡。我们在15,475个训练样本上进行训练,并在剩余的5,159个样本上进行测试。

\ 电力 这是一个二元分类数据集,具有七个输入特征,类别大致平衡。我们在28,855个训练样本上进行训练,并在剩余的9,619个样本上进行测试。

A.2 超参数

我们的许多超参数在所有实验中都是恒定的。例如,所有MLP都使用64的批量大小和0.0005的初始学习率进行训练。此外,我们研究的所有MLP都有3个隐藏层,每层100个神经元。我们始终使用AdamW优化器[19]。训练轮数因情况而异。对于所有三个数据集,当𝜆∈{0.0, 0.25}时,我们训练30轮,否则训练50轮。在训练线性模型时,我们使用10轮训练和0.1的初始学习率。

A.3 分歧指标

我们在此定义我们工作中使用的六个一致性指标。

\ 前四个指标取决于每个解释中最重要的前k个特征。让𝑡𝑜𝑝_𝑓𝑒𝑎𝑡𝑢𝑟𝑒𝑠(𝐸, 𝑘)表示解释𝐸中最重要的前k个特征,让𝑟𝑎𝑛𝑘(𝐸, 𝑠)表示特征𝑠在解释𝐸中的重要性排名,让𝑠𝑖𝑔𝑛(𝐸, 𝑠)表示特征𝑠在解释𝐸中重要性分数的符号(正、负或零)。

\

\ 接下来的两个一致性指标取决于每个解释中的所有特征,而不仅仅是前k个。让𝑅是一个函数,用于计算解释中按重要性排序的特征排名。

\

\ (注:Krishna等人[15]在他们的论文中指出,𝐹应该是由最终用户指定的一组特征,但在我们的实验中,我们使用此指标时包含所有特征)。

A.4 无用特征实验结果

当我们为第4.4节的实验添加随机特征时,我们将特征数量翻倍。我们这样做是为了检查我们的共识损失是否会通过比自然训练的模型更频繁地将不相关特征放在前K位而损害解释质量。在表1中,我们报告了每个解释器将随机特征之一包含在前5个最重要特征中的百分比。我们观察到,总体而言,我们没有看到在𝜆=0.0(没有我们的共识损失的基准MLP)和𝜆=0.5(使用我们的共识损失训练的MLP)之间这些百分比的系统性增加

\ 表1:无用特征获得前5名排名的频率,以百分比计。

A.5 更多分歧矩阵

图9:本文考虑的所有指标在银行营销数据上的分歧矩阵。

\ 图10:本文考虑的所有指标在加州房价数据上的分歧矩阵。

\ 图11:本文考虑的所有指标在电力数据上的分歧矩阵。

A.6 扩展结果

表2:我们训练的模型的平均测试准确率。该表按数据集、模型、损失中的超参数和权重衰减系数(WD)组织。平均值是通过多次试验得出的,我们报告平均值±一个标准误差。

A.7 额外图表

图12:使用不同lambda值训练的MLP在银行营销数据集中随机构建的10个三点平面上的logit曲面。

\ 图13:使用不同lambda值训练的MLP在加州房价数据集中随机构建的10个三点平面上的logit曲面。

\ 图14:使用不同lambda值训练的MLP在电力数据集中随机构建的10个三点平面上的logit曲面。

\ 图15:所有数据集和指标的额外权衡曲线图。

\

:::info 作者:

(1) Avi Schwarzschild,马里兰大学帕克分校,马里兰州,美国,以及在Arthur工作期间完成的工作(avi1umd.edu);

(2) Max Cembalest,Arthur,纽约市,纽约州,美国;

(3) Karthik Rao,Arthur,纽约市,纽约州,美国;

(4) Keegan Hines,Arthur,纽约市,纽约州,美国;

(5) John Dickerson†,Arthur,纽约市,纽约州,美国([email protected])。

:::


:::info 本论文可在arxiv上获取,采用CC BY 4.0 DEED许可证。

:::

\

市场机遇
SIX 图标
SIX实时价格 (SIX)
$0.01098
$0.01098$0.01098
+0.09%
USD
SIX (SIX) 实时价格图表
免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

您可能也会喜欢

Offchain Labs Membeli Token ARB Tambahan ketika Arbitrum Melepasi TVL $20 Bilion

Offchain Labs Membeli Token ARB Tambahan ketika Arbitrum Melepasi TVL $20 Bilion

Offchain Labs, syarikat pembangunan di sebalik penyelesaian penskalaan Layer 2 Arbitrum, telah membeli token ARB tambahan di bawah pelan belian balik token yang telah diluluskan sebelum ini, bertepatan dengan Arbitrum melepasi $20 bilion dalam jumlah nilai terkunci (TVL) dan mengukuhkan komitmen syarikat terhadap pertumbuhan ekosistem ketika persaingan semakin sengit dalam kalangan rangkaian Layer 2 Ethereum untuk bahagian pasaran, aktiviti pembangun, dan kecairan.
分享
MEXC NEWS2025/12/25 14:21
Ondo Finance Akan Melancarkan Saham dan ETF AS Bertokenisasi di Solana pada Awal 2026

Ondo Finance Akan Melancarkan Saham dan ETF AS Bertokenisasi di Solana pada Awal 2026

Ondo Finance merancang untuk melancarkan saham dan dana dagangan bursa AS yang ditokenkan pada blockchain Solana pada awal 2026, menandakan pengembangan ketara platform tokenisasi aset dunia sebenar (RWA) syarikat tersebut melampaui fokus semasa pada bon Perbendaharaan dan dana pasaran wang ke dalam pasaran ekuiti dengan struktur bersandarkan kustodian yang membolehkan pemindahan dan dagangan dalam rantaian sepanjang masa.
分享
MEXC NEWS2025/12/25 14:19
Pilihan Bitcoin Bernilai $23.7 Bilion dan 446,000 Kontrak IBIT Akan Tamat Tempoh pada Hari Jumaat

Pilihan Bitcoin Bernilai $23.7 Bilion dan 446,000 Kontrak IBIT Akan Tamat Tempoh pada Hari Jumaat

大约300,000份价值237亿美元的Bitcoin期权合约和446,000份iShares Bitcoin Trust (IBIT)期权合约预定于本周五,即2025年12月27日到期,这可能会导致显著的价格波动,因为交易员平仓、对冲风险敞口,以及做市商调整库存,这是加密货币市场历史上最大规模的季度衍生品到期之一,可能会影响Bitcoin在年底至2026年初的价格走势。
分享
MEXC NEWS2025/12/25 14:31