Can We Really Trust Explanations? Evaluating the Stability of Feature Attribution Explanation Methods via Adversarial Attack

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:CCL (21. : 2022 : Nanchang) Chinese computational linguistics
1. Verfasser: Yang, Zhao (VerfasserIn)
Weitere Verfasser: Zhang, Yuanzhe (VerfasserIn), Jiang, Zhongtao (VerfasserIn), Ju, Yiming (VerfasserIn), Zhao, Jun (VerfasserIn), Liu, Kang (VerfasserIn)
Format: UnknownFormat
Sprache:eng
Veröffentlicht: 2022
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!