Gating Dropout: Communication-Efficient Regularization for Sparsely Activated Transformers

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:International Conference on Machine Learning (39. : 2022 : Baltimore, Md.; Online) International Conference on Machine Learning (ICML 2022) ; Part 17 of 33
1. Verfasser: Liu, Rui (VerfasserIn)
Weitere Verfasser: Kim, Young Jin (VerfasserIn), Muzio, Alexandre (VerfasserIn), Hassan, Hany (VerfasserIn)
Pages:2022
Format: UnknownFormat
Sprache:eng
Veröffentlicht: 2023
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Keine Beschreibung verfügbar.