VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	NeurIPS (35. : 2021 : Online) 35th Conference on Neural Information Processing Systems (NeurIPS 2021) ; Volume 29 of 36
1. Verfasser:	Akbari, Hassan (VerfasserIn)
Weitere Verfasser:	Yuan, Liangzhe (VerfasserIn), Qian, Rui (VerfasserIn), Chuang, Wei-Hong (VerfasserIn), Chang, Shih-Fu (VerfasserIn), Cui, Yin (VerfasserIn), Gong, Boqing (VerfasserIn)
Pages:	35
Format:	UnknownFormat
Sprache:	eng
Veröffentlicht:	2022
Schlagworte:
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Keine Beschreibung verfügbar.