北大团队的音频字幕DCASE 2020系统
本文的Pytorch实现:
基本设置遵循DCASE 2020基准系统,有关详细信息,请参见 。
引文
如果此代码有帮助,请随时引用以下论文:
techreport{wang2020_t6,
Author = "Wang, Helin and Yang, Bang and Zou, Yuexian and Chong, Dading",
title = "Automated Audio Captioning With Tempora
bLVNet-TAM
该存储库包含我们论文的代码和模型,
范全福*,陈春福(Richard)*,Hilde Kuehne,Marco Pistoia,David Cox,“事半功倍:通过时间聚合模块学习高效的视频表示”
如果您使用此仓库中的代码和模型,请引用我们的工作。 谢谢!
incollection{
fan2019blvnet,
title={{More Is Less: Learning Efficient Video Representations by Tem