文件名称:
2021-GAIIC-Track1-idea:全球人工智能技术创新大赛【赛道一】-源码
开发工具:
文件大小: 1kb
下载次数: 0
上传时间: 2021-03-25
详细说明:2021-GAIIC-Track1-idea
非常荣幸能够拿到本周周星星,目前线上分数是5折nezha-base模型融合得到,采用pretrian + finetuning,具体细节如下:
预训练
由于数据是脱敏,所以直接从头开始训练bert模型,没有加载已有的预训练模型权重,模型采用的是nezha-base,代码参考;
mask方法:采用ngram mask方法,以及动态mask方法,具体可以参考:
预训练代码使用的是tansformers模块自带的,具体可以参考;
预训练参数:lr = 1e-4,batchSize = 128,seql_length = 128,动态批次长度,最终mlm损失为0.3左右
微调
k折:采用的multilabel进行划分,交替k = 5
模型:nezha模型微调,并直接使用CLS进行分类,采用S形
损失;二分类交叉熵损失函数
对抗:加入对抗训练,使用的
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.