第二
论文资料
SeConD:用于多转弯响应选择的富文本安全性对话数据集
抽象的
大多数现有的多轮对话数据集都是从闲聊或简短对话中提取的,由于缺乏文本和注释的多样性而受到限制(例如,表情符号和分步说明几乎无法在现有数据集)。网络安全对话为用户提供了有关如何采取针对网络攻击的安全措施的宝贵提示和建议。我们引入了一个富文本的网络安全语料库,即SeConD(安全性对话数据集),它是一个手动注释的数据集,由从在线网络安全论坛中提取的148k英语对话组成。我们提供了在我们的数据集中训练的十二种最新模型的基