开发工具:
文件大小: 396kb
下载次数: 0
上传时间: 2021-02-23
详细说明:ICQ,MSN和在线聊天室等实时通信平台在Internet上比以往任何时候都更加流行。 但是,存在真正的风险,犯罪分子和恐怖分子可能会进行非法和刑事虐待。 这突出了准确检测聊天语言并将其翻译成其对等语言的安全意义。 这些平台上使用的语言与标准语言明显不同。 这种语言称为聊天语言,相对非正式,异常且动态。 这些功能使常规语言资源(如字典)和处理工具(如解析器)失效。 在本文中,我们介绍了NIL语料库,它是一种聊天语言文本集合,带有注释,以方便训练和测试聊天语言处理算法。 我们分析了NIL语料库,以研究聊天语言的语言特征和上下文行为。 首先,我们观察到大多数聊天术语,即聊天文本中的非正式单词,是由语音映射形成的。 然后,我们提出用于聊天语言规范化的扩展源通道模型(XSCM),该过程是将以聊天语言表达的消息转换为其标准语言的过程。 实验结果表明,XSCM在聊天术语识别和归一化准确性方面的性能优于其源通道模型(SCM),并且随着时间的推移也更加一致。
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.