ICQ,MSN和在线聊天室等实时通信平台在Internet上比以往任何时候都更加流行。 但是,存在真正的风险,犯罪分子和恐怖分子可能会进行非法和刑事虐待。 这突出了准确检测聊天语言并将其翻译成其对等语言的安全意义。 这些平台上使用的语言与标准语言明显不同。 这种语言称为聊天语言,相对非正式,异常且动态。 这些功能使常规语言资源(如字典)和处理工具(如解析器)失效。 在本文中,我们介绍了NIL语料库,它是一种聊天语言文本集合,带有注释,以方便训练和测试聊天语言处理算法。 我们分析了NIL语料库,以