The GENIA tagger analyzes English sentences and outputs the base forms, part-of-speech tags, chunk tags, and named entity tags.The tagger is specifically tuned for biomedical text such as MEDLINE abstracts.If you need to extract information from bio
该数据集是用于命名实体识别训练模型的数据集,该数据集中包含6中标签,分别是人名、地名、时间、组织机构名、公司名、产品名。遵循BIO编码。里面有三个文件,分别是训练集,测试集,验证集。样例如下:
以 O
及 O
以 O
康 B-COMPANY_NAME
宽 I-COMPANY_NAME
为 O
代 O
表 O
的 O
国 O
外 O
专 O
利 O
产 O
品 O
低 O
毒 O
杀 O
虫 O
剂 O
吡 B-PRODUCT_NAME
虫 I-PRODUCT_NAME
啉 I-PRODUCT_N
近年来,网络安全威胁日益增多,数据驱动的安全智能分析成为网络安全领域研究的热点。特别是以知识图谱为代表的人工智能技术可为多源异构威胁情报数据中的复杂网络攻击检测和未知网络攻击检测提供支撑。网络安全实体识别是威胁情报知识图谱构建的基础。开放网络文本数据中的安全实体构成非常复杂,导致传统的深度学习方法难以准确识别。在BERT(pre-training of deep bidirectional transformers)预训练语言模型的基础上,提出一种基于残差空洞卷积神经网络和条件随机场的网络安全实