该数据集是用于命名实体识别训练模型的数据集,该数据集中包含6中标签,分别是人名、地名、时间、组织机构名、公司名、产品名。遵循BIO编码。里面有三个文件,分别是训练集,测试集,验证集。样例如下:
以 O
及 O
以 O
康 B-COMPANY_NAME
宽 I-COMPANY_NAME
为 O
代 O
表 O
的 O
国 O
外 O
专 O
利 O
产 O
品 O
低 O
毒 O
杀 O
虫 O
剂 O
吡 B-PRODUCT_NAME
虫 I-PRODUCT_NAME
啉 I-PRODUCT_N