CONLL POS分类
该项目读取一个串联的.conll文件,并写入一个包含令牌和语音相关部分(POS)注释的.tsv文件,以及一个包含有关数据集常规信息的.info摘要文件。 接下来,它使用BERT模型为语料库中的所有句子创建词嵌入,以用作人工神经网络进行POS分类的输入。
目录
基本信息
该项目的目标是最终根据英语单词标记的词性(POS)对其进行分类。 在此阶段,项目将从.conll输入文件中预处理带有POS注释的数据,并对数据集进行汇总。 此外,它还会加载从预处理步骤生成的.tsv文件,并