目的
为了将非结构化的简历文本提取出有效的工作经历信息,尝试使用各类NLP框架进行文本实体识别,目标是分解出时间,工作地点,任职单位,职务等有效信息。
在尝试了一些分词和NLP框架后,选用hanLP作为训练工具,在自己制作的数据集(人物简历信息)上训练自定义的NER标签(职务),实现特定标签的文本实体识别。
为了将非结构化的简历文本提取出有效的工作经历信息,尝试使用各类NLP框架进行文本实体识别,目标是分解出时间,工作地点,任职单位,职务等有效信息。
在尝试了一些分词和NLP框架后,选用hanLP作为训练工具,在自己制作的数据集(人物简历信息)上训练自定义的NER标签(职务),实现特定标签的文本实体识别。
随着tf2的发布,object detection API也已经迁移到了tf2上,有朋友正好要开始学习应用目标检测,问我有没有tf2的教程,于是决定决定把原来tf1.15上的使用自定义数据集在本地显卡上测试的代码迁移到tf2上,并且使用Colaboratory来运行,免去了本地环境的搭建。