自然语言工具包(NLTK)和 SpaCy 构建 Python 命名实体识别

2021/9/26 20:12:37

本文主要是介绍自然语言工具包(NLTK)和 SpaCy 构建 Python 命名实体识别,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

命名实体识别 (NER) 可能是信息提取的第一步,旨在将文本中的命名实体定位和分类为预定义的类别,例如人名、组织、位置、时间表达、数量、货币价值、百分比 等。 NER 在自然语言处理 (NLP) 的许多领域都有使用,它可以帮助回答许多现实世界的问题,例如:

  • 新闻文章中提到了哪些公司?
  • 投诉或评论中是否提到了特定产品?

本文介绍如何使用 NLTK 和 SpaCy 构建命名实体识别器,识别原始文本中的人、组织或位置等事物的名称。

内容

  • 自然语言工具包
    • 导入库
    • 信息提取介绍及 Python 脚本
    • 分块及其 Python 脚本
  • SpyCy
    • 实体及 Python 脚本
    • 令牌及 Python 脚本
    • 从文章中提取命名实体及案例 Python 脚本
  • 源代码

详情参阅http://viadean.com/nltk_spacy_ner.html



这篇关于自然语言工具包(NLTK)和 SpaCy 构建 Python 命名实体识别的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程