命名实体识别


命名实体识别

153/800
loading

简介

命名实体识别(Named Entity Recognition、NER)是一种识别文本中实体的位置以及类别的任务。 HanLP支持PKUopen in new windowMSRAopen in new windowOntoNotesopen in new window等命名实体规范。

调用方法

创建客户端

      from hanlp_restful import HanLPClient
# auth不填则匿名,zh中文,mul多语种
HanLP = HanLPClient('https://www.hanlp.com/api', auth=None, language='zh')

    

申请秘钥

由于服务器算力有限,匿名用户每分钟限2次调用。如果你需要更多调用次数,建议申请免费公益API秘钥authopen in new window

MSRA规范

默认采用MSRAopen in new window,是最大的中文命名实体识别语料库:

      
HanLP.parse('晓美焰来到北京立方庭参观自然语义科技公司。', tasks='ner/msra').pretty_print()

    

PKU规范

PKUopen in new window是国内最流行的标注集,被HanLP1.x采用为默认标准:

      
HanLP.parse('晓美焰来到北京立方庭参观自然语义科技公司。', tasks='ner/pku').pretty_print()

    

OntoNotes规范

OntoNotesopen in new window是国际上最通用的标注规范:

      
HanLP.parse('晓美焰来到北京立方庭参观自然语义科技公司。', tasks='ner/ontonotes').pretty_print()

    

多语种支持

其他标准用于外语或多语种,请参考文档open in new window加载相应的外语或多语种模型。

上次编辑于: 2022/7/2 22:01:57
贡献者: hankcs