命名实体识别
命名实体识别
153/800
简介
命名实体识别(Named Entity Recognition、NER)是一种识别文本中实体的位置以及类别的任务。 HanLP支持PKU、MSRA、OntoNotes等命名实体规范。
调用方法
创建客户端
from hanlp_restful import HanLPClient # auth不填则匿名,zh中文,mul多语种 HanLP = HanLPClient('https://www.hanlp.com/api', auth=None, language='zh')
申请秘钥
由于服务器算力有限,匿名用户每分钟限2次调用。如果你需要更多调用次数,建议申请免费公益API秘钥auth。
MSRA规范
默认采用MSRA,是最大的中文命名实体识别语料库:
HanLP.parse('晓美焰来到北京立方庭参观自然语义科技公司。', tasks='ner/msra').pretty_print()
PKU规范
PKU是国内最流行的标注集,被HanLP1.x采用为默认标准:
HanLP.parse('晓美焰来到北京立方庭参观自然语义科技公司。', tasks='ner/pku').pretty_print()
OntoNotes规范
OntoNotes是国际上最通用的标注规范:
HanLP.parse('晓美焰来到北京立方庭参观自然语义科技公司。', tasks='ner/ontonotes').pretty_print()
多语种支持
其他标准用于外语或多语种,请参考文档加载相应的外语或多语种模型。