文本分类
文本分类
77/1000
简介
文本分类(Text Classification)任务的目标是判断一段文本所属的类别。 所有可能的类别与具体领域相关,由数据集定义,一般在模型训练完毕后固定。 目前,HanLP已上线新闻领域的news_zh
模型和语种检测模型lid
。
调用方法
创建客户端
from hanlp_restful import HanLPClient # auth不填则匿名,zh中文,mul多语种 HanLP = HanLPClient('https://www.hanlp.com/api', auth=None, language='zh')
申请秘钥
由于服务器算力有限,匿名用户每分钟限2次调用。如果你需要更多调用次数,建议申请免费公益API秘钥auth。
文本分类
执行文本分类:
text = ''' 改了好几次,感觉终于可以确定了。 这次的真丝是做了古董感的米金色染色,法蕾也做了同样的颜色。 真丝软糯的手感和温柔的光泽感,在即将结束的冬天,显得格外的美好。 ''' HanLP.text_classification(text, model='news_zh')
返回值为文章最可能的类别,用户可通过topk
以及prob
参数来输出前k
个类别以及相应的概率。
本地调用
敬请期待。
多语种支持
敬请期待。