语义文本相似度
语义文本相似度
文本A29/800
文本B30/800
语义相似度
编号 | 文本A | 文本B | 相似度 |
---|
简介
语义文本相似度(Semantic Textual Similarity,STS)任务的目标是判断一对短文本的语义相似度,相似度区间为[0, 1]
。
提示
HanLP的线上模型和语料库仍然在迭代发展中,当前版本存在打分两极分化的缺点。 我们将在下个版本修复这些问题,并且支持更多细分领域,敬请期待。
调用方法
创建客户端
from hanlp_restful import HanLPClient # auth不填则匿名,zh中文,mul多语种 HanLP = HanLPClient('https://www.hanlp.com/api', auth=None, language='zh')
申请秘钥
由于服务器算力有限,匿名用户每分钟限2次调用。如果你需要更多调用次数,建议申请免费公益API秘钥auth。
分析
指定执行语义文本相似度:
HanLP.semantic_textual_similarity([ ('看图猜一电影名', '看图猜电影'), ('无线路由器怎么无线上网', '无线上网卡和无线路由器怎么用'), ('北京到上海的动车票', '上海到北京的动车票'), ])
返回值为一个语义相似度的list
。
本地调用
本地调用方法请参考教程。
多语种支持
敬请期待。