语义文本相似度


语义文本相似度

文本A29/800
文本B30/800
loading

语义相似度

编号文本A文本B相似度

简介

语义文本相似度(Semantic Textual Similarity,STS)任务的目标是判断一对短文本的语义相似度,相似度区间为[0, 1]

提示

HanLP的线上模型和语料库仍然在迭代发展中,当前版本存在打分两极分化的缺点。 我们将在下个版本修复这些问题,并且支持更多细分领域,敬请期待。

调用方法

创建客户端

      from hanlp_restful import HanLPClient
# auth不填则匿名,zh中文,mul多语种
HanLP = HanLPClient('https://www.hanlp.com/api', auth=None, language='zh')

    

申请秘钥

由于服务器算力有限,匿名用户每分钟限2次调用。如果你需要更多调用次数,建议申请免费公益API秘钥authopen in new window

分析

指定执行语义文本相似度:

      
HanLP.semantic_textual_similarity([
    ('看图猜一电影名', '看图猜电影'),
    ('无线路由器怎么无线上网', '无线上网卡和无线路由器怎么用'),
    ('北京到上海的动车票', '上海到北京的动车票'),
])

    

返回值为一个语义相似度的list

本地调用

本地调用方法请参考教程open in new window

多语种支持

敬请期待。

上次编辑于: 2022/7/29 18:29:59
贡献者: hankcs