抽取式自动摘要


抽取式自动摘要

412/3000
loading

简介

抽取式自动摘要(Extractive Summarization)任务的目标是从文章中筛选出一些作为摘要的中心句子:既要紧扣要点,又要避免赘语。

调用方法

创建客户端

      from hanlp_restful import HanLPClient
# auth不填则匿名,zh中文,mul多语种
HanLP = HanLPClient('https://www.hanlp.com/api', auth=None, language='zh')

    

申请秘钥

由于服务器算力有限,匿名用户每分钟限2次调用。如果你需要更多调用次数,建议申请免费公益API秘钥authopen in new window

自动摘要

执行自动摘要:

      
text = '''
据DigiTimes报道,在上海疫情趋缓,防疫管控开始放松后,苹果供应商广达正在逐步恢复其中国工厂的MacBook产品生产。
据供应链消息人士称,生产厂的订单拉动情况正在慢慢转强,这会提高MacBook Pro机型的供应量,并缩短苹果客户在过去几周所经历的延长交货时间。
仍有许多苹果笔记本用户在等待3月和4月订购的MacBook Pro机型到货,由于苹果的供应问题,他们的发货时间被大大推迟了。
据分析师郭明錤表示,广达是高端MacBook Pro的唯一供应商,自防疫封控依赖,MacBook Pro大部分型号交货时间增加了三到五周,
一些高端定制型号的MacBook Pro配置要到6月底到7月初才能交货。
尽管MacBook Pro的生产逐渐恢复,但供应问题预计依然影响2022年第三季度的产品销售。
苹果上周表示,防疫措施和元部件短缺将继续使其难以生产足够的产品来满足消费者的强劲需求,这最终将影响苹果6月份的收入。
'''
HanLP.extractive_summarization(text, topk=3)

    

返回值为最多topk个摘要句子以及相应的权重,权重取值区间为[0, 1]。由于Trigram Blocking技巧,实际返回的摘要句数量可能小于topk

本地调用

敬请期待。

多语种支持

敬请期待。

上次编辑于: 2022/7/4 11:17:38
贡献者: hankcs