HanLP: Han Language Processing

thumb_up Good

Live Demo

Any multilingual sentence within 200 characters
SDP standard
Use multilingual model.

Linguistics

Dep Tree     
──────────── 
         ┌─► 
   ┌────►└── 
   │┌──────► 
   ││   ┌──► 
   ││   │┌─► 
   ││┌─►└┴── 
┌┬─┴┴┴────── 
││  ┌──────► 
││  │    ┌─► 
││  │┌──►└── 
││  ││   ┌─► 
││  ││┌─►└── 
││  │││  ┌─► 
│└─►└┴┴──┴── 
└──────────► 
Token     
───────── 
2021      
年         
HanLPv2.1 
为         
生产        
环境        
带来        
次世代       
最         
先进的       
多         
语种        
NLP       
技术        
。         
Relation  
───────── 
nummod    
nmod:tmod 
nsubj     
case      
nmod      
obl       
root      
nmod      
advmod    
amod      
nummod    
nmod      
nmod      
obj       
punct     
Lemma     
───────── 
2021      
年         
HANlpv2.1 
为         
生产        
环境        
带来        
次世代       
最         
先进的       
多         
语种        
NLP       
技术        
。         
PoS   
───── 
NUM   
NOUN  
X     
ADP   
NOUN  
NOUN  
VERB  
NOUN  
ADV   
ADJ   
NUM   
NOUN  
X     
NOUN  
PUNCT 
Tok       
───────── 
2021      
年         
HanLPv2.1 
为         
生产        
环境        
带来        
次世代       
最         
先进的       
多         
语种        
NLP       
技术        
。         
NER Type   
────────── 
◄─┐        
◄─┴►DATE   
───►PERSON 
           
           
           
           
           
           
           
           
           
           
           
           
Tok       
───────── 
2021      
年         
HanLPv2.1 
为         
生产        
环境        
带来        
次世代       
最         
先进的       
多         
语种        
NLP       
技术        
。         
SRL PA1      
──────────── 
◄─┐          
◄─┴►ARGM-TMP 
             
             
             
             
╟──►PRED     
             
             
             
             
             
             
             
             
Tok       
───────── 
2021      
年         
HanLPv2.1 
为         
生产        
环境        
带来        
次世代       
最         
先进的       
多         
语种        
NLP       
技术        
。         
PoS      3       4       5       6       7       8 
───────────────────────────────────────────────────
NUM ───┐                                           
NOUN ──┴────────────────────────────────►NP ───┐   
X ──────────────────────────────────────►NP────┤   
ADP ───────────┐                               │   
NOUN ──┐       ├────────────────►PP ───┐       │   
NOUN ──┴►NP ───┘                       │       │   
VERB ──────────────────────────┐       ├►VP────┤   
NOUN ───────────►ADJP──┐       │       │       │   
ADV ────►ADVP──┐       │       ├►VP ───┘       ├►IP
ADJ ────►ADJP──┴►ADJP──┤       │               │   
NUM ────►QP ───┐       ├►NP ───┘               │   
NOUN ───►NP ───┴►NP────┤                       │   
X ─────┐               │                       │   
NOUN ──┴────────►NP ───┘                       │   
PUNCT──────────────────────────────────────────┘   

Lexical

                            2021 年 HanLPv2.1 为 生产 环境 带来 次世代 最 先进的 多 语种 NLP 技术 。
T1 NUM 0 4 2021
#1	AnnotatorNotes	T1	numeral
T2 NOUN 5 6 年
#2	AnnotatorNotes	T2	noun
T3 X 7 16 HanLPv2.1
#3	AnnotatorNotes	T3	other
T4 ADP 17 18 为
#4	AnnotatorNotes	T4	adposition
T5 NOUN 19 21 生产
#5	AnnotatorNotes	T5	noun
T6 NOUN 22 24 环境
#6	AnnotatorNotes	T6	noun
T7 VERB 25 27 带来
#7	AnnotatorNotes	T7	verb
T8 NOUN 28 31 次世代
#8	AnnotatorNotes	T8	noun
T9 ADV 32 33 最
#9	AnnotatorNotes	T9	adverb
T10 ADJ 34 37 先进的
#10	AnnotatorNotes	T10	adjective
T11 NUM 38 39 多
#11	AnnotatorNotes	T11	numeral
T12 NOUN 40 42 语种
#12	AnnotatorNotes	T12	noun
T13 X 43 46 NLP
#13	AnnotatorNotes	T13	other
T14 NOUN 47 49 技术
#14	AnnotatorNotes	T14	noun
T15 PUNCT 50 51 。
#15	AnnotatorNotes	T15	punctuation
T16 DATE 0 6 2021 年
T17 PERSON 7 16 HanLPv2.1

                            
                        

Syntactics

                            1	2021	2021	NUM	NUM	_	2	nummod	_	_
2	年	年	NOUN	NOUN	_	7	nmod:tmod	_	_
3	HanLPv2.1	HanLPv2.1	X	X	_	7	nsubj	_	_
4	为	为	ADP	ADP	_	6	case	_	_
5	生产	生产	NOUN	NOUN	_	6	nmod	_	_
6	环境	环境	NOUN	NOUN	_	7	obl	_	_
7	带来	带来	VERB	VERB	_	0	root	_	_
8	次世代	次世代	NOUN	NOUN	_	14	nmod	_	_
9	最	最	ADV	ADV	_	10	advmod	_	_
10	先进的	先进的	ADJ	ADJ	_	14	amod	_	_
11	多	多	NUM	NUM	_	12	nummod	_	_
12	语种	语种	NOUN	NOUN	_	14	nmod	_	_
13	NLP	NLP	X	X	_	14	nmod	_	_
14	技术	技术	NOUN	NOUN	_	7	obj	_	_
15	。	。	PUNCT	PUNCT	_	7	punct	_	_

                            
                        

Semantics

%3 1 2021 2 1->2 ARG1 7 带来 2->7 orphan 3 HanLPv2.1 7->3 ARG1 14 技术 7->14 ARG2 4 6 环境 4->6 ARG2 5 生产 5->6 compound 8 次世代 9 10 先进的 9->10 ARG1 10->14 ARG1 11 12 语种 11->12 ARG1 12->14 compound 13 NLP 13->14 compound 15

Introduction

The multilingual NLP library for researchers and companies, built on PyTorch and TensorFlow 2.x, for advancing state-of-the-art deep learning techniques in both academia and industry. HanLP was designed from day one to be efficient, user friendly and extendable.

Thanks to open-access corpora like Universal Dependencies and OntoNotes, HanLP 2.1 now offers 10 joint tasks on 104 languages: tokenization, lemmatization, part-of-speech tagging, token feature extraction, dependency parsing, constituency parsing, semantic role labeling, semantic dependency parsing, abstract meaning representation (AMR) parsing. See also GitHub

HanLP versions