HanLP: Han Language Processing

thumb_up Good

Live Demo

Any multilingual sentence within 100 characters
SDP standard
Use multilingual model.

Linguistics

Dep Tree           
────────────────── 
               ┌─► 
            ┌─►└── 
            │┌───► 
            ││┌──► 
            │││┌─► 
┌┬──────────┴┴┴┼── 
││             └─► 
││  ┌────────────► 
││  │┌─►┌───────── 
││  ││  └─►┌┬───── 
││  ││     ││  ┌─► 
││  ││     │└─►└── 
││  ││     │   ┌─► 
││  ││     └──►└── 
││  ││        ┌──► 
││  ││        │┌─► 
│└─►└┴────────┴┴── 
└────────────────► 
Tok 
─── 
徐   
先生  
还   
具体  
帮助他 
确定  
了   
把   
画   
雄鹰  
、   
松鼠  
和   
麻雀  
作为  
主攻  
目标  
。   
Relation   
────────── 
nmod       
nsubj      
mark       
advmod     
advcl      
root       
aux:aspect 
case       
csubj      
obj        
punct      
conj       
cc         
conj       
cop        
nmod       
ccomp      
punct      
Lem 
─── 
徐   
先生  
还   
具体  
帮助他 
确定  
了   
把   
画   
雄鹰  
、   
松鼠  
和   
麻雀  
作为  
主攻  
目标  
。   
PoS   
───── 
PROPN 
NOUN  
ADV   
ADV   
VERB  
VERB  
PART  
ADP   
VERB  
NOUN  
PUNCT 
NOUN  
CCONJ 
NOUN  
AUX   
NOUN  
NOUN  
PUNCT 
Tok 
─── 
徐   
先生  
还   
具体  
帮助他 
确定  
了   
把   
画   
雄鹰  
、   
松鼠  
和   
麻雀  
作为  
主攻  
目标  
。   
NER Type   
────────── 
───►PERSON 
           
           
           
           
           
           
           
           
           
           
           
           
           
           
           
           
           
Tok 
─── 
徐   
先生  
还   
具体  
帮助他 
确定  
了   
把   
画   
雄鹰  
、   
松鼠  
和   
麻雀  
作为  
主攻  
目标  
。   
SRL PA1  
──────── 
         
         
         
         
         
╟──►PRED 
         
◄─┐      
  │      
  │      
  │      
  │      
  ├►ARG1 
  │      
  │      
  │      
◄─┘      
         
Tok 
─── 
徐   
先生  
还   
具体  
帮助他 
确定  
了   
把   
画   
雄鹰  
、   
松鼠  
和   
麻雀  
作为  
主攻  
目标  
。   
SRL PA2  
──────── 
         
         
         
         
         
         
         
         
◄─┐      
  │      
  │      
  ├►ARG1 
  │      
◄─┘      
╟──►PRED 
◄─┐      
◄─┴►ARG2 
         
Tok 
─── 
徐   
先生  
还   
具体  
帮助他 
确定  
了   
把   
画   
雄鹰  
、   
松鼠  
和   
麻雀  
作为  
主攻  
目标  
。   
SRL PA3  
──────── 
         
         
         
         
         
         
         
         
╟──►PRED 
◄─┐      
  │      
  ├►ARG1 
  │      
◄─┘      
         
         
         
         
Tok 
─── 
徐   
先生  
还   
具体  
帮助他 
确定  
了   
把   
画   
雄鹰  
、   
松鼠  
和   
麻雀  
作为  
主攻  
目标  
。   
PoS      3       4       5       6       7       8       9       10      11      12
───────────────────────────────────────────────────────────────────────────────────
PROPN──┐                                                                           
NOUN ──┴────────────────────────────────────────────────────────────────►NP ───┐   
ADV ────────────────────────────────────────────────────────────►ADVP──┐       │   
ADV ────────────────────────────────────────────────────────────►ADVP──┤       │   
VERB ───────────────────────────────────────────────────►VP ───┐       ├►VP────┤   
VERB ──────────────────────────────────────────────────┐       │       │       │   
PART ──────────────────────────────────────────────────┤       ├►VP ───┘       │   
ADP ───────────────────────────────────┐               │       │               │   
VERB ──────────┐                       │               ├►VP ───┘               │   
NOUN ──┐       │                       │               │                       ├►IP
PUNCT  │       ├►VP ────►IP ───┐       ├►VP ────►IP ───┘                       │   
NOUN   ├►NP ───┘               │       │                                       │   
CCONJ  │                       │       │                                       │   
NOUN ──┘                       ├►IP ───┘                                       │   
AUX ───────────────────┐       │                                               │   
NOUN ───►ADJP──┐       ├►VP ───┘                                               │   
NOUN ───►NP ───┴►NP ───┘                                                       │   
PUNCT──────────────────────────────────────────────────────────────────────────┘   

Lexical

                            徐 先生 还 具体 帮助他 确定 了 把 画 雄鹰 、 松鼠 和 麻雀 作为 主攻 目标 。
T1 PROPN 0 1 徐
#1	AnnotatorNotes	T1	proper noun
T2 NOUN 2 4 先生
#2	AnnotatorNotes	T2	noun
T3 ADV 5 6 还
#3	AnnotatorNotes	T3	adverb
T4 ADV 7 9 具体
#4	AnnotatorNotes	T4	adverb
T5 VERB 10 13 帮助他
#5	AnnotatorNotes	T5	verb
T6 VERB 14 16 确定
#6	AnnotatorNotes	T6	verb
T7 PART 17 18 了
#7	AnnotatorNotes	T7	particle
T8 ADP 19 20 把
#8	AnnotatorNotes	T8	adposition
T9 VERB 21 22 画
#9	AnnotatorNotes	T9	verb
T10 NOUN 23 25 雄鹰
#10	AnnotatorNotes	T10	noun
T11 PUNCT 26 27 、
#11	AnnotatorNotes	T11	punctuation
T12 NOUN 28 30 松鼠
#12	AnnotatorNotes	T12	noun
T13 CCONJ 31 32 和
#13	AnnotatorNotes	T13	coordinating conjunction
T14 NOUN 33 35 麻雀
#14	AnnotatorNotes	T14	noun
T15 AUX 36 38 作为
#15	AnnotatorNotes	T15	auxiliary
T16 NOUN 39 41 主攻
#16	AnnotatorNotes	T16	noun
T17 NOUN 42 44 目标
#17	AnnotatorNotes	T17	noun
T18 PUNCT 45 46 。
#18	AnnotatorNotes	T18	punctuation
T19 PERSON 0 1 徐

                            
                        

Syntactics

                            1	徐	徐	PROPN	PROPN	_	2	nmod	_	_
2	先生	先生	NOUN	NOUN	_	6	nsubj	_	_
3	还	还	ADV	ADV	_	6	mark	_	_
4	具体	具体	ADV	ADV	_	6	advmod	_	_
5	帮助他	帮助他	VERB	VERB	_	6	advcl	_	_
6	确定	确定	VERB	VERB	_	0	root	_	_
7	了	了	PART	PART	_	6	aux:aspect	_	_
8	把	把	ADP	ADP	_	17	case	_	_
9	画	画	VERB	VERB	_	17	csubj	_	_
10	雄鹰	雄鹰	NOUN	NOUN	_	9	obj	_	_
11	、	、	PUNCT	PUNCT	_	12	punct	_	_
12	松鼠	松鼠	NOUN	NOUN	_	10	conj	_	_
13	和	和	CCONJ	CCONJ	_	14	cc	_	_
14	麻雀	麻雀	NOUN	NOUN	_	10	conj	_	_
15	作为	作为	AUX	AUX	_	17	cop	_	_
16	主攻	主攻	NOUN	NOUN	_	17	nmod	_	_
17	目标	目标	NOUN	NOUN	_	6	ccomp	_	_
18	。	。	PUNCT	PUNCT	_	6	punct	_	_

                            
                        

Semantics

%3 1 2 先生 1->2 compound 6 确定 6->2 ARG1 3 4 具体 5 帮助他 7 8 9 10 雄鹰 9->10 ARG2 12 松鼠 10->12 conj 14 麻雀 10->14 _and_c 12->14 _and_c 15 作为 15->9 ARG1 17 目标 15->17 ARG2 11 13 16 主攻 16->17 ARG1 18

Introduction

The multilingual NLP library for researchers and companies, built on PyTorch and TensorFlow 2.x, for advancing state-of-the-art deep learning techniques in both academia and industry. HanLP was designed from day one to be efficient, user friendly and extendable.

Thanks to open-access corpora like Universal Dependencies and OntoNotes, HanLP 2.1 now offers 10 joint tasks on 104 languages: tokenization, lemmatization, part-of-speech tagging, token feature extraction, dependency parsing, constituency parsing, semantic role labeling, semantic dependency parsing, abstract meaning representation (AMR) parsing. See also GitHub

HanLP versions