依存句法分析 | Constituency-based parse trees

访问量 430 发布于 2023-03-14 更新于 2024-03- 20 16~21 分钟 阅读

什么是句法分析？

句法分析（syntactic parsing）是自然语言处理中的关键技术之一，它是对输入的文本句子进行分析以得到句子的句法结构的处理过程。对句法结构进行分析，一方面是语言理解的自身需求，句法分析是语言理解的重要一环，另一方面也为其它自然语言处理任务提供支持。例如句法驱动的统计机器翻译需要对源语言或目标语言（或者同时两种语言）进行句法分析。

语义分析通常以句法分析的输出结果作为输入以便获得更多的指示信息。根据句法结构的表示形式不同，最常见的句法分析任务可以分为以下三种：

句法结构分析（syntactic structure parsing），又称短语结构分析（phrase structure parsing），也叫成分句法分析（constituent syntactic parsing）。作用是识别出句子中的短语结构以及短语之间的层次句法关系。
依存关系分析，又称依存句法分析（dependency syntactic parsing），简称依存分析，作用是识别句子中词汇与词汇之间的相互依存关系。
深层文法句法分析，即利用深层文法，例如词汇化树邻接文法（Lexicalized Tree Adjoining Grammar，LTAG）、词汇功能文法（Lexical Functional Grammar，LFG）、组合范畴文法（Combinatory Categorial Grammar，CCG）等，对句子进行深层的句法以及语义分析。

什么是依存句法分析？

依存句法分析

维基百科是这样描述的：

The dependency-based parse trees of dependency grammars see all nodes as terminal, which means they do not acknowledge the distinction between terminal and non-terminal categories. They are simpler on average than constituency-based parse trees because they contain fewer nodes.

依存句法是由法国语言学家L.Tesniere最先提出。它将句子分析成一颗依存句法树，描述出各个词语之间的依存关系。也即指出了词语之间在句法上的搭配关系，这种搭配关系是和语义相关联的。

在自然语言处理中，用词与词之间的依存关系来描述语言结构的框架称为依存语法（dependence grammar），又称从属关系语法。利用依存句法进行句法分析是自然语言理解的重要技术之一。

常见方法

基于规则的方法

早期的基于依存语法的句法分析方法主要包括类似CYK的动态规划算法、基于约束满足的方法和确定性分析策略等。

基于统计的方法

统计自然语言处理领域也涌现出了一大批优秀的研究工作，包括生成式依存分析方法、判别式依存分析方法和确定性依存分析方法，这几类方法是数据驱动的统计依存分析中最为代表性的方法。

基于深度学习的方法

近年来，深度学习在句法分析课题上逐渐成为研究热点，主要研究工作集中在特征表示方面。传统方法的特征表示主要采用人工定义原子特征和特征组合，而深度学习则把原子特征(词、词性、类别标签)进行向量化，在利用多层神经元网络提取特征。

依存分析器的性能评价

通常使用的指标包括：

无标记依存正确率（unlabeled attachment score，UAS）
带标记依存正确率（labeled attachment score， LAS）
依存正确率（dependency accuracy，DA）
根正确率（root accuracy，RA）
完全匹配率（complete match，CM）

这些指标的具体意思如下：

无标记依存正确率（UAS）

测试集中找到其正确支配词的词（包括没有标注支配词的根结点）所占总词数的百分比。

带标记依存正确率（LAS）

测试集中找到其正确支配词的词，并且依存关系类型也标注正确的词（包括没有标注支配词的根结点）占总词数的百分比。

依存正确率（DA）

测试集中找到正确支配词非根结点词占所有非根结点词总数的百分比。

根正确率（RA）

有二种定义，一种是测试集中正确根结点的个数与句子个数的百分比。另一种是指测试集中找到正确根结点的句子数所占句子总数的百分比。

完全匹配率（CM）

测试集中无标记依存结构完全正确的句子占句子总数的百分比。

依存句法分析 | Constituency-based parse trees

什么是句法分析？

什么是依存句法分析？

相关重要概念

常见方法

基于规则的方法

基于统计的方法

基于深度学习的方法

依存分析器的性能评价

相关数据集

相关工具推荐

StanfordCoreNLP

HanLP

SpaCy