博客
关于我
编译原理及技术(二)——上下文无关文法及推导
阅读量:796 次
发布时间:2019-03-25

本文共 1114 字,大约阅读时间需要 3 分钟。

一、语法和语义

什么是语法?

语法是程序形式结构的规则集合,定义了程序的描述方式。它包括词法规则语法规则两部分。

词法规则

词法规则定义单词符号的形成规则,主要包括:

  • 常数、标识符、基本字、算符、界符等
  • 描述工具:有限自动机
语法规则

语法规则定义语法单位的形成规则,通常包括:

  • 表达式、语句、分程序、过程、函数、程序等
  • 描述工具:上下文无关文法

什么是语义?

语义是程序意义的规则集合,描述程序执行的目的和结果。常用的描述方法有:

  • 自然语言描述(具有二义性、含有隐含错误和不完整性)
  • 形式描述(如 πεγ-形式理论)

二、文法

文法是描述语言语法结构的规则体系,强调语言形式的规范性。常用于处理自然语言的例子:(示例:句子 "He gave me a book." 的文法规则)

三、语法描述的几个基本概念

(示例图片:语法单元、语法树、推导过程等)

四、上下文无关文法

上下文无关文法(CFG)是一个由四元组 G = (VT, VN, S, P) 定义的形式语言体系,其中:

  • VT:终结符集合
  • VN:非终结符集合
  • S:语法描述的基本形式
  • P:产生式集合

其特点是产生式中的 P 可以由终结符 a(阿尔法)自由替换,无需依赖上下文。

例如,定义仅包含 "+" 和 "*" 的算术表达式文法:

G = ( {i, +, *, (, )}, {E}, E, P )

其中 P 的产生式为:

  • E → i
  • E → E + i
  • E → E * i
  • E → (E)
  • E → (i)

五、文法推导

推导过程是从一个句型到另一个句型的过程,可能不唯一。可能使用最左推导或最右推导(最右推导也称为规范推导)。

推导过程:

  • 含a> 表示带有 a 上下文,可以自由替换。
  • "+" 表示非平方推导(至少一步)
  • "*" 表示推导(至少一步)

文法推导的结果通常以语法树的形式呈现。语法树不唯一意味着文法可能具有二义性。

六、语法树与二义性

文法的二义性(Ambiguity)是指同一个文法推导可能产生两个或多个不同的语法树。

(示例图片:二义性所致的语法树差异)

七、乔姆斯基形式语言体系

乔姆斯基在 1956 年提出了形式语言体系,包含四种文法类型:

  • 型 0 文法:没有非终结符,无法产生下 shifts(无法向后移动)
  • 型 1 文法:有一个非终结符,允许向左和向右移动
  • 型 2 文法:有多个非终结符,可以通过下 shifts 或右移[Sh Ve]
  • 型 3 文法:如型 1 文法,允许自由移动非终结符

型 2 和 型 3 文法的主要区别在于是否允许自由移动非终结符。

型 0 和 型 1 文法应用广泛,常用于描述上下文无关文法限定产生式的语法规则。

转载地址:http://wxbyk.baihongyu.com/

你可能感兴趣的文章
Nginx配置TCP代理指南
查看>>
NGINX配置TCP连接双向SSL
查看>>
Nginx配置——不记录指定文件类型日志
查看>>
nginx配置一、二级域名、多域名对应(api接口、前端网站、后台管理网站)
查看>>
nginx配置中的服务器名称
查看>>
Nginx配置代理解决本地html进行ajax请求接口跨域问题
查看>>
nginx配置全解
查看>>
Nginx配置参数中文说明
查看>>
Nginx配置后台网关映射路径
查看>>
nginx配置域名和ip同时访问、开放多端口
查看>>
Nginx配置多个不同端口服务共用80端口
查看>>
Nginx配置好ssl,但$_SERVER[‘HTTPS‘]取不到值
查看>>
Nginx配置如何一键生成
查看>>
Nginx配置实例-动静分离实例:搭建静态资源服务器
查看>>
Nginx配置实例-反向代理实例:根据访问的路径跳转到不同端口的服务中
查看>>
Nginx配置实例-反向代理实现浏览器请求Nginx跳转到服务器某页面
查看>>
Nginx配置实例-负载均衡实例:平均访问多台服务器
查看>>
Nginx配置文件nginx.conf中文详解(总结)
查看>>
Nginx配置自带的stub状态实现活动监控指标
查看>>
Nginx配置详解
查看>>