牛骨文教育服务平台(让学习变的简单)

牛骨文首页

: 0 一些翻译约定; 1 前言和预备; 2 介绍; 4 Lex; 4.1 Lex的例子; 4.2 标记列表; 4.3 标记的规则; 4.4 标记的值; 4.5 丢弃标记; 4.6 行号和位置信息; 4.7 忽略字符; 4.8 字面字符; 4.9 错误处理; 4.10 构建和使用lexer; 4.11 @TOKEN装饰器; 4.12 优化模式; 4.13 调试; 4.14 其他方式定义词法规则; 4.15 额外状态维护; 4.16 Lexer克隆; 4.17 Lexer的内部状态; 4.18 基于条件的扫描和启动条件; 4.19 其他问题; 5 语法分析基础; 6 Yacc; 6.1 一个例子; 6.2 将语法规则合并; 6.3 字面字符; 6.4 空产生式; 6.5 改变起始符号; 6.6 处理二义文法; 6.7 parser.out调试文件; 6.8 处理语法错误; 6.9 行号和位置的跟踪; 6.10 构造抽象语法树; 6.11 嵌入式动作; 6.12 Yacc的其他; 7 多个语法和词法分析器; 8 使用Python的优化模式; 9 高级调试; 9.1 调试lex()和yacc()命令; 9.2 运行时调试; 10 如何继续

4.19 其他问题

lexer需要输入的是一个字符串。好在大多数机器都有足够的内存，这很少导致性能的问题。这意味着，lexer现在还不能用来处理文件流或者socket流。这主要是受到re模块的限制。
lexer支持用Unicode字符描述标记的匹配规则，也支持输入字串包含Unicode
如果你想要向re.compile()方法提供flag，使用reflags选项：lex.lex(reflags=re.UNICODE)
由于lexer是全部用Python写的，性能很大程度上取决于Python的re模块，即使已经尽可能的高效了。当接收极其大量的输入文件时表现并不尽人意。如果担忧性能，你可以升级到最新的Python，或者手工创建分析器，或者用C语言写lexer并做成扩展模块。

如果你要创建一个手写的词法分析器并计划用在yacc.py中，只需要满足下面的要求：

需要提供一个token()方法来返回下一个标记，如果没有可用的标记了，则返回None。
token()方法必须返回一个tok对象，具有type和value属性。如果行号需要跟踪的话，标记还需要定义lineno属性。

copyright © 2008-2019 亿联网络版权所有备案号：粤ICP备14031511号-2