Lexical Analysis

:material-circle-edit-outline: 约 600 个字 :material-clock-time-two-outline: 预计阅读时间 2 分钟

Regular Expressions

记 \(M^\prime=(K^\prime,\Sigma ,\delta,s^\prime,F^\prime)\) 为 DFA，\(M=(K,\Sigma ,\Delta,s,F)\) 为 NFA，他们是等价的

则：

也就是说，我们取 NFA 状态的集合作为 DFA 的一个状态

对于 NFA 所有可能的状态集合，其转移方程为，集合内所有状态的转移关系的结果的 E()

从 \(s^\prime=E(s)\) 往后推即可

注意转换后的 DFA 状态都是集合，是 NFA 状态的集合

算法描述：

其实就是先取所有通过 \(\epsilon\) 相连的状态组成新的集合作为 DFA 的状态，然后按字母表有序地检查：当每一个字符输入后，状态集合里各个状态会转化到哪些状态，将其组成集合作为新的状态。如此往复，直到找不出新的状态为止

助教说最好按左边的样子来画

简单来说，就是初始化为 \({S-F,F}\) 两个状态集合，然后每轮循环里对所有集合进行检查：遍历字母表，检查集合里各个状态是否转换到了相同状态，如果不是，则将转换到相同状态的状态取出来组成新集合。如此循环，直到一轮检查后没有新的集合出现。

Lex 和其他类似的词法分析器中规定了两条规则以消除二义性：