ANTLR4 how do change hidden characters based on rule?
我正在尝试解析结构错误的输入文件,因为通常会跳过换行符,但在某些情况下它用于终止语句,因此有时必须匹配它。然而在这种情况下,换行符似乎成为一般的正常标记,不能被跳过。
为了说明我的问题,请考虑以下语法:
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
text
: (line ‘\ ‘)+ ; line ID : [a–zA–Z]+ WS : [ \\t\ |
在这个语法中,我想解析如下语句:
1
2 3 4 |
a b
c d (e f) |
但我收到以下错误:
1
2 |
line 3:2 extraneous input ‘\
‘ expecting {‘)’, ID} |
因为括号内的换行符没有被跳过。语法本身要复杂得多,因此不可能简单地放入”‘\\
‘?” 在任何需要它的地方。
处理此问题的最佳方法是什么?
对于我的两个建议,您需要将空格设置为隐藏通道(而不是跳过它)。
要灵活控制空格(或换行符),您可以应用以下解决方案允许空格部分 ANTLR4。您可以在语法中的每个点启用/禁用空格。
另一种方法是将 \
设置为隐藏通道,但不将其作为标记而是作为语义谓词包含在规则中。
1
2 3 |
text
: (line {/*check that the last whitespace contained a newline*/}?)+ ; |
为了实现,你可以使用 BufferedTokenStream#getHiddenTokensToRight 或 BufferedTokenStream#getHiddenTokensToLeft (两者都允许读取隐藏的频道标记)。
来源:https://www.codenong.com/29150621/