Python 正则表达式匹配我不想要的字符串

Python regex matching on strings I don’t want

本问题已经有最佳答案，请猛点这里访问。

这是我第一次尝试将正则表达式与 Python 一起使用，或者根本没有，但它没有按预期工作。我想要一个正则表达式匹配任何字母字符或下划线作为第一个字符，然后是任意数量的字母数字字符或下划线。我使用的正则表达式是 ‘^[a-z_,AZ][a-z_A-Z0-9]*’，它似乎在 pythex.org 上产生了我想要的东西，但在我的代码中它匹配的是我所做的字符串不想要。

我的代码如下：

1 2	isMatch = re.match(‘^[a-z_A-Z][a-z_A-Z0-9]*’, someString) return True if isMatch else False

两个我不想要的匹配字符串示例是：”qq-q”和”va[r”。我做错了什么？

相关讨论

告诉我们 someString 是什么
好吧，前两个字符完全符合预期，其中一个是 [a-z_A-Z] 匹配，然后是 [a-z_A-Z0-9] 匹配。这两个条件后面的 * 表示前面的语句可以重复零次或多次。该模式将字符串的开头部分匹配为有效，然后忽略其余部分，因为您缺少结尾 $ 或任何其他模式以表明您希望在那里结束搜索。
如果你试图编写一个函数来检测一个字符串是否是一个有效的 Python 标识符，你可以在没有正则表达式的情况下做到这一点：试试 str.isidentifier() 方法。

我认为您只是忘记了正则表达式末尾的 $ 来指定字符串的结尾。

1	isMatch = re.match(‘^[a-z_A-Z][a-z_A-Z0-9]*$’, someString)

否则，它将匹配字符串的开头而不是整个字符串，这就解释了为什么它在 “qq-q” (“qq” 是匹配项)和 “va[r” (“va” 是一个匹配项)上起作用。

Python regex matching on strings I don’t want

猜你喜欢