正则边界条件
-
Codex生成的正则表达式为何总错?
你给 Codex 一句“匹配所有有效邮箱地址”,它毫秒级吐出一个正则出来: /^[\w\.=-]+@[\w\.-]+\.\w{2,3}$/ 语法没问题,符号没写错,任何一个入门正则教程都可以给这个写法打满分。 但这个看似完美的表达式,会把 a@b.co.uk 拒之门外,会认为 user@domain.c 一定合法,而且完全不考虑国际域名里那些非 ASCII 字符。 十次里可能有七次,Codex 生…
你给 Codex 一句“匹配所有有效邮箱地址”,它毫秒级吐出一个正则出来: /^[\w\.=-]+@[\w\.-]+\.\w{2,3}$/ 语法没问题,符号没写错,任何一个入门正则教程都可以给这个写法打满分。 但这个看似完美的表达式,会把 a@b.co.uk 拒之门外,会认为 user@domain.c 一定合法,而且完全不考虑国际域名里那些非 ASCII 字符。 十次里可能有七次,Codex 生…