在groovy中使用正则表达式提取子字符串

如果我在一些文本中有以下模式:

def articleContent =  "<![CDATA[ Hellow World ]]>"

我想提取“Hellow World”部分,所以我使用以下代码来匹配它:

def contentRegex = "<![CDATA[ /(.)*/ ]]>"
def contentMatcher = ( articleContent =~ contentRegex )
println contentMatcher[0]

但是,由于正则表达式似乎没有正常工作,所以我会继续获得一个空指针异常,对于“任何文本的平静”,正确的正则表达式是什么,以及如何从字符串中收集呢?

尝试:

def result = (articleContent =~ /<!\[CDATA\[(.+)]]>/)[ 0 ]​[ 1 ]

但是我担心你正在用正则表达式解析xml.如果这个cdata是更大的有效xml文档的一部分,最好使用一个xml解析器

翻译自:https://stackoverflow.com/questions/17536921/extract-substring-using-regex-in-groovy

转载注明原文:在groovy中使用正则表达式提取子字符串