java-正则表达式去除所有方括号,但不包括在特定前缀之后的方括号

所以,我有一个字符串.在大多数情况下,如果字符串中带有方括号,则可能会发生不良情况.但是,在少数情况下,有必要保留括号.这些需要保留的括号由某个前缀标识.例如,如果字符串是:

apple][s [pears] prefix:[oranges] lemons ]persimmons[ pea[ches ap]ricots [][[]]][]

我想把它变成的是:

apples pears prefix:[oranges] lemons persimmons peaches apricots

我想出了一个Rube Goldberg解决方案,看起来像这样:

public class Debracketizer
{
    public static void main( String[] args )
    {
        String orig = "apples [pears] prefix:[oranges] lemons ]persimmons[ pea[ches ap]ricots";
        String result = debracketize(orig);
        System.out.println(result);
    }

    private static void debracketize( String orig )
    {
        String result1 = replaceAll(orig,
                                    Pattern.compile("\\["), 
                                    "",
                                    ".*prefix:$");

        String result2 = replaceAll(result1,
                                    Pattern.compile("\\]"),
                                    "",
                                    ".*prefix:\\[[^\\]]+$");

        System.out.println(result2);
    }

    private static String replaceAll( String orig, Pattern pattern, 
                                      String replacement, String skipPattern )
    {
        String quotedReplacement = Matcher.quoteReplacement(replacement);
        Matcher matcher = pattern.matcher(orig);
        StringBuffer sb = new StringBuffer();
        while( matcher.find() )
        {
            String resultSoFar = orig.substring(0, matcher.start());
            if (resultSoFar.matches(skipPattern)) {
                matcher.appendReplacement(sb, matcher.group());
            } else {
                matcher.appendReplacement(sb, quotedReplacement);
            }
        }
        matcher.appendTail(sb);
        return sb.toString();
    }
}

我确信必须有更好的方法来执行此操作-理想情况下,使用一个简单的正则表达式和一个简单的String.replaceAll().但是我还没有想到.

(我早些时候问过partial version of this question,但我看不到如何使答案适应全部情况.这将教会我提出部分问题.)

最佳答案
此一班轮:

String resultString = subjectString.replaceAll("(?<!prefix:(?:\\[\\w{0,2000000})?)[\\[\\]]", "");

适用于:apple] [s [pears]前缀:[oranges]柠檬]柿子[pea [ches ap] ricots [] [[]]] []

将为您提供您想要的结果:

apples pears prefix:[oranges] lemons persimmons peaches apricots 

您唯一的限制是前缀:[]之间的单词可以具有的最大字符数.在这种情况下,限制为2000000.该限制来自java,因为它不支持在负向后看中进行无限重复.

转载注明原文:java-正则表达式去除所有方括号,但不包括在特定前缀之后的方括号 - 代码日志