java – 正则表达式,用于查找“lastname,firstname middlename”格式

我试图找到格式“abc,def g”,这是一种名称格式“lastname,firstname middlename”.我认为最合适的方法是正则表达式,但我在Regex中没有任何想法.我尝试在正则表达式中做一些学习并尝试了一些表达但没有运气.另外一点可能在单词之间有多个空格.

这就是我试过的.但这不起作用.

(([A-Z][,]\s?)*([A-Z][a-z]+\s?)+([A-Z]\s?[a-z]*)*)

需要帮忙 !知道如何做到这一点,只有上面的表达式匹配.

谢谢 !

回答

最后我正在使用

([A-Za-z]+),\\s*([A-Za-z]+)\\s*([A-Za-z]+)

感谢大家的建议.

最佳答案
您的示例输入是“lastname,firstname middlename” – 有了这个,您可以使用以下regexp来提取lastname,firstname和middlename(另外可能有多个空格,并且可能有资本和非资本)字符串中的字母 – 所有部分都是强制性的):

String input = "Lastname,   firstname   middlename";
String regexp = "([A-Za-z]+),\\s+([A-Za-z]+)\\s+([A-Za-z]+)";

Pattern pattern = Pattern.compile(regexp);
Matcher matcher = pattern.matcher(input);
matcher.find();
System.out.println("Lastname  : " + matcher.group(1));
System.out.println("Firstname : " + matcher.group(2));
System.out.println("Middlename: " + matcher.group(3));

简短的摘要:

([A-Za-z]+)   First capture group - matches one or more letters to extract the last name
,\\s+         Capture group is followed by a comma and one or more spaces
([A-Za-z]+)   Second capture group - matches one or more letters to extract the first name
\\s+          Capture group is followed by one or more spaces
([A-Za-z]+)   Third capture group - matches one or more letters to extract the middle name

仅当您的名字仅包含拉丁字母时才有效 – 可能您应该为字符使用更开放的匹配:

String input = "Müller,   firstname  middlename";
String regexp = "(.+),\\s+(.+)\\s+(.+)";

这匹配lastname,firstname和middlename的任何字符.

如果空格是可选的(只有第一次出现可以是可选的,否则我们无法区分出firstname和middlename),那么使用*而不是:

String input = "Müller,firstname  middlename";
String regexp = "(.+),\\s*(.+)\\s+(.+)";

正如@Elliott所提到的,可能还有其他可能性,例如将String.split()或String.indexOf()与String.substring()一起使用 – 正则表达式通常更灵活,但更难维护,尤其是对于复杂表达式.

在任何一种情况下,使用尽可能多的不同输入(包括无效输入)实现单元测试,以便在修改后验证算法是否仍然有效.

转载注明原文:java – 正则表达式,用于查找“lastname,firstname middlename”格式 - 代码日志