ruby – 正则表达式匹配所有字母数字主题标签,没有符号

我正在为facebook写一个hashtag scraper,而我遇到的每个正则表达式都包含标点符号以及字母数字字符.这是我想要的一个例子:

你好,世界!我是#m4king #fac_book scraper,想要一个很好的常规#expression.

我希望它匹配世界,m4king,fac和表达式(请注意,如果它到达标点符号,包括空格,我希望它切断).如果它不包含哈希符号会很好,但它并不是非常重要.

只是重要的是,我将使用ruby的字符串扫描方法来获取多个标签.

谢谢你提前!

最佳答案
像这样的正则表达式:#([A-Za-z0-9])应该匹配你需要的并将它放在一个捕获组中.然后,您可以稍后访问该组.也许this将有助于揭示正则表达式(来自Ruby上下文).

上面的正则表达式将在找到#标签时开始匹配,并将任何后续字母或数字抛出到捕获组中.一旦找到任何不是字母或数字的东西,它就会停止匹配.最后,您将得到一个包含您所追求的内容的小组.

转载注明原文:ruby – 正则表达式匹配所有字母数字主题标签,没有符号 - 代码日志