使用Python删除子字符串

我已经从论坛中提取了一些信息.这是我现在的原始字符串:

string = 'i think mabe 124 + <font color="black"><font face="Times New Roman">but I don\'t have a big experience it just how I see it in my eyes <font color="green"><font face="Arial">fun stuff'

我不喜欢的是子字符串“< font color =”black“>< font face =”Times New Roman“>”和“< font color =”green“>< font face =”Arial“>”.我确实想要保留字符串的其他部分,除了这一点.所以结果应该是这样的

resultString = "i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff"

我该怎么做?其实我用美丽的汤从论坛上提取上面的字符串.现在我可能更喜欢正则表达式来删除该部分.

import re
re.sub('<.*?>', '', string)
"i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff"

re.sub函数需要定期的表示,并用第二个参数替换字符串中的所有匹配项.在这种情况下,我们正在搜索所有标签(‘<.*?>‘),并以no(”)替换它们.

的?用于非贪婪搜索.

更多关于re module.

代码日志版权声明:
翻译自:http://stackoverflow.com/questions/8703017/remove-sub-string-by-using-python

转载注明原文:使用Python删除子字符串