python – 将数字字符引用表示法转换为unicode字符串

有没有标准的,最好是Pythonic的方式转换& #xxxx;一个合适的unicode字符串的符号?

例如,

מפגשי

应转换为:

מפגשי

它可以很容易地完成 – 使用字符串操作,但我想知道是否有一个标准的库.

最佳答案
使用HTMLParser.HTMLParser()

>>> from HTMLParser import HTMLParser
>>> h = HTMLParser()
>>> s = "מפגשי"
>>> print h.unescape(s)
מפגשי

这也是standard library的一部分.

但是,如果您使用的是Python 3,则必须从html.parser导入:

>>> from html.parser import HTMLParser
>>> h = HTMLParser()
>>> s = 'מפגשי'
>>> print(h.unescape(s))
מפגשי

转载注明原文:python – 将数字字符引用表示法转换为unicode字符串 - 代码日志