python - 从 python 中的字符串中删除有源数字

标签 python regex unicode

我想从字符串中移除数字的幂。我怎样才能做到这一点? 例如数字是:

我知道它的 Unicode 是 :1\u2071

我发现了这个:

 text = re.sub("(\([^)]*\)|\w)\^(\([^)]*\)|\w)", ' ', text)

但不起作用。

最佳答案

您发现的内容似乎与 x^y 等表达式匹配,其中上标用 ^ 字符表示。

但是,您尝试匹配的字符串使用了实际的上标字符,这些字符仅限于:

²³¹⁰ⁱ⁴⁵⁶⁷⁸⁹⁺⁻⁼⁽⁾ⁿ

因此,您可以只用这些创建一个字符类:

\d+[²³¹⁰ⁱ⁴⁵⁶⁷⁸⁹⁺⁻⁼⁽⁾ⁿ]+

Demo

关于python - 从 python 中的字符串中删除有源数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57553721/

相关文章:

python - 如何使用 subprocess.Popen 在另一个文件中运行方法,同时传入多个字典?

python - 如何在 sklearn 中使用 SVC 运行 RFECV

postgres 数组的正则表达式

Java:如何获取字符(或其类型类别)的 Unicode 名称?

python - 在电子邮件正文中附加列表或 for 循环的内容

Python - 交换行和列,同时用它创建字典

javascript - 用于验证字符串开头和结尾处的连字符 (-) 的正则表达式

Python正则表达式引擎字符类中的转义括号

linux - 如何处理 XeLaTeX 文档中的 unicode 字符串?

unicode - 如何在unicode中表示理货/五条门?