C# Regex - 如何解析瑞典字母 åäöÅÄÖ 的字符串?

标签 c# regex html-parsing

我正在尝试为这种格式的字符串解析 HTML 文件:

<a href="/userinfo/userinfo.aspx?ID=305157" target="main">MyUsername</a> O22</td>

我想检索“305157”、“我的用户名”和“O22”中第一个字母(可以是 T、K 或 O)的信息。

我正在使用这个正则表达式; <a href="/userinfo/userinfo\.aspx\?ID=\d*" target="helgonmain">\w*</a> \w\d\d只要“\w”所在的位置没有任何 åäöÅÄÖ,它就可以正常工作。

我该怎么办?

最佳答案

您可以使用专门包含这些内容的字符类:

[\wåäöÅÄÖ]*

或者您可以对字母使用 Unicode 字符类:

\p{L}

或专门针对拉丁语:

\p{InBasicLatin}

关于C# Regex - 如何解析瑞典字母 åäöÅÄÖ 的字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1786164/

相关文章:

c# - WCF-C#服务应连续发送结果

c# - 为我的应用程序寻找 COM 端口嗅探器

c++ - Q正则表达式

java - Jenkins groovy 正则表达式匹配字符串 : Error: java. io.NotSerializableException : java. util.regex.Matcher

java - 如何在java中从Html中的Div标签中提取文本

javascript - 在 JavaScript 中将字符串解析为 HTML

C# WebApi 传入客户端证书始终为空

c# - 锁定文件创建的最佳方式(最佳性能)

php - 你能告诉我这个正则表达式是什么意思吗?

python - 如何删除 BeautifulSoup 中的空格