我正在尝试为这种格式的字符串解析 HTML 文件:
<a href="/userinfo/userinfo.aspx?ID=305157" target="main">MyUsername</a> O22</td>
我想检索“305157”、“我的用户名”和“O22”中第一个字母(可以是 T、K 或 O)的信息。
我正在使用这个正则表达式; <a href="/userinfo/userinfo\.aspx\?ID=\d*" target="helgonmain">\w*</a> \w\d\d
只要“\w”所在的位置没有任何 åäöÅÄÖ,它就可以正常工作。
我该怎么办?
最佳答案
您可以使用专门包含这些内容的字符类:
[\wåäöÅÄÖ]*
或者您可以对字母使用 Unicode 字符类:
\p{L}
或专门针对拉丁语:
\p{InBasicLatin}
关于C# Regex - 如何解析瑞典字母 åäöÅÄÖ 的字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1786164/