c# - 删除波兰语的变音符号

标签 c# .net unicode diacritics polish

我正在尝试从波兰语的 pangram 中删除变音符号。我使用的代码来自 Michael Kaplan 的博客 http://www.siao2.com/2007/05/14/2629747.aspx ,但是,没有成功。

考虑以下拼图:“Pchnąć w tę łódź jeża lub ośm skrzyń fig.”。一切正常,但对于字母“?”,我仍然得到“?”。我想问题是“ł”被表示为单个 unicode 字符,并且没有后续的 NonSpacingMark。

你知道我该如何修复它吗(不依赖某些字典中的自定义映射 - 我正在寻找某种 unicode 转换)?

最佳答案

前段时间我遇到了这个解决方案,它似乎工作正常:

    public static string RemoveDiacritics(this string s)
    {
        string asciiEquivalents = Encoding.ASCII.GetString(
                     Encoding.GetEncoding("Cyrillic").GetBytes(s)
                 );

        return asciiEquivalents;
    }

关于c# - 删除波兰语的变音符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3560871/

相关文章:

c# - 调用方法时结构体值不会改变

c# - Console.WriteLine 和通用列表

c# - 数以百计的自定义用户控件创建了数以千计的用户对象

.net - 无法将 LINQ to SQL 类添加到 VS2010 中的项目

java - {L} Unicode 类别是什么?

c# - Microsoft IDE、源文件编码、BOM 和 Unicode 字符\uFEFF?

c# - Windows Phone的系统服务

c# - 如果文件已存在于 c# 中,则增加文件名

.net - 亚音速 MySQL 版本

objective-c - 网页内容问题