r - 将重音字符转换为 ascii 字符

标签 r transliteration

从 1600 万个字符串变量的向量中删除德语(或法语)口音的最佳方法是什么。

例如,“干燥综合征”变成“干燥综合征”

将单个字符转换为单个字符优于音译,例如

ä => ae ö => oe ü => ue。

例如,使用正则表达式将是一种选择,但有没有更好的东西(为此使用 R 包)?
gsub('ü','u',gsub('ö','o',"Sjögren's syndrome ( über) "))
有针对非 R 平台的 SO 解决方案,但对于 R 来说不是一个好的解决方案。

最佳答案

使用 iconv使用音译转换为 ASCII(如果支持):

iconv(c("über","Sjögren's"),to="ASCII//TRANSLIT")
[1] "uber"      "Sjogren's"

关于r - 将重音字符转换为 ascii 字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13610319/

相关文章:

c# - C# 中的 Slugify 和字符音译

ios - 音译/转置 NSString 中的字符

r - 尝试使用 tm 包中的 readPDF 读取 PDF 时出错

r - 二元正态分布的离散近似

mysql - 无法连接到R中的本地MySQL服务器

javascript - 您如何在 Javascript 中映射替换字符,类似于 Perl 中的 'tr' 函数?

linux - 无法在 centos 中启动 rstudio,出现错误 "unable to connect to service"

r - 比较两个数据帧中的值并返回差异

ruby - ruby 音译

javascript - 如何通过 JavaScript 自动 Google 音译文本区域中的单词(无需手动按空格键或 Enter 键)