r - Hunspell包: spell checking for French language

标签 r dictionary spell-checking french

由于我将处理一份法语文本并对其进行分析,因此我无法将法语词典添加到 hunspell 包中。我尝试了包建议的链接,如下所示:

要手动安装词典,请将相应的 .aff 和 .dic 文件复制到 ~/Library/Spelling 或 DICPATH 中指定的自定义目录。或者,您可以将 .dic 文件的整个路径作为 dict 参数传递。一些流行的词典来源包括 SCOWL、OpenOffice、debian、github/titoBouzout 或 github/wooorm。

然而,一切都没有结果。我想要一些关于如何将法语词典添加到此包中的建议。

谢谢。

最佳答案

此解决方案应该适用于任何系统(Windows、Linux、macOS):

首先,运行这段代码下载大量wonderful dictionaries :

git clone https://github.com/titoBouzout/Dictionaries.git

记下您刚刚下载新文件的位置(因为您将在下一步中使用该位置)。

在 R 中,运行此行以加载您刚刚下载的法语词典:

library(hunspell) 
french <- dictionary("~/Dictionaries/French.dic")

现在您已经加载了法语词典,您可以立即使用它来检查法语单词的拼写:

words_to_check <- c( 
  "poule", 
  "coq", 
  "canard", 
  "cochon", 
  "âne", 
  "sldkfjsldkjf" # <- incorrect spelling should return false
  )

hunspell_check(words_to_check, dict = french)

# [1]  TRUE  TRUE  TRUE  TRUE  TRUE  FALSE

注意:这适用于任何语言,而不仅仅是法语。

关于r - Hunspell包: spell checking for French language,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73306220/

相关文章:

r - 将 NetCDF 文件中的时间维度单位从几个月更改为几个月

dictionary - 仅返回出现次数最多的元素

android - 如何在不改变NaviBar android的情况下透明状态栏

regex - 检查 R 中字符串是否为大写

r - 有条件地替换数组中的值

r - R中的平行k均值

excel - 在 B 列中获取 A 列中 `not in dictionary` 的单词

javascript - 具有多个图像的 map 区域的鼠标悬停过渡

visual-studio - 有没有一种方法可以强制Visual Studio 2008(或更低版本)使用拼写检查器进行注释?

vim - Vim 中光标下的拼写检查单词