我正在尝试隔离 pdf 文件中的单个单词,但是当使用 pdf-reader gem 读取文件时,文本到达时是断断续续的,就像这样
"A lit"
"tle "
"bit of tex"
"t"
所以我打算使用一些启发式方法将它们放在一起。为此,我需要一个库来检查给定的字符串是否是有效的英文单词,例如
"tree".is_english? # => true
"askdjfah".is_english? # => false
这存在吗?理想情况下,它也适用于德语文本。
如果没有,是否有一些免费的在线词典?我想如果必须的话,我可以编写自己的树结构来进行查找。
最佳答案
可以查看raspell ,甚至可以使用您喜欢的任何字典手动调用 aspell
。
关于ruby - 是否有用于检查字符串是否为有效单词的 ruby 库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2284884/