cocoa - 文本自动大小写转换

标签 cocoa nlp

从远程数据源我得到文本半字节(通常不超过 100 个字符),它们都是大写的。这主要是自然语言,但散布着首字母缩略词和标点符号(如 + 和 -)。我想做的是将这段文本转换成可读的形式,也就是说,除了首字母缩略词外,大部分内容都小写,并正确地将名词和名称大写(这是针对德语的,其中大写的单词比,例如,英文)。

我更喜欢 Cocoa (OS X) 的解决方案,但欢迎任何其他方法。我读到了 NSLinguisticTagger (例如 in this question ),但似乎标记单词高度依赖于已经正确大写的单词。

最佳答案

我会分两次完成。首先将其全部转换为小写(句子开头除外),然后对其进行拼写检查。这有望将大多数专有名词和首字母缩略词变成大写。

这只是如果您想使用现有的 Cocoa 框架。

关于cocoa - 文本自动大小写转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21086519/

相关文章:

pip - 无法安装文本

python - 从 'train model from_config' 导入 'deeppavlov.core.commands.train' 时出错

mysql - 如何检查一个字符串是否看起来是随机的,或者是人为生成的和发音的?

machine-learning - 在这种情况下,从自然语言输入中提取意图的正确方法是什么?

cocoa - Hillegass : Cocoa Prog 3rd Ed: Ch. 33 在 OpenGL : Where's the Matrix? 上

objective-c - SimpleFTPSample - 如果用户名有空格则登录不正确

cocoa - 更改 CALayer 属性 : EXC_BAD_INSTRUCTION

objective-c - CoreData主应用和后台进程,数据相同

cocoa - 可以在 NSBezierPath 上设置工具提示

machine-learning - 基于CSV文件的搜索引擎