objective-c - 寻找合适的词汇数据库来构建C结构

标签 objective-c c dictionary neural-network vocabulary

让我们从问题的最终目的开始:我的目标是构建一个基于单词的神经网络,该网络应该采用一个基本句子,并为每个单词选择它应该在句子本身中产生的含义。然后它将学习有关该语言的一些知识(例如两个给定单词之间可能的相关性,在单个句子中找到这两个单词的概率是多少等等),并在最后阶段(学习阶段之后)尝试构建根据一些输入,一些非常简单的句子。

为了做到这一点,我需要某种代表给定语言词汇的数据库,我可以从中提取一些信息,例如单词列表、定义、同义词等。数据库的结构应该使得我可以构建包含所需信息的 C 数据结构,例如

typedef struct _dictEntry DictionaryEntry;
typedef struct _dict Dictionary;

struct _dictEntry {
    const char *word;               // Word string
    const char **definitions;       // Array of definition strings
    DictionaryEntry **synonyms;     // Array of pointers to synonym words
    Dictionary *dictionary;         // Pointer to parent dictionary
};

struct _dict {
    const char *language;           // Language identification string
    int count;                      // Number of elements in the dictionary
    float **correlations;           // Correlation matrix between i-th and j-th entries
    DictionaryEntry *entries;       // Array of dictionary entries
};

或等效的 Obj-C 对象。

我知道(从 Searching the Mac OSX system dictionaries? )苹果提供的字典已获得许可,因此我无法使用它们来创建我的数据结构。 基本上我想做的是:给定一个任意单词 A 我想获取所有定义包含 A 的字典条目并仅选择这样的定义。然后,我将实现某种交叉程序,以根据句子的其余部分选择最合适的定义和同义词,并构建相关矩阵。

让我举一个小例子:假设我输入一个包含“play”的句子;我想获取所有与“游戏”一词相关的条目(例如“游戏”、“乐器”、“ Actor ”等),并为每个条目选择相应的定义(我不希望例如提取与“工具”含义相对应的“乐器”定义,因为您不能“玩工具”)。然后,我将查看句子的其余部分,选择这些定义中最合适的一个:如果它还包含“ Actor ”一词,那么我将为“扮演”赋予“戏剧”或其他合适的定义。 最基本的方法是扫描字典中的每个定义,搜索单词“play”,因此我需要不受限制地访问所有定义,据我所知,使用位于/Library/Dictionaries 下的字典无法完成此操作。遗憾的是,这项工作必须离线完成。

是否有任何可用资源可供我下载,使我能够掌握所有定义并获取我的信息?目前我对任何特定的文件格式(可能是数据库、xml 或其他任何东西)不感兴趣,但它必须是我可以分解并放入数据结构中的东西。我尝试用谷歌搜索它,但是,无论我使用什么关键字,如果我包含“词汇”或“词典”一词,我(很明显)只会在某些在线词典网站上获得有关其他单词定义的页面!我想这不是最好的搜索内容...

我希望问题很清楚......如果不是,我会尝试以不同的方式解释它!不管怎样,提前感谢大家提供的任何有用信息。

最佳答案

可能是一个免费的本体,例如 http://www.eat.rl.ac.uk会帮助你的。在大学领域有几个可用的。

关于objective-c - 寻找合适的词汇数据库来构建C结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14414403/

相关文章:

objective-c - 如何在带有索引的 UITableView 上显示滚动条

C 为结构体中的数组动态分配内存

c - C 中的 fread 实际上是如何工作的?

python - 将字典列表与特定值匹配相结合

ios - 使用 NSArray/PFQuery 中的数据填充表格 View 单元格

ios - 使用AV Foundation时捕获的图像方向错误

iphone - 使用 Flurry 记录 __FILE__

c - 为什么这个 Bison 代码会产生意想不到的输出?

ruby-on-rails - 如何将图标与记录链接,但将其显示在远离记录部分的位置?

indexing - 在 RavenDB 中查询嵌套字典