我的目标是编写一个智能聊天机器人。他应该保存人脑可能已知的信息。
这就是为什么我要寻找一个将数据存储为一组相关关键字的文件类型。什么文件类型或数据库系统可以达到这个目的?
更多信息:
信息输入将是维基百科、谷歌搜索和人类在对话中教授的事实。
我可以提供有关我的要求和愿望的具体信息,但我不知道是否存在解决此问题的任何方法。也许有更多有用的规范作为我的想法。
举个例子:连接应该有权重。请求信息网应该增加使用连接的权重。
我期望的是 ChatBot 可以使用数据网络获得真正的关联(或想法)。
最佳答案
作为我上述评论的扩展:
就数据表示而言,图表绝对是您想要的方式……它完美地映射到您的问题描述。
您似乎要问的是如何 [持久] 将此信息存储在磁盘(而不是内存)上。这完全取决于您需要什么约束。有一个“图形数据库”比关系或层次数据库更适合存储图形,并且比将邻接矩阵或列表推送到平面文件的性能要好得多。这是维基百科条目:
http://en.wikipedia.org/wiki/Graph_database
现在的问题是,当你有太多的节点和边缘时,你不能一次将它们全部加载到内存中,不幸的是,如果你有连接到每个其他节点的节点,那可能是一个问题(因为你将无法加载完整/有效的图表。我现在无法回答这个问题,但我确信有解决这个问题的范例。我会在一些挖掘后更新我的答案。
编辑 - 您可能需要咨询对图形数据库了解更多的人。有可能有一些方法可以从数据库中加载图 block ,而无需加载整个图。如果那是你的问题,你可能想修改一个关于使用存储在图形数据库中的大图形的问题并再次发布,标记为 graphs
,databases
,algorithms
之类的东西,然后以更具体的方式再次发布。
关于database - 将信息保存为数据网,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8930658/