我正在构建一个搜索引擎,为了很好地测试它,它需要更多的文章。它们的最佳来源是维基百科。
我搜索了一些转储,但有些是 XML(我在导入时遇到了麻烦),有些没有内容。
那么,如何获取转储,最好是 MySQL 形式。它必须是非英语语言。
有什么想法吗?
最佳答案
关于php - 如何提取和导入维基百科页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4771153/
我正在构建一个搜索引擎,为了很好地测试它,它需要更多的文章。它们的最佳来源是维基百科。
我搜索了一些转储,但有些是 XML(我在导入时遇到了麻烦),有些没有内容。
那么,如何获取转储,最好是 MySQL 形式。它必须是非英语语言。
有什么想法吗?
最佳答案
关于php - 如何提取和导入维基百科页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4771153/