我想编写一个解析器,在大量文本中搜索一些城市名称或其他地理主题。例如悉尼
、塔桥
、慕尼黑
……
我的想法是向本地数据库请求一些包含地理信息的单词(例如 http://www.geonames.org/ ,我可以在那里下载一些城市信息)如果命中,数据库会响应一些 lan 和 lon 坐标。单词必须以大写字母开头,长度必须>2
但我认为性能很差。一篇文章包含 10 到 100 个单词。 有没有更好的方法来查找有关文本的地理信息?
也许有一个包含更多地理信息的更好的数据库?
您好, 命运
最佳答案
您可能希望使用诸如 Lucene 之类的库为文本文件编制索引然后搜索列表中的每个城市。结果将为您提供文件名和术语的位置(以及周围的文本片段)
关于java - 解析文本以查找地理名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11455076/