java - java中比较文本的API

标签 java elasticsearch string-comparison

我有一个java网络服务,各种服务使用它来向mongodb插入数据。但由于数据是重复的,我们提出了一个解决方案,在插入 mongodb 之前创建一个键值对数据并检查它是否已经存在。 但比较如此多的字符串是一项艰巨的任务,并且需要花费大量时间。

  1. 我们是否有任何库/API 可用于更快的比较。
  2. Elasticsearch是为了搜索,它也适合文本比较吗?

我的字符串示例

“消息:WSClient.FetchReservation::WS FetchReservation 称为System.Net.WebException:操作已超时,位于 System.Web.Services.Protocols.WebClientProtocol.GetWebResponse(WebRequest 请求),位于 System.Web.Services.Protocols.HttpWebClientProtocol.GetWebResponse(WebRequest 请求),位于 System.Web.Services.Protocols.SoapHttpClientProtocol.Invoke(字符串方法名称,对象) ] 参数)位于 BOTWSClient.ChannelDirectWS.YieldGain.fFetchReservation(String strReservationXML),位于 BOTWSClient.WSClient.FetchReservation(String RequestXML)”

最佳答案

如果文本完全相同,您可以对其进行哈希处理并比较哈希值。如果您没有太多条目,sha1 就足够了。

JonasCz说,请更新您的问题,以便我们知道文本是否完全相同(我的解决方案可以工作)或相似(我的解决方案不起作用)。

关于java - java中比较文本的API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30118205/

相关文章:

ruby-on-rails - elasticsearch-rails 不是地理点字段错误

elasticsearch - Elasticsearch-聚合多层次结构

c - C语言中如何比较多个字符串

android - 无法在android中比较两个字符串

java - Hibernate集合持久化

java - Struts 2 Action 中的 Android GCM 服务器

java - 将目录建模为队列的数据结构

java - 在 case 条件下使用 char 的 switch 语句?

elasticsearch - Elasticsearch节点是否保留索引的完整副本?

java - 与具有空格的字符串进行比较