http - 懒惰地消费http请求

标签 http clojure lazy-evaluation side-effects

我正在尝试丰富数据,为此我可用的界面是一个 Web 表单。 由于远程端的数据质量很差,我进行了一系列不同的搜索,直到找到匹配项。有时我会在第一个请求上找到结果,有时即使我尝试了 5 次不同的搜索也找不到任何东西。

我想我可以使用 Clojures 惰性来缩短第一场比赛的搜索,但显然由于副作用,每次都要求所有 5 种不同的搜索。

这是我的问题的一个非常简单的再现:

(ns lazy-web-lookup.core
  (:require [clj-http.client :as http]))

(defn found?
  "Determines if the search was successful"
  [result]
  (= (:found result) "yes"))

(first (filter #(found? %) (map #(hash-map :no %
                                           :found (:body (http/get "http://localhost/random"))) [1 2 3 4 5])))

http://localhost/random 随机返回字符串“yes”或“no”。

无论如何我可以调整上面的内容来做我想做的事,还是我找错了树?

最佳答案

实际上只有chunked seqs 是分批实现的(通常1)32 个元素。一次实现一个非分块序列。 mapfilter 等函数保留其 seq 参数的分块/非分块“模式”。

因此,如果您确保将非分块序列传递给它们,您就可以使用常规的 Clojure 序列函数而不会影响任何惰性。这里有两种可能的方法,其中第二种可能更适用于您的情况:

  1. 生成你的序列而不考虑它是否会被分块;然后,如果它恰好被分块,将其包装在“unchunking seq”中:

    (defn unchunk [xs]
      (lazy-seq
        (if-let [xs (seq xs)]
          (cons (first xs) (unchunk (rest xs))))))
    
    user=> (->> (range 40) (unchunk) (map #(println "THIS IS" %)) first)
    THIS IS 0
    
    user=> (->> (range 40) (map #(println "THIS IS" %)) first)
    THIS IS 0
    THIS IS 1
    THIS IS 2
    ...
    

    要将此方法用于问题文本中的示例,您必须对向量 [1 2 3 4 5] 上的 seq 进行分块。

  2. 以某种不会碰巧将输出分块的方式生成您的初始序列(转换管道中最里面的序列)。这可能涉及明确编写您自己的生产者:

    (defn my-seq-producer [& args]
      (lazy-seq
        (if ...
          (cons (foo) (my-seq-producer ...))))
    

    这里要注意的关键是您将 cons 调用包装在 lazy-seq 内的条件中。如果conditional中的test不满足,conditional会产生nil,lazy seq实现后会变成空;否则 (foo) 将作为输出的第一个元素生成,随后是序列的“其余”部分,没有任何分块。

    特别是,如果您自己编写通过 HTTP 获取的惰性序列的生产者,您将能够使用核心序列函数对其进行转换,同时保持完全惰性。

区分哪个 seq 是分块的,哪个不是分块的最简单方法是使用 chunked-seq? 函数,尽管有两个注意事项:

  1. 您可能应该对调用 seq 的结果使用 chunked-seq? 对您感兴趣的任何 seq,而不是原始 seq 本身。这是因为您的 seq 可能是一个包装在 LazySeq 对象中的分块序列生成 thunk。事实上,range就是这种情况。

    (chunked-seq? (range 40))
    ;= false
    
    (chunked-seq? (seq (range 40)))
    ;= true
    
  2. seq 可以被部分分块;例如,您可以将某些内容 cons 放在分块序列的前面,从而生成一个未分块的序列,但它仍然具有分块的“其余部分”。显式分块处理很愉快,因为它并不真正检查底层序列是否分块。


1 考虑尾部长度小于 32 个元素的向量上的序列。

关于http - 懒惰地消费http请求,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15986717/

相关文章:

Angularjs 和 HTTP header

java - 我可以在不重新启动 JVM 的情况下在 JavaFX 8 中重新加载样式表吗?

string - 是否有一些 Clojure 库具有充当 Java 的 StringUtils.defaultIfBlank(str, default) 的功能?

scala - 为什么这个不可变的双向链表实现会溢出堆栈

c# - 是否有与 IEnumerable<KeyValuePair<TKey, TValue>> 相同的结构?

http - 我们如何跨所有浏览器控制网页缓存?

java - 如何比较java中的两个URL?

java - 使用 Android 发送 HTTP Post 请求

matrix - 将clojure矩阵拼接成四等分

haskell - 具有惰性评估和内存消耗的蛮力