Clojure中的大量XML

我是Clojure的新人,我的第一个项目必须处理巨大的(250 GB)XML文件.我想把它放到PostgreSQL中来处理它,但是不知道如何处理这么大的文件.
我使用新的clojure.data.xml来处理一个适用于笔记本电脑的31GB维基百科转储.旧的lazy-xml contrib库没有为我工作(跑出内存).

https://github.com/clojure/data.xml

简化示例代码:

(require '[clojure.data.xml :as data.xml]) ;'

(defn process-page [page]
  ;; ...
  )

(defn page-seq [rdr]
  (->> (:content (data.xml/parse rdr))
       (filter #(= :page (:tag %)))
       (map process-page)))
翻译自:https://stackoverflow.com/questions/9939844/huge-xml-in-clojure

转载注明原文:Clojure中的大量XML