first work on page import via atom feed

[enigma2-curlytx.git] / src / AtomFeed.py
diff --git a/src/AtomFeed.py b/src/AtomFeed.py

new file mode 100644 (file)

index 0000000..07a6345
--- /dev/null
+++ b/src/AtomFeed.py
@@ -0,0 +1,41 @@
+from twisted.web.client import getPage
+from xml.etree.cElementTree import fromstring
+
+class AtomFeed:
+    """Simple XML parser that extracts pages from a atom feed
+    """
+    ns = "{http://www.w3.org/2005/Atom}"
+    def __init__(self, url, callback):
+        getPage(url).addCallback(self.parse, callback)
+
+    def parse(self, data, callback):
+        xml = fromstring(data)
+        pages = []
+        for entry in xml.findall("{0}entry".format(self.ns)):
+            titleE = entry.find("{0}title".format(self.ns))
+            url   = self.bestLink(entry.findall("{0}link".format(self.ns)))
+            if titleE != None and titleE.text != "" and url != None:
+                pages.append({"title": titleE.text, "url": url})
+
+        callback(pages)
+
+    def bestLink(self, list):
+        foundLevel = -1
+        foundHref = None
+        for link in list:
+            if link.get("rel") != "alternate" and link.get("rel") != "":
+                continue
+            level = self.level(link)
+            if foundLevel > level:
+                continue
+            foundLevel = level
+            foundHref = link.get("href")
+        return foundHref
+
+    def level(self, link):
+        type = link.get("type")
+        if type == "text/plain":
+            return 3
+        elif type == "":
+            return 2
+        return 1