(no commit message)
authorerik <erik@77661180-640e-0410-b3a8-9f9b13e6d0e0>
Thu, 16 Mar 2006 18:56:43 +0000 (18:56 +0000)
committererik <erik@77661180-640e-0410-b3a8-9f9b13e6d0e0>
Thu, 16 Mar 2006 18:56:43 +0000 (18:56 +0000)
trunk/crawler/ABOUT.txt [new file with mode: 0644]
trunk/crawler/basic/ABOUT.txt [new file with mode: 0644]
trunk/crawler/kiss/ABOUT.txt [new file with mode: 0644]

diff --git a/trunk/crawler/ABOUT.txt b/trunk/crawler/ABOUT.txt
new file mode 100644 (file)
index 0000000..ba9a7ad
--- /dev/null
@@ -0,0 +1,2 @@
+This directory contains a generic web crawler (basic directory) and several useful implementations build on top of this.
+
diff --git a/trunk/crawler/basic/ABOUT.txt b/trunk/crawler/basic/ABOUT.txt
new file mode 100644 (file)
index 0000000..b61c613
--- /dev/null
@@ -0,0 +1,9 @@
+This is a general library for implementing a web crawler. 
+
+The crawler works by retrieving an HTML page and transforming the HTML
+(content + presentation) into content using XSLT stylesheets. Using a convention
+for links in the converted content, it becomes possible to build a generic interface on the retrieved pages for navigating through the content. 
+
+A configuration file determines how a certain page must be retrieved and transformed. 
+
+
diff --git a/trunk/crawler/kiss/ABOUT.txt b/trunk/crawler/kiss/ABOUT.txt
new file mode 100644 (file)
index 0000000..4f23b39
--- /dev/null
@@ -0,0 +1,5 @@
+This is a crawler for the KiSS Electronic Program Guide that can be used for instance with the KiSS DP558 hard-disc recorder. It uses the basic crawler for its implementation.
+
+Based on preferences for recording programs, the crawler automatically records programs that are scheduled to run on the same day. This saves a lot of manual work in recording programs. 
+
+The final idea is to define ones own interests in television programs and have the crawler record them automatically or send notifications of possibly interesting programs. Whether programs should be recorded can be determined by several criteria such as program title, channel, time of day, and keywords in the description.