(no commit message)
[utils] / crawler / basic / src / org / wamblee / crawler / Crawler.java
index f55eebb30afc1bed9b86c73d0e29eb6dddd80cbb..00d1283aeee1324705acf6661c07bd4ed30ddb80 100644 (file)
@@ -18,7 +18,7 @@ package org.wamblee.crawler;
 
 
 /**
- * Represents a crawled page
+ * The object that actually obtains pages based on URL
  */
 public interface Crawler {
 
@@ -26,14 +26,16 @@ public interface Crawler {
      * Gets the content for a specific page. 
      * @param aUrl Url of page. 
      * @return Page to retrieve.
+     * @throws PageException In case of problems retrieving the page.
      */
-    Page getPage(String aUrl);
+    Page getPage(String aUrl) throws PageException;
     
     /**
      * Gets the content for a specific page. 
      * @param aUrl Url of page. 
      * @param aType Type of page.  
-     * @return Page. 
+     * @return Page.
+     * @throws PageException In case of problems retrieving the page. 
      */
-    Page getPage(String aUrl, PageType aType); 
+    Page getPage(String aUrl, PageType aType) throws PageException
 }