added support for configuring request headers.
[utils] / crawler / basic / src / org / wamblee / crawler / GetPageRequest.java
index 3da77b83899eac83a9cc2851300f4fb6b1cc9d61..40a3421167fafb0f0a3f08e19fbb994912177bc2 100644 (file)
@@ -16,7 +16,7 @@
 
 package org.wamblee.crawler;
 
-import java.io.PrintStream;
+import java.io.IOException;
 
 import javax.xml.transform.TransformerException;
 
@@ -25,6 +25,7 @@ import org.apache.commons.httpclient.HttpMethod;
 import org.apache.commons.httpclient.NameValuePair;
 import org.apache.commons.httpclient.methods.GetMethod;
 import org.w3c.dom.Document;
+import org.wamblee.xml.XslTransformer;
 
 /**
  * Gets a page by issueing a get request.
@@ -36,24 +37,14 @@ public class GetPageRequest extends AbstractPageRequest {
      * @param aMaxTries Maximum number of retries. 
      * @param aMaxDelay Maximum delay before executing the request.
      * @param aParams Request parameters to use. 
+     * @param aHeaders Request headers to use. 
      * @param aXslt XSLT to use. 
      */
-    public GetPageRequest(int aMaxTries, int aMaxDelay, NameValuePair[] aParams, String aXslt) {
-        super(aMaxTries, aMaxDelay, aParams, aXslt, null);
+    public GetPageRequest(int aMaxTries, int aMaxDelay, NameValuePair[] aParams, 
+            NameValuePair[] aHeaders, String aXslt, XslTransformer aTransformer) {
+        super(aMaxTries, aMaxDelay, aParams, aHeaders, aXslt, aTransformer);
     }
-
-    /**
-     * Constructs the request.
-     * @param aMaxTries Maximum number of retries. 
-     * @param aMaxDelay Maximum delay before executing the request.
-     * @param aParams Request parameters to use. 
-     * @param aXslt XSLT to use.
-     * @param aOs Logging output stream to use.  
-     */
-    public GetPageRequest(int aMaxTries, int aMaxDelay, NameValuePair[] aParams, String aXslt, PrintStream aOs) {
-        super(aMaxTries, aMaxDelay, aParams, aXslt, aOs);
-    }
-
+    
     /*
      * (non-Javadoc)
      * 
@@ -74,7 +65,9 @@ public class GetPageRequest extends AbstractPageRequest {
         try {
             return executeMethod(aClient, method);
         } catch (TransformerException e) {
-            throw new PageException(e.getMessage(), e);
+            throw new PageException("Transformation problem for url " + aUrl, e);
+        } catch (IOException e) { 
+            throw new PageException("Problem getting " + aUrl, e);
         }
     }