(no commit message)
[utils] / crawler / basic / src / main / java / org / wamblee / crawler / GetPageRequest.java
1 /*
2  * Copyright 2005 the original author or authors.
3  * 
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  * 
8  *      http://www.apache.org/licenses/LICENSE-2.0
9  * 
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 package org.wamblee.crawler;
18
19 import java.io.IOException;
20
21 import javax.xml.transform.TransformerException;
22
23 import org.apache.commons.httpclient.HttpClient;
24 import org.apache.commons.httpclient.HttpMethod;
25 import org.apache.commons.httpclient.NameValuePair;
26 import org.apache.commons.httpclient.methods.GetMethod;
27 import org.w3c.dom.Document;
28 import org.wamblee.xml.XslTransformer;
29
30 /**
31  * Gets a page by issueing a get request.
32  *
33  * @author Erik Brakkee
34  */
35 public class GetPageRequest extends AbstractPageRequest {
36
37     /**
38      * Constructs the request.
39      * @param aMaxTries Maximum number of retries. 
40      * @param aMaxDelay Maximum delay before executing the request.
41      * @param aParams Request parameters to use. 
42      * @param aHeaders Request headers to use. 
43      * @param aXslt XSLT to use. 
44      */
45     public GetPageRequest(int aMaxTries, int aMaxDelay, NameValuePair[] aParams, 
46             NameValuePair[] aHeaders, String aXslt, XslTransformer aTransformer) {
47         super(aMaxTries, aMaxDelay, aParams, aHeaders, aXslt, aTransformer);
48     }
49     
50     /*
51      * (non-Javadoc)
52      * 
53      * @see org.wamblee.crawler.PageRequest#getPage(org.apache.commons.httpclient.HttpClient)
54      */
55     public Document execute(String aUrl, NameValuePair[] aParams, HttpClient aClient)
56             throws PageException {
57         HttpMethod method = new GetMethod(aUrl);
58         NameValuePair[] params = getParameters(aParams);
59         if (params.length > 0) {
60             String oldQueryString = method.getQueryString();
61             method.setQueryString(params);
62             String queryString = method.getQueryString();
63             if (oldQueryString.length() > 0) {
64                 queryString = queryString + '&' + oldQueryString;
65                 method.setQueryString(queryString);
66             }
67         }
68         try {
69             return executeMethod(aClient, method);
70         } catch (TransformerException e) {
71             throw new PageException("Transformation problem for url " + aUrl, e);
72         } catch (IOException e) { 
73             throw new PageException("Problem getting " + aUrl, e);
74         }
75     }
76
77 }