9a9d02e4ed2536f8619bc7f23dc13fac67255754
[utils] / crawler / basic / src / org / wamblee / crawler / GetPageRequest.java
1 /*
2  * Copyright 2005 the original author or authors.
3  * 
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  * 
8  *      http://www.apache.org/licenses/LICENSE-2.0
9  * 
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 package org.wamblee.crawler;
18
19 import java.io.PrintStream;
20
21 import javax.xml.transform.TransformerException;
22
23 import org.apache.commons.httpclient.HttpClient;
24 import org.apache.commons.httpclient.HttpMethod;
25 import org.apache.commons.httpclient.NameValuePair;
26 import org.apache.commons.httpclient.methods.GetMethod;
27 import org.w3c.dom.Document;
28
29 /**
30  * Gets a page by issueing a get request.
31  */
32 public class GetPageRequest extends AbstractPageRequest {
33
34     public GetPageRequest(int aMaxTries, int aMaxDelay, NameValuePair[] aParams, String aXslt) {
35         super(aMaxTries, aMaxDelay, aParams, aXslt, null);
36     }
37
38     public GetPageRequest(int aMaxTries, int aMaxDelay, NameValuePair[] aParams, String aXslt, PrintStream aOs) {
39         super(aMaxTries, aMaxDelay, aParams, aXslt, aOs);
40     }
41
42     /*
43      * (non-Javadoc)
44      * 
45      * @see org.wamblee.crawler.PageRequest#getPage(org.apache.commons.httpclient.HttpClient)
46      */
47     public Document execute(String aUrl, HttpClient aClient)
48             throws PageException {
49         HttpMethod method = new GetMethod(aUrl);
50         if (getParameters().length > 0) {
51             String oldQueryString = method.getQueryString();
52             method.setQueryString(getParameters());
53             String queryString = method.getQueryString();
54             if (oldQueryString.length() > 0) {
55                 queryString = queryString + '&' + oldQueryString;
56                 method.setQueryString(queryString);
57             }
58         }
59         try {
60             return executeMethod(aClient, method);
61         } catch (TransformerException e) {
62             throw new PageException(e.getMessage(), e);
63         }
64     }
65
66 }