00d1283aeee1324705acf6661c07bd4ed30ddb80
[utils] / crawler / basic / src / org / wamblee / crawler / Crawler.java
1 /*
2  * Copyright 2005 the original author or authors.
3  * 
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  * 
8  *      http://www.apache.org/licenses/LICENSE-2.0
9  * 
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */ 
16
17 package org.wamblee.crawler;
18
19
20 /**
21  * The object that actually obtains pages based on URL. 
22  */
23 public interface Crawler {
24
25     /**
26      * Gets the content for a specific page. 
27      * @param aUrl Url of page. 
28      * @return Page to retrieve.
29      * @throws PageException In case of problems retrieving the page.
30      */
31     Page getPage(String aUrl) throws PageException;
32     
33     /**
34      * Gets the content for a specific page. 
35      * @param aUrl Url of page. 
36      * @param aType Type of page.  
37      * @return Page.
38      * @throws PageException In case of problems retrieving the page. 
39      */
40     Page getPage(String aUrl, PageType aType) throws PageException; 
41 }