动态抓取网页,生成静态网页

package com.oop.test;

import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;

public class Test1 {
	private static String getStaticPage(String surl) {
		String htmlContent = "";
		try {
			java.io.InputStream inputStream;
			java.net.URL url = new java.net.URL(surl);
			java.net.HttpURLConnection connection = (java.net.HttpURLConnection) url
					.openConnection();
			connection.connect();
			inputStream = connection.getInputStream();
			byte[] bytes = new byte[1024 * 2000];
			int index = 0;
			int count = inputStream.read(bytes, index, 1024 * 2000);
			while (count != -1) {
				index += count;
				count = inputStream.read(bytes, index, 1);
			}
			htmlContent = new String(bytes, "UTF-8");
			connection.disconnect();
		} catch (Exception ex) {
			ex.printStackTrace();
		}
		return htmlContent.trim();
	}

	public static void main(String[] args) {
		try {
			String src = getStaticPage("http://www.google.com");
			File file = new File("d:\\aa.html");
			FileWriter resultFile = new FileWriter(file);
			PrintWriter myFile = new PrintWriter(resultFile);// 写文件
			myFile.println(src);
			resultFile.close();
			myFile.close();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}
}


什么也不说,我感觉最重要的是分享,只要是有用的东西就应该分享,也许对于一些水平高的人是没有的,但是对于一些水平一般的人还是能够学到一些东西的。很多的人都提出了很多的反对意见和程序的问题意见,可是你们就不能把你们理解是正确的东西分享出来分享一下。

你可能感兴趣的:(.net,搜索引擎,Google,网络协议,oop)