php采集实现

用PHP实现采集

第一步,当然是如何去抓取对方网页的源代码

很多人第一反应可能就是用fread file_get_contents 来抓取,我这里是推荐使用curl来采集网页,原因有2:

1.curl功能强大,可以发送GET,POST请求,可以模拟头信息,cookie实现登陆对方站点,还可以设置代理模式,隐蔽自己的IP。

2.curl速度快,未测试。


curl的简单教程:http://my.oschina.net/cxz001/blog/95554


第二步:

截取指定区域的代码,用正则取出自己想要的内容,此处省略……


--完--

你可能感兴趣的:(php采集)