浏览模式: 普通 | 列表
12月, 2011 | 1

php抓取远程页面与代码解析

[ 2011-12-02 12:18:53 | 作者: admin ]
在做一些天气预报或者RSS订阅的程序时,往往需要抓取非本地文件,一般情况下都是利用php模拟浏览器的访问,通过http请求访问url地址, 然后得到html源代码或者xml数据,得到数据我们不能直接输出,往往需要对内容进行提取,然后再进行格式化,以更加友好的方式显现出来。

下面先简单说一下本文的主要内容:



一、 PHP抓取页面的主要方法:

1. file()函数 2. file_get_contents()函数 3. fopen()->fread()->fclose()模式 4.curl方式 5. fsockopen()函数 socket模式 6. 使用插件(如:http://sourceforge.net/projects/snoopy/)



二、PHP解析html或xml代码主要方式:

1. 正则表达式 2. PHP DOMDocument对象 ...

阅读全文…
1