浏览模式: 普通 | 列表
5月, 2013 | 1

PHP判断字符串中是否含有中文

[ 2013-05-18 17:25:43 | 作者: admin ]
自从有了黑帽SEO,对付SPAM(垃圾留言)一直是网站工作人员的工作内容之一。迫害我们的不是垃圾留言群发机,就是垃圾用户注册机。

判断字符串中是否含有中文是对付SPAM的方法之一,可以有效的阻止纯英文的垃圾留言,还可以用这个方法规范用户注册。看下面的代码,兼容gb2312和utf-8。

<? $str = "测试中文";
echo $str; echo "<hr>";
//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用
//if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8 //判断字符串是否全是中文
if (preg_match("/[\x7f-\xff]/",
...

阅读全文…

PHP采集类:Snoopy.class.php

[ 2013-05-18 15:31:20 | 作者: admin ]
Snoopy是一个php采集类,用来模拟浏览器获取网页内容和发送表单。

下面是一些Snoopy特性:

        容易抓取网页内容
        容易抓取页面文本(去除HTML标签)
        容易抓取网页内链接
        支持代理抓取
        支持基本的用户名、密码认证
        支持设置user-agent,referer,cookies和header内容
        支持浏览器转向,和控制转向深度
        能把页面中的链接转化成高质量的链接
        容易提交数据和获得返还值
        能追踪HTML框架
        支持重定向的时候传递Cookies

Snoopy类,方法:

fetch($URI)

抓取网页的内容而使用的方法。$URI参数是被抓取网页的URL地址。抓取的结果被存储在 $this->results 中。如果你正在抓取的是一个框架,Snoopy将会将每个框架追踪后存入数组中,然后存入 $this->results。
...

阅读全文…
1