PHP采集类:Snoopy.class.php
[ 2013-05-18 15:31:20 | 作者: admin ]
Snoopy是一个php采集类,用来模拟浏览器获取网页内容和发送表单。
下面是一些Snoopy特性:
容易抓取网页内容
容易抓取页面文本(去除HTML标签)
容易抓取网页内链接
支持代理抓取
支持基本的用户名、密码认证
支持设置user-agent,referer,cookies和header内容
支持浏览器转向,和控制转向深度
能把页面中的链接转化成高质量的链接
容易提交数据和获得返还值
能追踪HTML框架
支持重定向的时候传递Cookies
Snoopy类,方法:
fetch($URI)
抓取网页的内容而使用的方法。$URI参数是被抓取网页的URL地址。抓取的结果被存储在 $this->results 中。如果你正在抓取的是一个框架,Snoopy将会将每个框架追踪后存入数组中,然后存入 $this->results。
...
阅读全文…
下面是一些Snoopy特性:
容易抓取网页内容
容易抓取页面文本(去除HTML标签)
容易抓取网页内链接
支持代理抓取
支持基本的用户名、密码认证
支持设置user-agent,referer,cookies和header内容
支持浏览器转向,和控制转向深度
能把页面中的链接转化成高质量的链接
容易提交数据和获得返还值
能追踪HTML框架
支持重定向的时候传递Cookies
Snoopy类,方法:
fetch($URI)
抓取网页的内容而使用的方法。$URI参数是被抓取网页的URL地址。抓取的结果被存储在 $this->results 中。如果你正在抓取的是一个框架,Snoopy将会将每个框架追踪后存入数组中,然后存入 $this->results。
...
阅读全文…
www服务因下列错误而停止: 系统找不到指定的路径
[ 2013-05-14 16:19:21 | 作者: admin ]
World Wide Web Publishing Service 服务因下列错误而停止: 系统找不到指定的路径
我是查出了World Wide Web Publishing Service服务没有启动,也启动不了,按照他的依存关系,把其他的服务启动了就可以了,我启动的是HTTP SSL,然后World Wide Web Publishing Service就可以用了,iis也可以了
以后遇到这个问题就将www服务依赖的服务先重启一次
我是查出了World Wide Web Publishing Service服务没有启动,也启动不了,按照他的依存关系,把其他的服务启动了就可以了,我启动的是HTTP SSL,然后World Wide Web Publishing Service就可以用了,iis也可以了
以后遇到这个问题就将www服务依赖的服务先重启一次
Discuz教程:如何恢复UCenter中误删的应用
[ 2013-05-11 15:19:17 | 作者: admin ]
Discuz!7.0是康盛创想(Comsenz)公司于2008年12月份发布的一款论坛BBS建站产品。在做站的过程中,有时会出现:UCenter后台 => 应用管理,不小心删除了某个应用的问题。本篇教程,笔者就以Discuz!应用为例来演示,这么问题的解决方法。 解决方法: UCenter后台 => 应用管理 => 添加新应用 => 自定义安装,如图:
填写 Discuz! 应用的初始化信息:
填写好应用名称,应用URL和应用类型后,点击页面底部的“提交”按钮,完成应用的添加。 UCenter后台 => 应用管理,可以看到通信失败: 点击上图中 ...
阅读全文…
阅读全文…
使用firefox调试程序时候出现 XML解析错误:未找到元素
[ 2013-05-06 15:52:46 | 作者: admin ]
当没有任何输出的情况下,在firefox会出现这个提示。
有可能使用了try catch
或者使用了Response.End(); 输出了空值
有可能使用了try catch
或者使用了Response.End(); 输出了空值
Asp.net(c#)导出有表格线的Excel
[ 2013-05-04 16:45:39 | 作者: admin ]
p.s.挺好,解决了这个问题,而且根据导出需要,可以做个判断,导出web格式时候给头部加上css。
表格用文件流的方式输出为excel。实例代码如下:
阅读全文…
表格用文件流的方式输出为excel。实例代码如下:
public static void DaochuTalbe(string TableInnerHtml, string filename)
{
StringWriter sw = new StringWriter();
sw.WriteLine(TableInnerHtml);
sw.Close();
System.Web.HttpContext.Current.Response.AddHeader("Content-Disposition", "attachment;filename=" + filename + ".xls");
...{
StringWriter sw = new StringWriter();
sw.WriteLine(TableInnerHtml);
sw.Close();
System.Web.HttpContext.Current.Response.AddHeader("Content-Disposition", "attachment;filename=" + filename + ".xls");
阅读全文…
关于vsftpd的被动模式与IPTABLES策略
[ 2013-04-30 17:52:10 | 作者: admin ]
关于ftp的被动模式与IPTABLES策略
FTP的被动模式:
PC--->21端口OK,pasv端口--->PC
在vsftpd.conf里需要定义的内容:
pasv_enable=YES
pasv_min_port=9000
pasv_max_port=10000
setproctitle_enable=YES #为每个连接单独开一个进程
通常我们在linux服务器上开启iptables后,就要做相关定义:
iptables -F
iptables -X
iptables -Z
iptables -P INPUT DROP
iptables -P OUTPUT DROP
iptables -P FORWARD ACCEPT
iptables -t filter -A INPUT --dport 21 -j ACCEPT
...
阅读全文…
FTP的被动模式:
PC--->21端口OK,pasv端口--->PC
在vsftpd.conf里需要定义的内容:
pasv_enable=YES
pasv_min_port=9000
pasv_max_port=10000
setproctitle_enable=YES #为每个连接单独开一个进程
通常我们在linux服务器上开启iptables后,就要做相关定义:
iptables -F
iptables -X
iptables -Z
iptables -P INPUT DROP
iptables -P OUTPUT DROP
iptables -P FORWARD ACCEPT
iptables -t filter -A INPUT --dport 21 -j ACCEPT
...
阅读全文…
【工具和配置】Ngnix配置
[ 2013-04-29 10:47:34 | 作者: admin ]
http://blog.csdn.net/etaojoey/article/details/7933243本文主要参考了《实战Ngnix》;同时结合工作中实际使用的Ngnix部署配置进一步阐述
主要涉及如下几个部分:
1)ngnix的安装配置,这里的配置大多也可以在安装后通过配置文件置顶。
实践中TB也是在安装后进行配置的
2)ngnix的启动与停止操作。
实践中TB使用默认启动,以及-s退出。
3)ngnix的基本配置。包括:日志格式设置,虚拟主机设置,压缩设置,浏览器缓存设置。
实践中TB对于这几点也有配置,其中日志格式、虚拟主机的设置时重点。其中虚拟主机设置还与ngnix反向代理等配置相关,在后面会详述。
4)ngnix配置中常用的rewirte功能。
实践中TB也有这样的配置,比如针对爬虫的处理......
5) ngnix反向代理,负载均衡配置。...
阅读全文…
阅读全文…
linux 文件权限修改,用户与用户组管理
[ 2013-04-29 10:36:53 | 作者: admin ]
【
系统内有关组的信息放在/etc/group文件中,用户的信息放在/etc/passwd文件中。现在我要查看一个名为"Plants"的组内的所有用户。
首先,要知道组的id,即gid。使用命令:
grep 'Plants' /etc/group
www.2cto.com
显示结果是:Plants:x:1003
说明gid是1003(我的电脑上这个组1003,其他的电脑也可能是其他的数字)。
然后在/etc/passwd中查找组号是1003的用户。可以先用cat /etc/passwd查看一下这个文件,发现第四列是gid(两列之间用“:”分开)。接下来,输入:
awk -F":" '{print $1"\t\t"$4}' /etc/passwd | grep '1003'
“:”表示用":"作为分隔符(/etc/passwd中用":"作为分隔符的);print 打印;$1和$4分别表示第一列和第四列,及用户名和组号; ...
阅读全文…
系统内有关组的信息放在/etc/group文件中,用户的信息放在/etc/passwd文件中。现在我要查看一个名为"Plants"的组内的所有用户。
首先,要知道组的id,即gid。使用命令:
grep 'Plants' /etc/group
www.2cto.com
显示结果是:Plants:x:1003
说明gid是1003(我的电脑上这个组1003,其他的电脑也可能是其他的数字)。
然后在/etc/passwd中查找组号是1003的用户。可以先用cat /etc/passwd查看一下这个文件,发现第四列是gid(两列之间用“:”分开)。接下来,输入:
awk -F":" '{print $1"\t\t"$4}' /etc/passwd | grep '1003'
“:”表示用":"作为分隔符(/etc/passwd中用":"作为分隔符的);print 打印;$1和$4分别表示第一列和第四列,及用户名和组号; ...
阅读全文…