浏览模式: 普通 | 列表

PHP采集类:Snoopy.class.php

[ 2013-05-18 15:31:20 | 作者: admin ]
Snoopy是一个php采集类,用来模拟浏览器获取网页内容和发送表单。

下面是一些Snoopy特性:

        容易抓取网页内容
        容易抓取页面文本(去除HTML标签)
        容易抓取网页内链接
        支持代理抓取
        支持基本的用户名、密码认证
        支持设置user-agent,referer,cookies和header内容
        支持浏览器转向,和控制转向深度
        能把页面中的链接转化成高质量的链接
        容易提交数据和获得返还值
        能追踪HTML框架
        支持重定向的时候传递Cookies

Snoopy类,方法:

fetch($URI)

抓取网页的内容而使用的方法。$URI参数是被抓取网页的URL地址。抓取的结果被存储在 $this->results 中。如果你正在抓取的是一个框架,Snoopy将会将每个框架追踪后存入数组中,然后存入 $this->results。
...

阅读全文…
World Wide Web Publishing Service 服务因下列错误而停止: 系统找不到指定的路径

我是查出了World Wide Web Publishing Service服务没有启动,也启动不了,按照他的依存关系,把其他的服务启动了就可以了,我启动的是HTTP SSL,然后World Wide Web Publishing Service就可以用了,iis也可以了

以后遇到这个问题就将www服务依赖的服务先重启一次

attachments/201305/14_161826_.jpg
Discuz!7.0是康盛创想(Comsenz)公司于2008年12月份发布的一款论坛BBS建站产品。在做站的过程中,有时会出现:UCenter后台 => 应用管理,不小心删除了某个应用的问题。本篇教程,笔者就以Discuz!应用为例来演示,这么问题的解决方法。   解决方法:  UCenter后台 => 应用管理 => 添加新应用 => 自定义安装,如图:     填写 Discuz! 应用的初始化信息:     填写好应用名称,应用URL和应用类型后,点击页面底部的“提交”按钮,完成应用的添加。  UCenter后台 => 应用管理,可以看到通信失败:    点击上图中 ...

阅读全文…
当没有任何输出的情况下,在firefox会出现这个提示。

有可能使用了try catch
或者使用了Response.End(); 输出了空值

Asp.net(c#)导出有表格线的Excel

[ 2013-05-04 16:45:39 | 作者: admin ]
p.s.挺好,解决了这个问题,而且根据导出需要,可以做个判断,导出web格式时候给头部加上css。

表格用文件流的方式输出为excel。实例代码如下:
                public static void DaochuTalbe(string TableInnerHtml, string filename)
                {
                     StringWriter sw = new StringWriter();
                     sw.WriteLine(TableInnerHtml);
                     sw.Close();
                     System.Web.HttpContext.Current.Response.AddHeader("Content-Disposition", "attachment;filename=" + filename + ".xls");
...

阅读全文…

关于vsftpd的被动模式与IPTABLES策略

[ 2013-04-30 17:52:10 | 作者: admin ]
关于ftp的被动模式与IPTABLES策略
FTP的被动模式:
PC--->21端口OK,pasv端口--->PC
在vsftpd.conf里需要定义的内容:
pasv_enable=YES
pasv_min_port=9000
pasv_max_port=10000
setproctitle_enable=YES #为每个连接单独开一个进程


通常我们在linux服务器上开启iptables后,就要做相关定义:
iptables -F
iptables -X
iptables -Z
iptables -P INPUT DROP
iptables -P OUTPUT DROP
iptables -P FORWARD ACCEPT
iptables -t filter -A INPUT --dport 21 -j ACCEPT
...

阅读全文…

【工具和配置】Ngnix配置

[ 2013-04-29 10:47:34 | 作者: admin ]
http://blog.csdn.net/etaojoey/article/details/7933243本文主要参考了《实战Ngnix》;同时结合工作中实际使用的Ngnix部署配置进一步阐述 主要涉及如下几个部分: 1)ngnix的安装配置,这里的配置大多也可以在安装后通过配置文件置顶。 实践中TB也是在安装后进行配置的 2)ngnix的启动与停止操作。 实践中TB使用默认启动,以及-s退出。 3)ngnix的基本配置。包括:日志格式设置,虚拟主机设置,压缩设置,浏览器缓存设置。 实践中TB对于这几点也有配置,其中日志格式、虚拟主机的设置时重点。其中虚拟主机设置还与ngnix反向代理等配置相关,在后面会详述。 4)ngnix配置中常用的rewirte功能。 实践中TB也有这样的配置,比如针对爬虫的处理...... 5) ngnix反向代理,负载均衡配置。...

阅读全文…

系统内有关组的信息放在/etc/group文件中,用户的信息放在/etc/passwd文件中。现在我要查看一个名为"Plants"的组内的所有用户。
首先,要知道组的id,即gid。使用命令:
grep 'Plants' /etc/group
    www.2cto.com
显示结果是:Plants:x:1003
说明gid是1003(我的电脑上这个组1003,其他的电脑也可能是其他的数字)。
然后在/etc/passwd中查找组号是1003的用户。可以先用cat /etc/passwd查看一下这个文件,发现第四列是gid(两列之间用“:”分开)。接下来,输入:
awk -F":" '{print $1"\t\t"$4}' /etc/passwd | grep '1003'
“:”表示用":"作为分隔符(/etc/passwd中用":"作为分隔符的);print 打印;$1和$4分别表示第一列和第四列,及用户名和组号; ...

阅读全文…