分类: 未分类

64 篇文章

Aliyun ddns client
万网注册的域名有福了,背靠阿里这个大金主,最近推出了不少有用的功能,甩出新网之类的域名注册商不止一条街了。朋友之前一直使用DNSPod和花生壳来构筑VPN内网的域名解析,可TPLINK自带的路由器花生壳功能太不稳定了,DNSPod也拒绝加入那些免费的二级域名了,只能想看看有没有办法在他已有的域名上实现DDNS的二级域名解析了。凑巧看见万网和阿里云推…
Expand disk online in linux
If the disk you used is a iscsi/SAN disk Backup whole data on the old diskChange the disk size in storage size     Export the disk to the Linux OS again(usually reboot to reco…
How to open a secure door in intranet for internet
Sometimes we want to access intranet resouces from outside internet world, how can we do this? The usual way is using VPN. But if we don't want to set VPN tunnel, is there any…
Oracle VM3 inside FAQ
How to use mysql client connect to ovm manager mysql db? $ mysql -u root -S /u01/app/oracle/mysql/data/mysqld.sock -p Enter password: [admonition]please input db password whil…
How to setup forward proxy with authentication in Apache
There are many proxy software, squid is the popular one, but I don't want to install it as I can reuse the Apache's proxy function. Below I will introduce how to setup the for…
Linux终端下翻墙教程
(1) 配置和安装Shadowsocks 安装Shadowsocks pip install shadowsocks 配置Shadowsocks { "server":"Shadowsocks Server", "server_port":443, "local_address": "127.0.0.1", "local_port":1080, "…
Web抓取分析机器人连载(七)
啰里啰嗦写了好几篇了,也不知道对大家有没有帮助,这一篇应该是该系列教程的最后一篇了,希望有个好的结尾!上一篇中我们简单介绍了解析新闻索引中的新闻版块,新闻标题和新闻URL的信息,这一篇我们将根据这些信息来逐步获取真正的新闻内容。 首先,我们重新定义一个函数来获取长沙晚报新闻网的带绝对路径的URL地址,总共有两个URL,一个是新闻索引URL,一个是新…
Web抓取分析机器人连载(六)
上一篇中我们介绍了怎样用lxml和xpath来获取蓝色、绿色和棕色表格,这一篇我们将进入实质性的分析过程。 我们所抽取的信息的内容分为这么三种: 新闻版块名称 某新闻版块下的新闻标题 某新闻版块下的新闻URL 我们用python的字典来表示它们之间的关系。 A版块下的新闻列表['新闻标题A'] = 新闻的URL, 新闻版块列表[‘新闻版块A'] =…
Web抓取分析机器人连载(五)
上一篇中我们通过Firebug定位到了想要分析的内容以及其在HTML页面中处于一个什么样的位置。这一篇我们将详细介绍怎样用lxml来解析HTML页面。 lxml库的安装和配置 本人在Linux机器上开发,Linux操作系统是Oracle Linux 6 update 2, 使用下面最简单的方法安装lxml. #easy_install lxml 其…
Web抓取分析机器人连载(四)
在上一篇教程中,我们简单介绍了httpfox的使用方法,这里我补充一下,httpfox是firefox浏览器的一个插件, 前提是你必须安装firefox浏览器。这里我强烈建议希望继续这篇教程的同学马上安装firefox浏览器(或者Chrome),它简直是web开发必不可少的神兵利器。 除了可以辅助web开发,我觉得它也可以作为平时浏览网站所主要使用…