瀚海星空

星空浩瀚 人类渺小

给老婆写的将html转成txt文本的程序

老婆想在ipad读点小说,但我手头的是html版的,有几十个html文件。写点python代码,用beautifulsoup将其转成txt文本,并合并成一个文件,生成目录。 #!/usr/bin/env python # encoding:utf8 # author:zhouhh # date:2012.11.20 from bs4 import BeautifulSoup import ...

open flash chart2 同一页显示两个图形的方式

周海汉 2012.11.23 一、chart2_1.php 同时显示两个图: <?php include ‘openflash/php-ofc-library/open-flash-chart.php’; $title = new title( date(“D M d Y”) ); $bar = new bar(); $bar->set_values( array(9...

ubuntu 12.04 mysql 修改支持utf8 重启失败

周海汉 2012.11.21 ubuntu 12.04 mysql 修改支持utf8 重启失败,无log。 root@zhh:/var/log# service mysql start start: Job failed to start 只要在/etc/mysql/my.conf的[mysqld]段下添加default-character-set=utf8,启动就失败,去掉启动就成功。...

在ubuntu 12.04 lts server上安装scrapy

vi /etc/apt/sources.list 将cdrom的注释去掉。并将iso放虚拟光驱中。ubuntu-12.04.1-server-i386.iso apt-get install build-essential 安装编译工具 安装python setuptools wget http://pypi.python.org/packages/2.7/s/setuptools/set...

django 读取mysql中文乱码问题

mysql> show variables like "char%"; +--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+--------------...

用pyquery抓取分析北京房地产成交数据

#!/usr/bin/env python #coding:gbk #author:周海汉 #note:分析北京住房和城乡建设委员会每天房产成交数据 import urllib2 import sys import os import datetime import time import shutil from pyquery import PyQuery as pq fn = "1....

django 在centos5.5上的安装

周海汉 2012.11.6 [zhouhh@Hadoop47 ~]$ cat /etc/redhat-release CentOS release 5.5 (Final) 下载django [zhouhh@Hadoop47 ~]$ wget https://www.djangoproject.com/download/1.4.2/tarball/ [zhouhh@Hadoop47 ...

beautifulsoup4 用于分析网页

安装: [zhouhh@Hadoop48 ~]$ sudo pip install beautifulsoup4 beautifulsoup4 对css等处理相当强大,提供了新的select方法。 使用: 在scrapy中使用 #!/usr/bin/env python # coding:utf-8 # author:zhouhh # date:2012.11.1 import sys...

python beautifulsoup 用于分析网页示例

周海汉 http://abloz.com 2012.10.31 听说11.3要来暖气? beautifulsoap只有一个py文件,但功能强大,可分析不完整的html页面。下面是用法示例。 安装: [zhouhh@Hadoop48 test1]$ sudo pip install BeautifulSoup 或者去官网下载:http://www.crummy.com/software/Be...

scrapy 试用

周海汉 http://abloz.com 上一篇文章讲了《scrapy 安装》,解决了openssl编译不通过的问题。本篇对scrapy进行试用。 [zhouhh@Hadoop48 python]$ scrapy startproject test [zhouhh@Hadoop48 test]$ find . . ./scrapy.cfg ./test ./test/items.py ...