
上QQ阅读APP看书,第一时间看更新
前言
Python是简练的语言
使用像Python这样的动态类型语言编写的代码往往比用其他主流语言编写的代码更加简短。这意味着,在编程的过程中会有更少的录入工作,而且会更容易记住算法并真正领会算法的原理。
Python是易读的语言
Python不时被人们指为“可执行的伪代码”。虽然很明显这是夸大之词,但是它表明大多数有经验的程序员可以读懂Python代码并领会代码所要表达的意图。
Python是易安装的语言
要搭建Python的环境非常容易,不管是Windows、Linux还是Mac系统,只要配置好Python的环境,只需要easy_install XX或者pip install XX就可以安装所需要的第三方扩展包。
Python是易扩展的语言
Python附属了很多标准库,涉及数据函数、XML解析以及网页下载、RSS解析、SQLLite等,可以解决现实中遇到的各种问题。
为什么用Python实现网络爬虫
基于上述优点,加上抓取网页文档的接口更简洁;相比其他动态脚本语言,如Perl、Shell,Python的urllib2包提供了较为完整的访问网页文档的API,以及抓取后的处理方法,比如筛选HTML标签、提取文本等。Python的相关扩展可以用极短的代码完成大部分文档的处理。