本
文
摘
要
首先这是小白的Python新手教程。
下面为大家介绍一下Python,python是一种解释型、面向对象、动态数据类型的高级程序设计语言。
Python 如今有2.x和 3.x两大版本,支持windows和mac,linux三个平台,下面的例子以python2.7版本和windows平台为例子,为大家进行演示。
1.搭建环境,
Windows平台下安装python2.7
首先登录python官方网站www.python.org下载的2.7.9版本,下载地址:
http://www.python.org/ftp/python/2.7.9/python-2.7.9.msi
然后,运行下载的MSI安装包,在选择安装组件的一步时,勾上所有的组件。
然后选择组件pip和add python.exe to path 。其中pip是python包管理工具,后期我们编写爬虫程序的包需要使用pip工具,所以必须勾选。Add python.exe to path 是配置环境变量。然后一路点击next 就可以了。
如果安装成功 会默认在c盘 根目录生成一个python27的文件夹。然后在dos窗口输入python命令,出现你安装的python的版本信息,就表示你的电脑已经成功安装了python。
2.第一个python程序
可以使用notepad++,或者自带的记事本写python代码再将记事本的txt后缀改成py,或者直接使用python IDLE写python 程序,然后输入
print “hello world”按回车
欢迎各位又打开了一扇门。
3.第一个爬虫程序了
首先python有许多完成各种需求的第三方包,其中编写爬虫程序会用到的第三方包,Requests,urllib2,httplib2三种包,下面以安装urllib2为例,教你如何安装第三方包,同样在dos 窗口 ,输入
pip install Urllib2电脑会为你自动安装 Requests包,然后开始写爬虫代码,首先最简单的爬虫。
以urllib2为例
import urllib2 url = "https://www.zhihu.com/" response = urllib2.urlopen(url) content = urllib2.urlopen(url).read() print "response headers:", response.headersprint "content:", content运行以下代码,便爬取了知乎的网页。
这就是最简单的爬虫程序,这只是第一步,接下面会更加深入的介绍python,请各位关注接下来的课程。
———————————————————————————
看完本章内容可以接着学习
教你如何爬美眉图片