Python爬蟲技術(shù)是基于Python語言進(jìn)行開發(fā)的,擁有Python編程能力對于本書的學(xué)習(xí)是至關(guān)重要的,因此本章的目標(biāo)是幫助之前接觸過Python語言的讀者回顧一下Python編程中的內(nèi)容,尤其是與爬蟲技術(shù)相關(guān)的內(nèi)容。
安裝Python
Python是跨平臺語言,它可以運(yùn)行在Windows、Mac和各種Linux/Unix系統(tǒng)上。在Windows上編寫的程序,可以在Mac和Linux上正常運(yùn)行。Python是一種面向?qū)ο?、解釋型?jì)算機(jī)程序設(shè)計(jì)語言,需要Python解釋器進(jìn)行解釋運(yùn)行。目前,Python有兩個(gè)版本,一個(gè)是2.x版,一個(gè)是3.x版,這兩個(gè)版本是不兼容的?,F(xiàn)在Python的整體方向是朝著3.x發(fā)展的,但是在發(fā)展過程中,大量針對2.x版本的代碼都需要修改才能運(yùn)行,導(dǎo)致現(xiàn)在許多第三方庫無法在3.x版本上直接使用,因此現(xiàn)在大部分的云服務(wù)器默認(rèn)的Python版本依然是2.x版??紤]到上述原因,本書采用的Python版本為2.x,確切地說是2.7版本。
Windows上安裝Python
首先,從Python的官方網(wǎng)站www.python.org下載最新的2.7.12版本,地址是https://www.python.org/ftp/python/2.7.12/python2.7.12.msi。
然后,運(yùn)行下載的MSI安裝包,在選擇安裝組件時(shí),勾選上所有的組件,如圖11所示。
圖11 Python安裝界面特別要注意勾選pip和Add python.exe to Path,然后一路點(diǎn)擊
Next即可完成安裝。
pip是Python安裝擴(kuò)展模塊的工具,通常會用pip下載擴(kuò)展模塊的源代碼并編譯安裝。
Add python.exe to Path是將Python添加到Windows環(huán)境中。
安裝完成后,打開命令提示窗口,輸入python后出現(xiàn)如圖12情況,說明Python安裝成功。
當(dāng)看到提示符“>>>”就表示我們已經(jīng)在Python交互式環(huán)境中了,可以輸入任何Python代碼,回車后會立刻得到執(zhí)行結(jié)果?,F(xiàn)在,輸入exit()并回車,就可以退出Python交互式環(huán)境。
Ubuntu上的Python
本書采用Ubuntu 16.04版本,系統(tǒng)自帶了Python 2.7.11的環(huán)境,如圖13所示,所以不需要額外進(jìn)行安裝。
圖12 Python命令行窗口圖13 Python環(huán)境擁有了Python環(huán)境,但為了以后方便安裝擴(kuò)展模塊,還需要安裝pythonpip和pythondev,在shell中執(zhí)行:sudo aptget install pythonpip pythondev即可安裝,如圖14所示。
圖14 安裝pip和pythondev1.2 搭建開發(fā)環(huán)境俗話說:“工欲善其事必先利其器”,在做Python爬蟲開發(fā)之前,一個(gè)好的IDE將會使編程效率得到大幅度提高。
下面主要介紹兩種IDE:Eclipse和PyCharm,并以在Windows 7上安裝為例進(jìn)行介紹。
如對本文有疑問,請?zhí)峤坏浇涣髡搲?,廣大熱心網(wǎng)友會為你解答?。?點(diǎn)擊進(jìn)入論壇