前言:大家跟我一起念,Python 大Fa好,跟著本寶寶用Python搶火車票!
首先我們需要splinter
安裝:
pip install splinter -i http://pypi.douban.com/simple –trusted-host pypi.douban.com
然后還需要一個瀏覽器的驅動,當然用chrome啦
下載地址:
http://chromedriver.storage.googleapis.com/index.html?path=2.20/
根據下載的自己的電腦系統選擇下載包,我的windows就用win32了
解壓后直接放到C:WindowsSystem32目錄下,你當然也可以給這個驅動程序弄個環境變量。
注意:我下的驅動版本是2.19的,根據自己需要下載相應版本,我的2.20版本有報錯
首先簡單的測試一下吧,推薦ipython代替python自帶的交互界面
from splinter.browser import Browser b = Browser(driver_name="chrome") b.visit("http://www.baidu.com") ###注意不要去掉http://
然后牛刀小試一下吧,用百度搜索一些東西。比如splinter
在上面我們已經打開百度的網址了
然后我們輸入一些像搜索的內容吧
由上可以發現,該輸入框的name=wd,通過fill似乎只能通過name填充
官方說明: Fill the field identified by name with the content specified by value.
那就在輸入框搜索splinter,當然也可以輸入中文,但是最好指定Unicode編碼,如u”我”
b.fill("wd","splinter")
有意思的事,你會發現你都不需要點擊“百度一下”就到搜索頁面了
但是,如果多次搜索,我們還是需要點擊“百度一下”的
下面就不在帶著大家找這些元素的id,value什么的了,通過chrome的F12找自己需要的吧
那么把點擊欄find出來吧
我們發現,百度搜索欄的value=”百度一下”,id=”su”
所以把這個按鈕提取出來
button = b.find_by_value(u"百度一下") 或者 button = b.find_by_id(u"su")
怎么點擊呢?簡單如下 button.click()
這有什么用?
我們找找頁面里有沒有我想找的東西吧,比如找找有沒有這個地址“splinter.cobrateam.info”
b.is_text_present("splinter.cobrateam.info")
如果該頁面存在,則返回True,反之亦然
怎么退出呢?
b.quit()
好吧,上面就是參照官方文檔寫的一個簡單的入門教程了,下面我們進入正題吧~~~
個人是覺得授人以魚不如授人以漁的,所以我盡量講解所有的內容,而非發個代碼,讓大家copy一下,然后不求甚解。
值得注意的是,我不會去說什么怎么破解驗證碼以及有什么漏洞可以利用什么的,搶過票的都知道,快一點是一點,而我要做的是就能將機器能做的交給機器做,比如點擊,查詢,選擇等,所以希望必中的還是繞過此文吧。筆者水平也就這么一點點。
首先我們用ipython講解一下思路
開始當然是導入啦。。
from splinter.browser import Browser b = Browser(driver_name="chrome") url = “https://kyfw.12306.cn/otn/leftTicket/init” b = Browser(driver_name="chrome") b.visit(url)
第一步手動登陸,能通過下面的代碼填充表單,但是我跳不過驗證碼,暫時沒有精力去研究那東西,多多見諒,所以還是等手動選擇驗證碼的。
b.find_by_text(u"登錄").click() b.fill("loginUserDTO.user_name","xxxx") b.fill("userDTO.password","xxxx")
第二部選擇出發地點日期等
通過cookies選擇出發地點,日期及目的地
首先瞧瞧我們的cookies當然是沒有的出發日期什么的
至于你的出發地點及目的地對于的cookies值是什么,就得靠自己去copy了,我幫不了
怎么有的這些值?
先將地點日期輸進去查詢一下,然后chrome按F12 找到這一部分即可
打開瀏覽器跳到這個頁面當然是沒有我們需要的信息的,比如下面這樣
b.cookies.all()
{u'BIGipServerotn': u'1977155850.38945.0000', u'JSESSIONID': u'0A01D97598F459F751C4AE8518DBFB300DA7001B67', u'__NRF': u'95D48FC2E0E15920BFB61C7A330FF2AE', u'current_captcha_type': u'Z'}
然后我們需要添加出發地,這個得自己去查了,是簡單的url加密 b.cookies.add({"_jc_save_fromStation":"%u4E0A%u6D77%2CSHH"}) 添加出發日期 b.cookies.add({"_jc_save_fromDate":"2016-01-20"}) 添加目的地 b.cookies.add({u'_jc_save_toStation':'%u6C38%u5DDE%2CAOQ'}) 注:如果是修改的話,還是調用add方法,如果傳入的字典key值已存在則替換 比如,將目的地改為其他地方xxxx,如下即可 b.cookies.add({u'_jc_save_toStation':'xxxxxx'})