Sh4dow's Blog

活了二十几年,从来没有人给过我一次意外感动或惊喜,也没有人在我生日的时候给过我特别的礼物,生病的时候得到的只是一些不在身边的语言安慰,也不见谁真正的照顾过自己,甚至有的时候自己蒙头睡一觉就好了,也有人喜欢过我,但是从没见谁坚持过。

python cookies采集

最新需要采集的地方太多了,都是需要带入一个参数到url中。自己简单写了一个采集,完成一些简单工作。

【code】

#coding=utf-8

import urllib2

import cookielib

import os

fkey = open ("key.txt","r")

lines = fkey.readlines()

for line in  lines:

keyy=line

url_link="https://xxxx.xxxx.com/Dover/Json?businesstype=Ground.Mountain.Newborn.Sample.Info&patientid=&key="+keyy+""

request = urllib2.Request(url_link)

cookie = cookielib.CookieJar()

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))

opener.handle_open["http"][0].set_http_debuglevel(1)

user_agent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2376.0 Safari/537.36"

request.add_header("User-Agent", user_agent)

cookie = "JSESSIONID=5D673250C95A71E04577256A6AD916FC"

request.add_header("Cookie", cookie)

response = opener.open(request)

soup=response.read()

f = open("text.txt","a+")

f.write(soup+"\n")

f.close()


【/code】


评论

© Sh4dow's Blog | Powered by LOFTER