活了二十几年,从来没有人给过我一次意外感动或惊喜,也没有人在我生日的时候给过我特别的礼物,生病的时候得到的只是一些不在身边的语言安慰,也不见谁真正的照顾过自己,甚至有的时候自己蒙头睡一觉就好了,也有人喜欢过我,但是从没见谁坚持过。
最新需要采集的地方太多了,都是需要带入一个参数到url中。自己简单写了一个采集,完成一些简单工作。
。
【code】
#coding=utf-8
import urllib2
import cookielib
import os
fkey = open ("key.txt","r")
lines = fkey.readlines()
for line in lines:
keyy=line
url_link="https://xxxx.xxxx.com/Dover/Json?businesstype=Ground.Mountain.Newborn.Sample.Info&patientid=&key="+keyy+""
request = urllib2.Request(url_link)
cookie = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))
opener.handle_open["http"][0].set_http_debuglevel(1)
user_agent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2376.0 Safari/537.36"
request.add_header("User-Agent", user_agent)
cookie = "JSESSIONID=5D673250C95A71E04577256A6AD916FC"
request.add_header("Cookie", cookie)
response = opener.open(request)
soup=response.read()
f = open("text.txt","a+")
f.write(soup+"\n")
f.close()
【/code】
© Sh4dow's Blog | Powered by LOFTER