国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
python爬蟲學(xué)習(xí)(文字、圖片、視頻)

爬蟲-文字爬取

import reimport requestsrespone = requests.get('https://ishuo.cn/') ##獲取網(wǎng)站urldata = respone.text ##把字符串轉(zhuǎn)化成文本result_list = re.findall('<div class='content'>(.*?)</div>',data) ##找到需要爬取的內(nèi)容,需要爬取的內(nèi)容用'(.*?)'來代替,其他格式不變。'''<div class='content'>如果你得罪了老板,失去的只是一份工作;如果你得罪了客戶,失去的不過是一份訂單;是的,世上只有一個(gè)人可以得罪:你給她臉色看,你沖她發(fā)牢騷,你大聲頂撞她,甚至當(dāng) 著她的面摔碗,她都不會(huì)記恨你,原因很簡單,因?yàn)樗悄愕哪赣H。</div>'''for result in result_list: ##爬取這個(gè)網(wǎng)頁所有標(biāo)記的文本 print(result)

爬蟲-圖片爬取

import reimport requestscount = 0for i in range(44): ##設(shè)置圖片網(wǎng)頁的范圍,進(jìn)行網(wǎng)頁跳轉(zhuǎn)。 url = f'http://www.xiaohuar.com/list-1-{i}.html' ##獲取跳轉(zhuǎn)網(wǎng)頁的url路徑 response = requests.get(url) ##獲取網(wǎng)頁url路徑,并賦值給response data= response.text ##將response轉(zhuǎn)化成text文本并賦值給data # print(data) result_list = re.findall('src='(.*?)'',data) ##從data文本中提取需要爬取的圖片路徑,用“(.*?)”來代替,并賦值給result_list(變成列表) for result in result_list: # type:str ##逐個(gè)提取圖片url出來 if result.startswith('https'): ##刷選開頭是”https“的圖片url img_respone = requests.get(result) ##將開頭是“https”的圖片url提取出來,并賦值給img_response列表 # print(img_respone) img_name = result.split('/')[-1] ##對(duì)列表中圖片url以“/”標(biāo)識(shí)進(jìn)行切分,并提取最后一段url,并賦值給img_name # print(img_name) img_data = img_respone.content ##將列表img_response轉(zhuǎn)換成二進(jìn)制格式 with open (img_name,'wb') as fw: ##打開img_name文件,并賦予寫入權(quán)限(以字節(jié)格式寫入) fw.write(img_data) ##將img_data的數(shù)據(jù)寫入img_name文件 fw.flush() ##快速寫入 count  =1 print(f'爬取了{(lán)count}張圖片') ##可以顯示提示提取了多少張圖片

爬蟲-視頻爬取

import reimport requestsresponse = requests.get('https://www.ku6.com/index') ##獲取網(wǎng)站urldata = response.text ##將response轉(zhuǎn)換成文本格式count = 0result_list = re.findall('<a class='video-image-warp' target='_blank' href='(.*?)'>',data) ##獲取視頻地址for result in result_list: #type:str ##將獲取第一層視頻地址全部提取出來 # print(result) if result.startswith('/detail/') or result.startswith('/video/'): ##判斷result里面以“/detail/”和“/video/”開頭的url路徑 result = f'https://www.ku6.com{result}' ## 提取判斷正確的url路徑,并賦值給第二層url列表 result_response = requests.get(result) ##重新獲取第二層視頻url路徑,并賦值給response1 data1 = result_response.text ##將response1格式轉(zhuǎn)換成文本 #print(data1) video_url = re.findall('<source src='(.*?)' type='video/mp4'>',data1) ##獲取視頻地址 # print(video_url) if not video_url: ##對(duì)視頻格式進(jìn)行判斷 video_url = re.findall('flvURL: '(.*?)'',data1) ##如果視頻不是這個(gè)url格式,則更換成另外一種格式 # print(video_url) video_response = requests.get(video_url[0]) ##獲取視頻url路徑 video_data = video_response.content video_name = f'{video_url[0].split('/')[-1]}.mp4' with open (video_name,'wb') as fw: fw.write(video_data) fw.flush() count =1 print(f'爬取了{(lán)count}個(gè)視頻')

如果你對(duì)Python編程感興趣,那么記得私信小編“007”領(lǐng)取全套Python資料哦。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Python爬蟲日記一:爬取豆瓣電影中速度與激情8演員圖片
【視頻】手把手教你抓美女~
25. Python爬蟲教學(xué):爬取B站視頻源代碼(復(fù)制可用)
Python爬蟲進(jìn)階:爬取梨視頻網(wǎng)站Top排行榜視頻數(shù)據(jù)
趣玩爬蟲 | 教你爬取百思不得姐網(wǎng)站視頻
python帶你采集各種表情包,做群里最靚的崽~
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服