python3如何爬取豆瓣电影250的数据？

发布时间：2021-09-20

　　
talk is cheap , show me code.

#!/usr/bin/env python3
# -*- coding: utf-8 -*- <2019-09-18
-*-
import requests
from bs4 import BeautifulSoup
headers = ("User-Agent","Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.168 Safari/537.36")
page = 0
number = 0
while page < 251:
url = ("
page += 25
# print(url)
#下面开始获取url的单独网页
web_data = requests.get(url) #获取当前url的所有数据
soup = BeautifulSoup(web_data.text,'lxml') # 用bs4进行网页的标签分析
info = soup.find_all('div', class_='info') #用soup的find_all功能查找所有class为info的标签内容
info.encoding = 'utf-8' #防止terminal直接print出现乱码
savetxt = open('douban.txt','a') #保存到当地的一个txt里便于查看，a是指打开文档，在txt后面添加，w是覆盖。
for tag in info:
number += 1
# print('5')
movie_name = tag.find('span', class_='title').get_text() #获得所有标签为title的文本
movie_rate = tag.find('span', class_='rating_num').get_text() #获得所有标签为rating的内容
movie_quote = tag.find('span', class_='inq').get_text() #获取标签为inq的内容
movie_star = tag.find('div', class_='star').get_text() #获取star打分的内容
moive_star2 = movie_star.find('span') # print(movie_name)
# 把获取的信息分类后保存到savetxt.txt里面。
savetxt.write("No" + str(number) + ":
" + str(movie_name) +'
'+ str(movie_rate) +'
'+ str(movie_quote))
savetxt.write('\n') #这里的\n是换行符
savetxt.close() #关闭文档
print(page)

陆零云客服中心

点击按钮可通过QQ进行沟通，请确认启动QQ

综合业务

客服①QQ咨询 客服②QQ咨询 客服③QQ咨询

多人值班加工单维护，为避免丢失消息，请尽量添加好友
业务咨询

在线咨询 在线咨询

业务相关，请咨询售前客服，为避免丢失消息，请尽量添加好友
售后支持

售后QQ技术 工单提交服务

售后问题处理，请QQ在线售后技术，或者提交服务请求，我们会尽全力解决您的问题
投诉/合作

大客户，代理申请联系 服务与合作

处理：投诉，建议，代理联系QQ：913603

负载均衡

云数据库

域名注册

常见问题

云计算

python3如何爬取豆瓣电影250的数据？

发布时间：2021-09-20