python爬取网站数据,如何绕过反爬虫策略

1、使用session对象

10年积累的成都网站制作、成都网站建设、外贸营销网站建设经验,可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你,你也不认识我。但先网站设计后付款的网站建设流程,更有五台免费网站建设让你可以放心的选择与我们合作。

session = requests.session()
strhtml = session.get(url) #与当前网站的首次会话

2、设置headers

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                         "Chrome/69.0.3497.100 Safari/537.36",
           "Accept": "application/json"}
session.headers = headers

3、设置cookies

设置与网站首次会话时的cookies为默认的cookies

cookies = session.cookies
session.headers.setdefault('cookies', cookies)

此后,可以复用之前会话中的cookies了

strhtml2 = session.get(url2)

网站题目:python爬取网站数据,如何绕过反爬虫策略
分享地址:http://hxwzsj.com/article/gjjchd.html

其他资讯

Copyright © 2025 青羊区翔捷宏鑫字牌设计制作工作室(个体工商户) All Rights Reserved 蜀ICP备2025123194号-14
友情链接: 营销型网站建设 重庆网站建设 成都网站建设 手机网站建设 企业网站设计 手机网站制作设计 重庆电商网站建设 商城网站建设 成都企业网站制作 成都网站建设 高端网站设计 成都网站建设 成都商城网站建设 网站设计公司 成都模版网站建设 达州网站设计 成都网站建设 网站建设开发 成都网站建设 成都品牌网站设计 网站建设费用 成都网站设计