TA的每日心情  | 开心 2021-12-13 21:45 | 
|---|
 
  签到天数: 15 天 [LV.4]偶尔看看III  
 | 
 
| 
 
   
 在编写爬虫进行网页数据的时候,大多数情况下,需要在请求是增加请求头,下面介绍一个python下非常好用的伪装请求头的库:fake-useragent,具体使用说明如下:  
   
  安装fake-useragent库  
   
 pip install fake-useragent  
   
  获取各浏览器的fake-useragent  
   
- [code]from fake_useragent import UserAgent
 - ua = UserAgent()
 - #ie浏览器的user agent
 - print(ua.ie)
 - #opera浏览器
 - print(ua.opera)
 - #chrome浏览器
 - print(ua.chrome)
 - #firefox浏览器
 - print(ua.firefox)
 - #safri浏览器
 - print(ua.safari)
 - #最常用的方式
 - #写爬虫最实用的是可以随意变换headers,一定要有随机性。支持随机生成请求头
 - print(ua.random)
 - print(ua.random)
 - print(ua.random)
 
  复制代码 [/code]  
 示例代码  
- [code]from fake_useragent import UserAgent
 - import requests
 - ua=UserAgent()
 - #请求的网址
 - url="http://www.baidu.com"
 - #请求头
 - headers={"User-Agent":ua.random}
 - #请求网址
 - response=requests.get(url=url,headers=headers)
 - #响应体内容
 - print(response.text)
 - #响应状态信息
 - print(response.status_code)
 - #响应头信息
 - print(response.headers)
 
  复制代码 [/code]  
  
 |   
 
 
 
 |