requests使用re爬取腾讯体育新闻

简介 爬取新闻标题 1. 安装 pip install requestpip install fake_useragent2. 演示 进入网址,查看网页源代码 找到标题界面,根据li标签

简介

爬取新闻标题

1. 安装

pip install request
pip install fake_useragent

2. 演示

  1. 进入网址,查看网页源代码

  2. 找到标题界面,根据li标签的特征使用re匹配

  3. 代码演示

import requests
from fake_useragent import UserAgent # 伪装请求头的库
import re

url = 'http://sports.qq/'   # 腾讯体育新闻网址
headers = {'User-Agent': UserAgent().chrome} 

response = requests.get(url, headers)
pattern = r'<li><a target="_blank" href="(.*?)" class="(.*?)">(.*?)</a></li>'
s = re.findall(pattern=pattern, string=response.text)

for content in s:
    print(content[2])

print('--------完成-------')
  1. 结果

发布者:admin,转转请注明出处:http://www.yc00.com/web/1734007422a3742255.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信