为什么浏览器上xpath可以获取数据，python中无法获取

admin•2025-09-17 03:28:55•网站建设•阅读21

偶尔我们在写爬虫的时候会遇到这样一个问题，在浏览器上写的xpath语法明明可以获得数据，但是到python里面，一模一样的xpath语法却无法得到数据，

偶尔我们在写爬虫的时候会遇到这样一个问题，在浏览器上写的xpath语法明明可以获得数据，但是到python里面，一模一样的xpath语法却无法得到数据，这个问题出现在哪里呢？

【前提：自己写的xpath没有问题，能准确获取数据】

原因一：

浏览器上的xpath是根据浏览器解析了服务器返回过来的网页源码，两者可能存在一定差异，比如部分标签不一样。

【查看网页源码(在网页上右键，检查网页源码)】

会发现网页源码的标签与浏览器解析的不太一样，此为正常现象：是因为浏览器解析了服务器返回过来的网页源码导致的，python获取的是此源码，非浏览器解析的结果【但是大多数情况下浏览器上与此源码一样】。

如今的浏览器是非常智能的，如果HTML缺少些标签，也会帮助服务器返回过来的源码自动补全，导致标签上存在差异。

获取方式：查看网页源码【或者从spyder里面复制出来content变量的内容<最准确>】，通过网页源码确定准确的标签以及属性。

原因二：

数据是通过动态加载的，静态网页数据获取的一套在这里根本用不上。

需要学习动态网页爬虫才能准确获取想要的数据。

公众号有更多干货分享哦~~

发布者：admin，转转请注明出处：http://www.yc00.com/web/1755022715a5227569.html

器上数据 xpath python

admin

网站建设
下载国外数据速度太慢，可尝试这样解决
最近发现一个非常棒的RNAseq教程，链接在这里。在Linux用wget下载测试数据，那速度一看吓一跳，动不动1kbs，甚至几十bs。后来尝试了
admin
1月前
180
网站建设
（2024最新毕设合集）基于Android的移动数字图书资源管理系统-67303|可做计算机毕设JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、文案
摘要本文设计并实现了一种结合Android与Spring Boot技术的移动数字图书资源管理系统，通过深入分析用户需求，确定了包括用户管理、图书查询、借阅管理、归还管理、个性化推荐等功能模块&
admin
1月前
190
网站建设
MySQL误删除 binlog 还原恢复已删除数据实战超详细
硬盘有价，数据无价，数据库执行，谨慎操作！ binlog日志还原不适用于直接删表删库的误操作！ 目录实战恢复 1、导出相关
admin
1月前
130
网站建设
linux mysql 数据恢复_怎样恢复Mysql数据库误删除后的数据
导读在日常运维工作中，对于mysql数据库的权限的规避，SQL审核优化、数据备份恢复就变成了，工作必备技能；数据库对于网站的重要性使得我们对mysql数
admin
1月前
170
网站建设
【电子数据取证技术】第一章概述
电子数据取证技术第一章电子数据取证技术概述01 网络犯罪及其主要特点1.1 计算机犯罪与网络犯罪1.2 常见的网络犯罪形式1.3 网络犯罪的特点02 电子数据的概念2.1 电子证据与电子数据2.2 电子数据的常见类型2.3 现行法律对电子
admin
1月前
190
网站建设
Python实现本地视频音频播放器
Python实现本地视频音频播放器在Python中，有几个库可以用于视频播放，但是没有一个库是完美的，因为它们可能依赖于外部软件或有一些限制。先看介绍用Python实现本地视频播放器，再介绍用Python实现本地音乐播放器。 Py
admin
1月前
200
网站建设
python 爬虫入门三、登录以及代理。
目录一、登录 （一）、登录4399 1.直接使用Cookie 2.使用账号密码进行登录可选观看内容，使用python对密码进行加密（无结果
admin
1月前
210
网站建设
python schedule多线程_Python-43-schedule 定时执行
定时执行我们经常需要定时执行一个任务。在 python 中很多方式实现定时执行。python 官方库time 定时执行shed 定时执行threading里的timer,实现非阻塞型开源框架看了一下对开发者比较友好的框架。其他windows
admin
1月前
230
网站建设
python使用schedule实现定时周期性任务执行
import scheduleimport timedef job():print("this schedule test")def test_fun()
admin
1月前
200
网站建设
python schedule运行了一遍说没有任务_python-schedule模块(定时任务)基于官方文档总结...
一.模块安装pip3 install schedule二.常用的使用案例#基本格式#创建方法def func():print("方法")#创建定时schedule.every().seconds.do(func)#每
admin
1月前
180
网站建设
python用schedule模块实现定时任务
python用schedule模块实现定时任务import scheduleimport timedef test():print("Im working...")def test2():print(&qu
admin
1月前
170
网站建设
python中定时任务schedule
import scheduleimport timedef jop():print("jop ...")print(time.ctime())def exec():# 每5秒做定时任务# schedule.every(
admin
1月前
160
网站建设
腾讯大数据总体架构图，对外公开！
导读：腾讯作为国内体量最大的互联网公司之一，业务涵盖用户日常生活的方方面面，面对如此巨大业务数据量，如果不能对数据进行专业化处理并高效有序地存、管、用&
admin
1月前
170
网站建设
Python爬虫——从浏览器复制的Xpath无法解析（tbody）
今天遇到一个问题，我的爬虫想抓取一个网页上的有些内容，使用Xpath解析的方式。前几个内容都可以被Xpath解析，但是最后一个标签内的内容始终解析不到，
admin
1月前
200
网站建设
Python爬虫突破某360查询网站反爬验证码
某360查询网址同一ip频繁访问的话会弹出验证码，该验证码特点：get获取的验证码图片和网页展现的不一致（所以无法通过图像识别破解）；该验证码是针对ip，输入验证码后会给出一个大概一天有效期的cookie，在此阶段可以大量频繁访问了。
admin
1月前
180
网站建设
「终身免费」淘小虾，Shopee浏览器数据分析插件
Shopee这个8亿用户的庞大市场，已经成为了众多商家抢夺的掘金宝地。首先我们从市场容量来分析，东南亚是世界文明的大融合，消费者的购买能力成为了互联网经济快速成长的主要构
admin
1月前
180
网站建设
Structure from Motion（附python代码）
SFM算法的前两步：特征点提取、匹配，可以看我的这篇文章：《sift、surf、orb 特征提取——三维重建》，这里主要详细介绍后三步。这个好像有
admin
1月前
200
网站建设
python ctypes structure_将Python ctypes.Structure转换为str
我有一个结构(在这种情况下是一个Netlink消息头)我需要通过套接字发送到内核.我弄清楚的唯一方法是使用__reduce __().>>> class nlmsghdr(ctypes.Structure):...
admin
1月前
200
网站建设
python ctypes structure_python – 设置ctypes.Structure默认值
这不起作用：class ifinfomsg(ctypes.Structure):_fields_[(ifi_family,ctypes.c_ubyte),(__ifi_pad, ctypes.c_ubyte
admin
1月前
200
网站建设
Windows系统安装Python解释器与PyCharm开发工具
引言 Python目前在大数据应用非常广泛，同时在自动化办公方面应用十分广阔，可以与办公三件套Word、PPT、Excle结合，提高工作效率，当然作为一
admin
28天前
220

发表回复

评论列表（0条）

暂无评论

为什么浏览器上xpath可以获取数据，python中无法获取

原因一：

原因二：

发表回复

评论列表（0条）

联系我们

400-800-8888

为什么浏览器上xpath可以获取数据，python中无法获取

原因一：

原因二：

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888