网站首页 > 技术文章 正文
1. 介绍
1.1 介绍
福哥在使用selenium实现页面爬取的时候发现遇到包含框架(frame)的网页时候就无法通过find_xxx方法得到页面上的元素,这可真是麻烦了啊!
福哥在使用F12调试前端的时候发现在调试面板的控制台栏里就可以选择页面上面的任意一个框架(frame)作为当前框架,如果selenium也可以选择页面上面的框架就好了!
经过一番折腾,福哥找到了答案!
2. 框架页面
这是一个包含多级框架的页面,下面的代码都是以抓取这个页面作为示例的。
3. 通过id定位
如果页面内的frame有id的话,可以直接定位。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("top")
print(chrome.find_element_by_tag_name("h3").text)
4. 通过name定位
如果页面内的frame有name的话,可以直接定位。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("content")
print(chrome.find_element_by_tag_name("h3").text)
5. 通过元素定位
如果页面的frame既没有id也没有name的话,只能通过标签选择了。
chrome.get("http://192.168.2.168/tfams/test.html")
iframes = chrome.find_elements_by_tag_name("iframe")
chrome.switch_to_frame(iframes[0])
print(chrome.find_element_by_tag_name("h3").text)
6. 多级嵌套框架
selenium的寻找元素是在“当前”框架内进行的,如果我们要定位的框架在“当前”框架的子级框架里面(也就是孙级框架),那么就需要一级一级地进行定位了。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("content")
chrome.switch_to_frame("sub1")
print(chrome.find_element_by_tag_name("h3").text)
7. 返回上级框架
上一例当中我们将“当前”框架移动到了最里面的sub1上,如果要定位sub2框架就需要先回到content框架,这个时候就需要使用返回上级框架的功能了。
返回上级框架功能通过switch_to.parent_frame方法实现。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("content")
chrome.switch_to_frame("sub1")
print(chrome.find_element_by_tag_name("h3").text)
chrome.switch_to.parent_frame()
chrome.switch_to_frame("sub2")
print(chrome.find_element_by_tag_name("h3").text)
8. 返回顶级框架
如果框架层级很多,我们希望一下回到最外层的框架,可以使用switch_to.default_content方法实现。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("content")
chrome.switch_to_frame("sub1")
print(chrome.find_element_by_tag_name("h3").text)
chrome.switch_to.default_content()
chrome.switch_to_frame("top")
print(chrome.find_element_by_tag_name("h3").text)
9. 切换框架的两种方法
selenium切换框架提供了两种方法,福哥分别介绍一下。
9.1 通过switch_to_frame方法
一个是通过Chrome实例的switch_to_frame方法实现。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to_frame("top")
print(chrome.find_element_by_tag_name("h3").text)
9.2 通过switch_to.frame方法
一个是通过Chrome实例的switch_to属性对象的frame方法实现。
chrome.get("http://192.168.2.168/tfams/test.html")
chrome.switch_to.frame("top")
print(chrome.find_element_by_tag_name("h3").text)
10. 总结
今天福哥带着大家学会了在selenium里面切换“当前”框架的方法,无论是一级框架结构,还是多级框架结构,我们都可以游刃有余地定位它们了。
框架设计在管理系统里面出现的比率还是非常高的,越是功能强大的系统使用的框架结构就会越复杂,要能够模拟用户操作这样的系统需要灵活掌握切换框架的技巧才行。
https://m.tongfu.net/home/35/blog/513253.html
猜你喜欢
- 2025-03-20 uniapp页面跳转失效怎么解决(uniapp跳转页面没反应)
- 2025-03-20 孟得明:教你解决微信跳转appstore的困扰
- 2025-03-20 系统小技巧:Windows 10执行任务快上加快
- 2025-03-20 5种JavaScript实现页面跳转的方法,赶紧收藏
- 2025-03-20 实现网页跳转的方法(实现网页跳转的方法包括)
你 发表评论:
欢迎- 最近发表
-
- 宇宙厂:深入聊聊 CJS 和 ESM 模块化三点核心差异?
- #前端高手进阶#一起薅羊毛~
- 前端基础进阶(十):深入详解函数的柯里化
- 2025 年 Object 和 Map 如何选择?
- 为何说 postMessage 才是真正的 setTimeout(0)?
- 为什么高手写 JS 总是又快又好?这10个技巧你要知道
- 2025 年 Deno 终于官宣 pnpm 和 Yarn 可使用 JSR?
- 宇宙厂:为什么前端要了解 Interaction to Next Paint (INP)
- Node.js 原生支持 TypeScript?开发者需要了解的一切
- 请务必用 postTask/isInputPending 释放JS主线程!
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端react (48)
- 前端md5加密 (49)
- 前端路由 (55)
- 前端数组 (65)
- 前端定时器 (47)
- 前端接口 (46)
- Oracle RAC (73)
- oracle恢复 (76)
- oracle 删除表 (48)
- oracle 用户名 (74)
- oracle 工具 (55)
- oracle 内存 (50)
- oracle 导出表 (57)
- oracle约束 (46)
- oracle 中文 (51)
- oracle链接 (47)
- oracle的函数 (57)
- mac oracle (47)
- 前端调试 (52)
- 前端登录页面 (48)
本文暂时没有评论,来添加一个吧(●'◡'●)