利用python定位网页上的元素

1. 想对网页上的元素进行操作，首先需要定位到元素。

以百度首页为例：

输入以下代码，打开百度首页：

# coding = gbk

from selenium import webdriver

chrome_driver_path = "C:\Python27\selenium\webdriver\chromedriver\chromedriver"

global browser

browser = webdriver.Chrome(chrome_driver_path)

url_int = "https://www.baidu.com/"

browser.get(url_int)

print "Open baidu"

2. 在打开的百度首页，右键点击，选择“查看网页源代码”。

以下网页源代码是与百度输入框和“百度一下”按钮有关的，先提取在这里，方便后续定位。

<span class="bg s_ipt_wr"><input id="kw" name="wd" class="s_ipt" value="" maxlength="" autocomplete="off"></span><span class="bg s_btn_wr"><input type="submit" id="su" value="百度一下" class="bg s_btn"></span>

3. 定位百度输入框

通过id定位：

browser.find_element_by_id("kw")

通过name定位：

browser.find_element_by_name("wd")

通过标签名tag_name定位：

browser.find_element_by_tag_name("input")

通过class_name定位：

browser.find_element_by_class_name("bg_s_btn_wr")

通过css定位：

以id定位：

browser.find_element_by_css_selector("a[id=\"kw\"]")

以name定位：

browser.find_element_by_css_selector("a[name=\"wd\"]")

通过XPath定位：（XPath是一种在XML文档中定位元素的语言）

attribute属性定位（定位input标签下，id=kw的元素）：

browser.find_element_by_xpath("//input[@id='kw']")

id相关性定位（/form/span/input层级标签下，div标签下，id=fm的元素）：

browser.find_element_by_xpath("//div[@id='fm']/form/span/input")

id为check的tr，定位它的第2个td：

browser.find_element_by_xpath("tr[@id='check']/td[2]")

position位置定位（第7个tr里面的第2个td）：

browser.find_element_by_xpath("//tr[7]/td[2]")

href水平参考定位（a标签下，查找包含‘网页’的文本text元素）：

browser.find_element_by_xpath("//a[contains(text(),'网页')]")

link定位（a标签下，查找链接为'href='http://www.baidu.com/'的元素）：

browser.find_element_by_xpath("//a[@href='http://www.baidu.com']")

通过link定位（可以查找文字链接，打开贴吧链接）：

browser.find_element_by_link_text("贴吧")

browser.find_element_by_partial_link_text("贴")

4. 定位”百度一下“按钮

通过class_name定位：

browser.find_element_by_class_name("bg_s_btn_wr")

利用python定位网页上的元素的更多相关文章

css015 定位网页上的元素
css015 定位网页上的元素一. 定位属性的功能 1. 四中类型的定位 Position: absolute relative fixed static a. 绝对定位绝对定 ...
CSS3-基于浮动的布局，响应式WEB设计，定位网页上的元素，设计打印页面的css技术
基于浮动的布局: 1.除非图片设置了宽度,否则始终应该要对浮动的图片设置一个宽度,这样可以让浏览器给其他内容腾出环绕的空间 2.当侧边栏的高度与主内容区的高度不一致的时候,可以用个margin进行调整 ...
爬虫学习笔记（1）-- 利用Python从网页抓取数据
最近想从一个网站上下载资源,懒得一个个的点击下载了,想写一个爬虫把程序全部下载下来,在这里做一个简单的记录 Python的基础语法在这里就不多做叙述了,黑马程序员上有一个基础的视频教学,可以跟着学习一 ...
有关利用python获取网页，以及KDD近几年论文标题与摘要链接
最近一直在看KDD的论文,不过,由于老师并没有什么合理的方向性,所以考虑把kdd中的大部分内容都利用python将所有标题.摘要获取下来. 还有一个原因在于,看acm上的摘要,都只显示了两行,再看多点 ...
CSS定位网页中的元素
relative相对定位偏移设置:left.right.top.bottom 值单位:px 元素的规律: 相对定位元素的规律设置相对定位的盒子会相对它原来的位置通过指定偏移,到达新的位置. 设置相 ...
Python爬虫个人记录（四）利用Python在豆瓣上写一篇日记
涉及关键词:requests库 requests.post方法 cookies登陆 version 1.5(附录):使用post方法登陆豆瓣,成功! 缺点:无法获得登陆成功后的cookie,要使用js ...
Python从网页上爬取图片
在搜索壁纸的时候,想把壁纸保存到本地,一张一张的保存太过麻烦,所以想到用Python来爬取壁纸. 设计思路: 1.首先先去找有壁纸的网页: http://www.acfun.cn/a/ac334521 ...
利用python监测linux上的服务（简单实现服务宕掉自动发送邮件）
python 这里用到了四个python 模块 : import time (时间模块) import re (正则模块) import socket (监测端口模块)import yagmail ( ...
python下载网页上公开数据集
URL很简单,数据集分散开在一个URL页面上,单个用手下载很慢,这样可以用python辅助下载: 问题:很多国外的数据集,收到网络波动的影响很大,最好可以添加一个如果失败就继续请求的逻辑,这里还没有实 ...

随机推荐

javaweb入门---web服务器与HTTP协议基础
上文web基础简介了web到底是什么,以及身为Java开发人员需要掌握的地方.本文将解答web服务器是什么,怎么使用?还有关于http协议的基础知识. web服务器 web服务器的大概念很广泛,但是通 ...
MD、SHA、MAC消息摘要算法实现与应用
1.消息摘要概述消息摘要(Message Digest)又称为数字摘要(Digital Digest).它是一个唯一对应一个消息或文本的固定长度的值,它由一个单向Hash加密函数对消息进行作用而产生 ...
nginx 301跳转https后post请求失效问题解决
app本地请求是http端口,后来升级https强制301跳转,设置如下 server { listen 80; server name www.XXX.com; rewrite ^/(.*)$ ht ...
Iterator-Java
在Java中,Iterator的作用就是为了方便处理集合中的元素.例如获取和删除集合中的元素. 在JDK8,Iterator接口提供了如下方法: 迭代器Iterator最基本的两个方法是next()和 ...
Vue2.0仿饿了么webapp单页面应用
Vue2.0仿饿了么webapp单页面应用声明: 代码源于黄轶老师在慕课网上的教学视频,我自己用vue2.0重写了该项目,喜欢的同学可以去支持老师的课程:http://coding.imooc.c ...
不用 Spring Security 可否？试试这个小而美的安全框架
写在前面在一款应用的整个生命周期,我们都会谈及该应用的数据安全问题.用户的合法性与数据的可见性是数据安全中非常重要的一部分.但是,一方面,不同的应用对于数据的合法性和可见性要求的维度与粒度都有所区别 ...
java并发编程（十八）----(线程池)java线程池框架Fork-Join
还记得我们在初始介绍线程池的时候提到了Executor框架的体系,到现在为止我们只有一个没有介绍,与ThreadPoolExecutor一样继承与AbstractExecutorService的For ...
java中的异常 try catch
1.学习异常的原因? 如果没有异常处理机制,那么程序的一点小问题,都会导致[程序终止运行].实际开发中显然是不可能的,所以异常对于程序来说是非常重要的. 2.处理异常的方式: A ...
Mybatis学习笔记之---多表查询(1)
Mybatis多表查询(1) (一)举例(用户和账户) 一个用户可以有多个账户一个账户只能属于一个用户(多个账户也可以属于同一个用户) (二)步骤 1.建立两张表:用户表,账户表,让用户表和账户表之 ...
SQL Server 数据完整性的实现——约束
SQL Server数据库采用的是关系数据模型,而关系数据模型本身的优点之一就是模型本身集成了数据完整性.作为模型一部分而实施的数据完整性(例如在创建数据表时的列属性定义)称作为声明式(Declara ...

利用python定位网页上的元素

利用python定位网页上的元素的更多相关文章

随机推荐

热门专题