if分支语句

>>> count=89

>>> if count==89:

print count

89                          #单分支

>>>

#coding:utf-8

count=int(raw_input('请输入一个数字'))

print count

if count>80:

print '比80大'

else:

if count<80:

print ‘比80小’   #多分支

=======自定义函数  while if else===========

#coding:utf-8

count=int(raw_input('请输入一个数字'))

print count

if count>80:

print '比80大'

else:

print '比80小'

print 'End'

sex=raw_input('请输入您的性别')

def inputsex(sex):

while(sex!='male' and sex!='female'):

print sex

sex=raw_input('请输入性别为male 或者 female')

if sex=='male':

print 'Gentleman!'

else:

if sex=='female':

print 'Lady'

inputsex(sex)

=====if else的关系表达式bool判断 非0即真!=====

#coding:utf-8

if True:

print '1True'

else:

print 'False'

if 0:

print '2True'

else:

print '2False'

if 1:

print '3True'

else:

print '3False'

if 298:

print '4True'

else:

print '4False'

if -2:

print '5True'

else:

print '5False'

1True

2False

3True

4True

5True

If

if (A and B):

if (A or B):

if not A:

=======================while循环体========================

========网络刷浏览量的爬虫=======

#coding:utf-8

import time

import webbrowser

import os

import random

count=random.ranint(2,8)

i=1

j=0

while j<count:

while i<=3:

webbrowser.open_new_tab('www.baidu.com')

i=i+1

time.sleep(3)

else:

os.system('taskkill /F /IM iexplore.exe')

j=j+1

#windows下用taskkill  用的时候上网搜一下

#linux系统下用kill -pid  或者 killall chrome

#ranint就是随机整数

=======for循环语句============

for val in sth.  其中val不用预先声明

For遍历字符串

#coding:utf-8

s1='www.baidu.com'

i=0

for n in s1:

print format(i,'2d'),n

i=i+1

else:

print 'out for'

#format(i,’2d’)使i占两个输出位

For遍历list列表数组

#coding:utf-8

list1=[0,11,45,'dkfjah',12.5]              列表类型

i=0

for val in list1:

print format(i,'2d'),val

i=i+1

也可以直接写成这样

#coding:utf-8

i=1

for val in [11,23,0,'dfadf','国语',12.45]:

print format(i,'2d'),val

i=i+1

将字符串转换成list   list(str)

#coding:utf-8

s1='www.baidu.com'

i=1

list1=list(s1)

print list1

for val in list1:

print format(i,'2d'),val

i=i+1

元组 for遍历元组tuple

#coding:utf-8

#用圆括号括起来的是元组,元组中的数据只可读,不可修改。

tup=(1,2,3,4,5)  元组类型

for t in tup:

print t

else:

print 'out tup'

for遍历文件  for val in file.readlines()

#coding:utf-8

#如果所读的文件与此py程序文件所在地址一样,则直接写文件名

for s in open('11.txt','r').readline():

print s

li3=open('11.txt','r').readlines()

for a in open('11.txt','r').readlines():

open('tmp.txt','a+').write(a)  #a+是追加写入  r 读 w写 w+如果没有此文件先创建再写入

print a

print len(li3)

#len(li3)输出列表有多长  这里即文章有多少行

#readline()返回字符串  默认返回第一行

#readlines()返回list 默认为文件中所有行的list

#用help(file.readline)查看帮助

Python 爬虫如何获取 JS 生成的 URL 和网页内容?

我是直接看js源码,分析完,然后爬的。
例如看页面是用Ajax请求一个JSON文件,我就先爬那个页面,获取Ajax所需的参数,然后直接请求JSON页,然后解码,再处理数据并入库。
如果你直接运行页面上所有js(就像浏览器做的那样),然后获取最终的HTML DOM树,这样的性能非常地糟糕,不建议使用这样的方法。因为Python和js性能本身都很差,如果这样做,会消耗大量CPU资源并且最终只能获得极低的抓取效率。

Python ===if while for语句 以及一个小小网络爬虫实例的更多相关文章

  1. Python 利用Python编写简单网络爬虫实例3

    利用Python编写简单网络爬虫实例3 by:授客 QQ:1033553122 实验环境 python版本:3.3.5(2.7下报错 实验目的 获取目标网站“http://bbs.51testing. ...

  2. Python 利用Python编写简单网络爬虫实例2

    利用Python编写简单网络爬虫实例2 by:授客 QQ:1033553122 实验环境 python版本:3.3.5(2.7下报错 实验目的 获取目标网站“http://www.51testing. ...

  3. python爬虫系列(1)——一个简单的爬虫实例

    本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片. 1. 概述 本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片.下载图片的步骤如下: 获取网页html文本内容:分析html中 ...

  4. Python Socket,How to Create Socket Server? - 网络编程实例

    文章出自:Python socket – network programming tutorial by Silver Moon 原创译文,如有版权问题请联系删除. Network programin ...

  5. [Python] 前程无忧招聘网爬取软件工程职位 网络爬虫 https://www.51job.com

    首先进入该网站的https://www.51job.com/robots.txt页面 给出提示: 找不到该页 File not found 您要查看的页已删除,或已改名,或暂时不可用. 请尝试以下操作 ...

  6. 《Python编程》课程报告 python技术在数据分析中的应用之网络爬虫

      摘要:... 2 1       引言 :... 2 1.1课题研究背景和研究现状... 2 1.1.1课题背景和目的... 3 1.1.2研究现状... 4 1.1.2.1语言... 4 1.1 ...

  7. Python数据抓取(2) —简单网络爬虫的撰写

    (一)使用Requests存储网页 Requests 是什么?网络资源(URLs)抓取套件 优点? 改善urllib2的缺点,让使用者以最简单的方式获取网络资源 可以使用REST操作(POST,PUT ...

  8. 一个使用 asyncio 开发的网络爬虫(译文)

    原文地址:https://www.aosabook.org/en/500L/a-web-crawler-with-asyncio-coroutines.html 作者简介 A. Jesse Jiryu ...

  9. [Python]网络爬虫( 连载:大牛汪海 )

    汪海个人博客:http://blog.callmewhy.com/ Python爬虫专栏,汪海专栏 Python爬虫入门教程 简单的介绍如何使用Python的相关模块如urllib2来实现网络爬虫的基 ...

随机推荐

  1. HBase入库调优

    本文章只针对“微型集群处理大数据”的场景. 场景描述: 硬件:5个节点,每个节点可用硬盘1块(700G.500G等).8核cpu,实验室环境(有时候还要跑其他程序跟你抢占资源),16G内存. 软件:h ...

  2. 实施项目--.NET实现仓库看板的一些感想

    从一名技术开发人员到实施人员的蜕变,从不同的角度看待同一个问题,或许会有不一样的结果.这里记录一下最近一个项目实施的案例,非常有感触! 一. 项目情况简介 本次项目是给一个国外生产型企业做仓库方面的系 ...

  3. 汇顶科技&&硬件类笔试题目

    汇顶科技硬件类笔试题目,每年都有变化,但是题目类型都差不多.汇顶科技17年在南京地区大概招了20个左右吧,给的待遇还是不错的,工作地点上海深圳

  4. UITextField实现左侧空出一定的边距

    就是通过uitextfield的leftview来实现的,同时要设置leftviewmode. 如果设置左右边距,需要再加上rightView功能 -(void)setTextFieldLeftPad ...

  5. 大型网站系统架构实践(五)深入探讨web应用高可用方案

    从上篇文章到这篇文章,中间用了一段时间准备,主要是想把东西讲透,同时希望大家给与一些批评和建议,这样我才能有所进步,也希望喜欢我文章的朋友,给个赞,这样我才能更有激情,呵呵. 由于本篇要写的内容有点多 ...

  6. Graphics samples2

    为图形填充渐变色: Graphics2D g2=(Graphics2D)g; GradientPaint gra=new GradientPaint(20, 20, Color.BLUE, 100,8 ...

  7. 在cmd中运行带包名的java程序

    例: 在 d 盘中的 zh.java 文件,zh.java文件中有package com.fanShe.....; 则命令是  javac -d . zh.java 要在中间加入 -d . 后面运行的 ...

  8. ~~圣诞节到啦, canvas雪花效果, 漂亮到简直没天理啊~~

    看到coding的主界面有雪花, 原来,哇,  真漂亮, 一看源代码, 哦了个去, angular写的, 压力好大, 分析分析分析分析.... 然后就写成jQ插件的样子给大家用了. 在线预览的页面是: ...

  9. 表单脚本api_contenteditable

    <html> <head></head> <body> <form> <div contenteditable>ssadas&l ...

  10. sql-数据库的隔离级别

    read uncommited  (读未提交)      最低级别,可读取未提交事物的数据,这会导致脏读,比如:某时刻会话a修改了一个数据,但还未提交,此时会话b,读取了该数据,这是,会话a回滚了事物 ...