近期在找工作.关注了一下中国互联网公司的市值,实际情况跟想象的区别非常大. 比方异军突起的小米.京东.唯品会.聚美优品. 比方乐视网由于政策原因,市值两日缩水10亿$.停牌了. 搜房网市值90天蒸发36亿$,跌去一半 专注于酒店预定的艺龙已经跌出这个梯队. 下面全部市值都是按20140719当天的汇率转为美元计算,单位是亿$. 搜狐仅仅计算了它本身,他持股的搜狗.搜狐畅游 等没能估算. 阿里巴巴.小米.大众点评.美团还没上市.估值分别为1300.几百,40,30. watermark/2/tex…
BAT,B=百度.A=阿里巴巴.T=腾讯,是中国互联网公司百度公司(Baidu).阿里巴巴集团(Alibaba).腾讯公司(Tencent)三大互联网公司首字母的缩写.百度总部在北京.阿里巴巴总部在浙江省杭州市.腾讯总部在广东省深圳市.…
抓取内容: 从最好大学网上抓取中国前10的大学排名.大学名称.总分,并数据格式左对齐. http://www.zuihaodaxue.cn/zuihaodaxuepaiming2017.html 首先,看下网站的Robots协议,没有找到相关协议,可以抓取. http://www.zuihaodaxue.cn/robots.txt 接下来开始整理思路: 获取网页信息 填充列表数据 输出列表数据,并进行格式化 输出结果 完整代码: import requests from bs4 import B…
2017年1月20日,国家统计局公布:2016年中国国内生产总值GDP达744127亿元,同比增长6.7%,城市GDP方面:截至1月20日,全国大部分城市的去年经济运行数据已经公布,根据信息汇总,2016年中国城市GDP(经济总量)100强排名如下: 四大经济强省方面:广东21个省辖市中,9个进入全国百强:江苏13个省辖市全部进入全国百强,是唯一所有省辖市都跻身百强的省份:山东17个省辖市中,15个进入全国百强,数量居全国各省首位:浙江11个省辖市中,8个进入全国百强. 详细排名: 1.上海26…
import requests from bs4 import BeautifulSoup import bs4.element r=requests.get("http://www.zuihaodaxue.cn/zuihaodaxuepaiming2017.html") # print("encode:",r.encoding,"----真实编码方式",r.apparent_encoding) r.encoding=r.apparent_enc…
在正式爬取之前,先做一个试验,看一下爬取的数据对象的类型是如何转换为列表的: 写一个html文档: x.html<html><head><title>This is a python demo page</title></head> <body> <p class="title"> <a>The demo python introduces several python courses.&l…
github上 那个 watch和 follow功能 不太好用啊. 是我用的 不好,还是 怎么的.有时候 找不到 watch 和 follow. 秉持 开源 精神,省的大家 和 我 查找. 我只关注 C 和python.go的.其他 语言的,你们在 仓库里找吧~~~~ 1.alibaba 阿里巴巴的kernel : https://github.com/alibaba/ali_kernel 淘宝的 在nginx上改的 Tnginx : https://github.com/alibaba/ten…
我们需要爬取的网站:最好大学网 我们需要爬取的内容即为该网页中的表格部分: 该部分的html关键代码为: 其中整个表的标签为<tbody>标签,每行的标签为<tr>标签,每行中的每个单元格的标签为<td>标签,而我们所需的内容即为每个单元格中的内容. 因此编写程序的大概思路就是先找到整个表格的<tbody>标签,再遍历<tbody>标签下的所有<tr>标签,最后遍历<tr>标签下的所有<td>标签, 我们用二维…
Python之爬虫-中国大学排名 #!/usr/bin/env python # coding: utf-8 import bs4 import requests from bs4 import BeautifulSoup # 通过传入网址信息创建一个获取网页文本的函数 def getHTMLText(url): # 判断获取网页文本过程中是否有错误 try: # 打开网址获取文本,并且把延迟设置成30s r = requests.get(url, timeout=30) # 获取状态码 r.r…
大学的专业是学习经济与贸易的,后来接触了IT产业,于是乎自己对IT产业的经济王国就特别感兴趣,经济和IT 就像自己的老婆情人一样.令人着迷不舍. IT热和互联网热现在相信人尽皆知.我想告诉那些即将成为准IT人应该知 道的一些最新情况,而不是一味的去学技术,IT行业的全局发展情况也要了解. 我想告诉你两件事: 1.国内的IT业是有"钱图"的. 2.从事IT行业是值得骄傲的. 你知道?国内互联网经济的蛋糕有无限大. 1.国内网民数量达6.68亿.移动客户户流量超400M. 中国人民日报近日…