The second day of Crawler learning

The sixth day of Crawler learning

爬取我爱竞赛网的大量数据首先获取每一种比赛信息的分类链接 def get_type_url(url): web_data = requests.get(web_url) soup = BeautifulSoup(web_data.text, 'lxml') types = soup.select("#mn_P1_menu li a") for type in types: print(type.get_text()) get_num…

The fifth day of Crawler learning

使用mongoDB 下载地址:https://www.mongodb.com/dr/fastdl.mongodb.org/win32/mongodb-win32-x86_64-2008plus-ssl-4.0.9.zip/download 百度链接:https://pan.baidu.com/s/1xhFsENTVvU-tnjK9ODJ7Ag 密码:ctyy mongoDB的安装 https://www.cnblogs.com/iamluoli/p/9254899.html 可视化Robo3T…

The fourth day of Crawler learning

爬取58同城 from bs4 import BeautifulSoupimport requestsurl = "https://qd.58.com/diannao/35200617992782x.shtml"web_data = requests.get(url)soup = BeautifulSoup(web_data.text, 'lxml')title = soup.title.textcost = soup.select("div#basicinfo span.…

The third day of Crawler learning

连续爬取多页数据分析每一页url的关联找出联系例如虎扑第一页:https://voice.hupu.com/nba/1 第二页:https://voice.hupu.com/nba/2 第三页:https://voice.hupu.com/nba/3...... urls = ["https://voice.hupu.com/nba/{}".format(str(i)) for i in range(1, 30, 1)]print(urls) 这样就获得了30页的url ['ht…

The second day of Crawler learning

用BeatuifulSoup和Requests爬取猫途鹰网服务器与本地的交换机制我们每次浏览网页都是再向网页所在的服务器发送一个Request,然后服务器接受到Request后返回Response给网页. Request 当前Http1.1版本共有get.post.head.put.options.connect.trace.delete共八种发送请求的方式.不过不需要全部记住,目前最常用的为get和post. Response 我们会在Response中得到服务器返回给我们的信息,例如st…

The first day of Crawler learning

使用BeautifulSoup解析网页 Soup = BeautifulSoup(urlopen(html),'lxml') Soup为汤,html为食材,lxml为菜谱 from bs4 import BeautifulSoupfrom urllib.request import urlopenSoup = BeautifulSoup(urlopen("http://moumangtai.com/"), "lxml") 描述要爬取的东西在哪选择要爬取的页面进行检…

Machine and Deep Learning with Python

Machine and Deep Learning with Python Education Tutorials and courses Supervised learning superstitions cheat sheet Introduction to Deep Learning with Python How to implement a neural network How to build and run your first deep learning network Neur…

Node.js Learning Paths

Node.js Learning Paths Node.js in Action Node.js Expert situations / scenario Restful API OAuth 2.0 & SSO IM & WebSocket CURD MongoDB / CURD MySQL MEAN stack SSR server tools image upload / gzip pdf export share screen shortcuts GraphQL server CLI…

【Machine Learning】KNN算法虹膜图片识别

K-近邻算法虹膜图片识别实战作者:白宁超 2017年1月3日18:26:33 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结合视频学习和书籍基础的笔记所得.本系列文章将采用理论结合实践方式编写.首先介绍机器学习和深度学习的范畴,然后介绍关于训练集.测试集等介绍.接着分别介绍机器学习常用算法,分别是监督学习之分类(决策树.临近取样.支持向量机.神经网络算法)监督学习之回归(线性回归.非线性回归)非监督学习(K-means聚…

【Machine Learning】Python开发工具：Anaconda+Sublime

Python开发工具:Anaconda+Sublime 作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结合视频学习和书籍基础的笔记所得.本系列文章将采用理论结合实践方式编写.首先介绍机器学习和深度学习的范畴,然后介绍关于训练集.测试集等介绍.接着分别介绍机器学习常用算法,分别是监督学习之分类(决策树.临近取样.支持向量机.神经网络算法)监督学习之回归(线性回归.非线性回归…

【Machine Learning】机器学习及其基础概念简介

机器学习及其基础概念简介作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结合视频学习和书籍基础的笔记所得.本系列文章将采用理论结合实践方式编写.首先介绍机器学习和深度学习的范畴,然后介绍关于训练集.测试集等介绍.接着分别介绍机器学习常用算法,分别是监督学习之分类(决策树.临近取样.支持向量机.神经网络算法)监督学习之回归(线性回归.非线性回归)非监督学习(K-means聚…

【Machine Learning】决策树案例：基于python的商品购买能力预测系统

决策树在商品购买能力预测案例中的算法实现作者:白宁超 2016年12月24日22:05:42 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结合视频学习和书籍基础的笔记所得.本系列文章将采用理论结合实践方式编写.首先介绍机器学习和深度学习的范畴,然后介绍关于训练集.测试集等介绍.接着分别介绍机器学习常用算法,分别是监督学习之分类(决策树.临近取样.支持向量机.神经网络算法)监督学习之回归(线性回归.非线性回归)非监督学习(…

Deep learning：五十一(CNN的反向求导及练习)

前言: CNN作为DL中最成功的模型之一,有必要对其更进一步研究它.虽然在前面的博文Stacked CNN简单介绍中有大概介绍过CNN的使用,不过那是有个前提的:CNN中的参数必须已提前学习好.而本文的主要目的是介绍CNN参数在使用bp算法时该怎么训练,毕竟CNN中有卷积层和下采样层,虽然和MLP的bp算法本质上相同,但形式上还是有些区别的,很显然在完成CNN反向传播前了解bp算法是必须的.本文的实验部分是参考斯坦福UFLDL新教程UFLDL:Exercise: Convolutional Ne…

Programming Learning - Based on Project

Today when taking a bath I got a good idea that it is an efficient and interesting way to learn a new programming language: (These days I learn Python from the Python manual and feel a little bored....) Learn programming by trying some little or larg…

做中学（Learning by Doing）之背单词-扇贝网推荐

做中学(Learning by Doing)之背单词-扇贝网推荐看完杨贵福老师(博客,知乎专栏,豆瓣)的「继续背单词,8个月过去了」,我就有写这篇文章的冲动了,杨老师说: 有时候我会感觉非常后悔,如果当年更努力一些,早一些拥有现在的词汇量,应该可以看到多少错过的风景.人生苦短,早些开始,早些受益. 我现在所花费的200多天,是我的一些同学当年就已经花费过的--而且不会短很多.在2月初看到7月末的时候,我被这么多个月震惊了,那就是从寒假看到暑假了啊.如果我被那时的漫长天数吓住没有开始,此刻,也还…

【原】Learning Spark (Python版) 学习笔记(一)----RDD 基本概念与命令

<Learning Spark>这本书算是Spark入门的必读书了,中文版是<Spark快速大数据分析>,不过豆瓣书评很有意思的是,英文原版评分7.4,评论都说入门而已深入不足,中文译版评分8.4,评论一片好评,有点意思.我倒觉得这本书可以作为官方文档的一个补充,刷完后基本上对Spark的一些基本概念.码简单的程序是没有问题的了.这本书有一个好处是它是用三门语言写的,Python/Java/Scala,所以适用性很广,我的观点是,先精通一门语言,再去学其他语言.由于我工作中比较常用…

【原】Learning Spark (Python版) 学习笔记(四)----Spark Sreaming与MLlib机器学习

本来这篇是准备5.15更的,但是上周一直在忙签证和工作的事,没时间就推迟了,现在终于有时间来写写Learning Spark最后一部分内容了. 第10-11 章主要讲的是Spark Streaming 和MLlib方面的内容.我们知道Spark在离线处理数据上的性能很好,那么它在实时数据上的表现怎么样呢?在实际生产中,我们经常需要即使处理收到的数据,比如实时机器学习模型的应用,自动异常的检测,实时追踪页面访问统计的应用等.Spark Streaming可以很好的解决上述类似的问题. 了解Spar…

【机器学习Machine Learning】资料大全

昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书: 1.Pattern Recognition and Machine Learning (by Hastie, Tibshirani, and Friedman's ) 2.Elements of Statistical Learning(by Bishop's) 这两本是英文的,但是非常全,第一本需要有一定的数学基础,第可以先看第二本.如果看英文觉得吃力,推荐看一下下面…

【深度学习Deep Learning】资料大全

最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books by Yoshua Bengio, Ian Goodfellow and Aaron Courville Neural Networks and Deep Learning42 by Michael Nielsen Deep Learning27 by Microsoft Research Deep Learning Tutorial23 by LISA lab, University…

【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL

周末的任务是更新Learning Spark系列第三篇,以为自己写不完了,但为了改正拖延症,还是得完成给自己定的任务啊 = =.这三章主要讲Spark的运行过程(本地+集群),性能调优以及Spark SQL相关的知识,如果对Spark不熟的同学可以先看看之前总结的两篇文章: [原]Learning Spark (Python版) 学习笔记(一)----RDD 基本概念与命令 [原]Learning Spark (Python版) 学习笔记(二)----键值对.数据读取与保存.共享特性 #####…

[Machine Learning & Algorithm] 神经网络基础

目前,深度学习(Deep Learning,简称DL)在算法领域可谓是大红大紫,现在不只是互联网.人工智能,生活中的各大领域都能反映出深度学习引领的巨大变革.要学习深度学习,那么首先要熟悉神经网络(Neural Networks,简称NN)的一些基本概念.当然,这里所说的神经网络不是生物学的神经网络,我们将其称之为人工神经网络(Artificial Neural Networks,简称ANN)貌似更为合理.神经网络最早是人工智能领域的一种算法或者说是模型,目前神经网络已经发展成为一类多学科交叉的…

[Machine Learning] Active Learning

1. 写在前面在机器学习(Machine learning)领域,监督学习(Supervised learning).非监督学习(Unsupervised learning)以及半监督学习(Semi-supervised learning)是三类研究比较多,应用比较广的学习技术,wiki上对这三种学习的简单描述如下: 监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类. 非监督学习:直接对输入数据集进行建模,例如聚类. 半监督学习:综合利…

[Machine Learning & Algorithm]CAML机器学习系列2：深入浅出ML之Entropy-Based家族

声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 写在前面记得在<Pattern Recognition And Machine Learning>一书中的开头有讲到:“概率论.决策论.信息论3个重要工具贯穿着<PRML>整本书,虽然看起来令人生畏…”.确实如此,其实这3大理论在机器学习的每一种技法中,或多或少都会出现其身影(不局限在概率模型). <PRML>书中原话:”This chapter also…

[Machine Learning & Algorithm]CAML机器学习系列1：深入浅出ML之Regression家族

声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 符号定义这里定义<深入浅出ML>系列中涉及到的公式符号,如无特殊说明,符号含义均按下述定义解释: 符号含义 \(x_j\) 第\(j\)维特征 \(x\) 一条样本中的特征向量,\(x=(1, x_1, x_2, \cdots, x_n)\) \(x^{(i)}\) 第\(i\)条样本 \(x_{j}^{(i)}\) 第\(i\)条样本的第\(j\)维特征 \(y^{(i)}\)…

《Learning Highcharts》中文翻译

在highcarts的官方网站上推荐了一本书,由于highchart在平时工作中会用到,所以我们尝试将其翻译成中文,仅作为学习highchart工具的一种方式,以方便日后查阅. 翻译图书作为学习笔记,再加上我们的慵懒和无知,难免存在错误,欢迎批评指正. 简介 Highcharts是一个javascript的画图工具,<Learning Highcharts>介绍了如何使用highcharts,包括: 如何一步步将数据转化为既专业又美观的条形图.柱状图和饼图的方法. 创建图表的实用技巧.包括手册…

Deep Residual Learning

最近在做一个分类的任务,输入为3通道车型图片,输出要求将这些图片对车型进行分类,最后分类类别总共是30个. 开始是试用了实验室师姐的方法采用了VGGNet的模型对车型进行分类,据之前得实验结果是训练后最高能达到92%的正确率,在采用了ImageNet训练过的DataLayer之后,可以达到97%的正确率,由于我没有进行长时间的运行测试,运行了十几个小时最高达到了92%的样子. 后来是尝试使用Deep Residual Learning的ImageNet(以后简称ResNet)的实现方法,十几个小…

【The second day of Crawler learning】的更多相关文章

The sixth day of Crawler learning

The fifth day of Crawler learning

The fourth day of Crawler learning

The third day of Crawler learning

The second day of Crawler learning

The first day of Crawler learning

Machine and Deep Learning with Python

Node.js Learning Paths

【Machine Learning】KNN算法虹膜图片识别

【Machine Learning】Python开发工具：Anaconda+Sublime

【Machine Learning】机器学习及其基础概念简介

【Machine Learning】决策树案例：基于python的商品购买能力预测系统

Deep learning：五十一(CNN的反向求导及练习)

Programming Learning - Based on Project

做中学（Learning by Doing）之背单词-扇贝网推荐

【原】Learning Spark (Python版) 学习笔记(一)----RDD 基本概念与命令

【原】Learning Spark (Python版) 学习笔记(四)----Spark Sreaming与MLlib机器学习

【机器学习Machine Learning】资料大全

【深度学习Deep Learning】资料大全

【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL

[Machine Learning & Algorithm] 神经网络基础

[Machine Learning] Active Learning

[Machine Learning & Algorithm]CAML机器学习系列2：深入浅出ML之Entropy-Based家族

[Machine Learning & Algorithm]CAML机器学习系列1：深入浅出ML之Regression家族

《Learning Highcharts》中文翻译

Deep Residual Learning

《Neural Network and Deep Learning》_chapter4

Dictionary Learning(字典学习、稀疏表示以及其他)

基于Deep Learning 的视频识别方法概览

machine learning基础与实践系列