#导入scipy库,库中已经有实现的kmeans模块,直接使用, #根据六个人的分数分为学霸或者学渣两类 import numpy as np from scipy.cluster.vq import vq,kmeans,whiten list1=[88,64,96,85] list2=[92,99,95,94] list3=[91,87,99,95] list4=[78,99,97,81] list5=[88,78,98,84] list6=[100,95,100,92] #将数据组成数组 d…
将数据可视化有许多选择: 图的类型 定制化方式 选择什么样的表现方式通常取决于: 数据 你想表达什么 1.Labels # Basic scatter plot, log scale plt.scatter(gdp_cap, life_exp) plt.xscale('log') # Strings xlab = 'GDP per Capita [in USD]' ylab = 'Life Expectancy [in years]' title = 'World Development in…
一.理解rabbitmq的基本背景 1.理解消息队列 1.1 普通queue 在前面的博客中所提到的队列,此处均称之为普通队列 简述一下普通队列的一些分类及不足 1.1.1 基本Queue:queue 1.1.2 线程queue:threading.queue() 1.1.3 进程queue:multiprocessing.queue(). 普通queue的不足: 不同的线程可以通过线程queue来进行通信,但其他的子进程无法使用这个线程queue 父进程的子进程之间可以使用进程queue进行通…
1.先看看要爬的网站有没有爬虫协议,可以看该网站有没有robots.txt,如豆瓣的: 2.requests模块:[requests是第三方,代码比python自带的urllib模块简单] 先加载requests模块,然后输入要抓取的地址: import requests r=requests.get(‘https://book.douban.com/subject/28135034/?icn=index-latestbook-subject') print(r.text) 结果如下:输出该网页…
今日内容 函数小高级 lambda 表达式 内置函数 内容回顾 函数基本结构 参数 形参 基本参数:def func(a1,a2):pass 默认值:def func(a1,a2=123):pass 注意: 默认值如果是不可变类型,随便玩. 可变类型:有坑 无敌:*args,**kwargs 实参 位置传参 关键字传参 返回值 默认返回:None 特殊情况 def func(): return 1,2,32,4 #(1, 2, 32, 4) 作用域 全局和局部 自己有找自己,自己没有找父级. 子…
#!/usr/bin/env python # -*- coding: utf-8 -*- """ @desc: search in mail box """ import unittest import os import sys from selenium import webdriver from selenium.webdriver.common.keys import Keys cur_dir = os.getcwd() sys.pat…
最近北京开始实行垃圾分类,导致大家对垃圾的研究热度突然涨高,垃圾们也纷纷表示从来没有获得过这么高的关注度.其实,上海市去年已经开始实行,网上已经有不少成熟的教程了,像什么<垃圾分类从入门到精通>.<深入浅出垃圾分类>.<垃圾分类你应该掌握的10条基本原则>.这种教程如果我们亲自去学显然不符合程序员的个性,作为一个程序员,我们应该把这事儿交给机器来做,这样才能省下更多的时间投入到996中. 扯了这么多废话,下面言归正传,今天这篇文章主要介绍如何利用现有的工具来实现一个垃圾…
一个简单的行列转换例子,原始数据. create table temp_cwh_student ( name ), subject ), score ) ) select * from temp_cwh_student -- 行转列 select name as "姓名", end ) as "语文", end ) as "数学", end ) as "英语", sum(score) as "总分", av…
机器学习算法与Python实践这个系列主要是参考<机器学习实战>这本书.因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学习算法.恰好遇见这本同样定位的书籍,所以就参考这本书的过程来学习了. 机器学习中有两类的大问题,一个是分类,一个是聚类.分类是根据一些给定的已知类别标号的样本,训练某种学习机器,使它能够对未知类别的样本进行分类.这属于supervised learning(监督学习).而聚类指事先并不知道任何样本的类别标号,…
http://blog.csdn.net/zouxy09/article/details/17590137 机器学习算法与Python实践之(六)二分k均值聚类 zouxy09@qq.com http://blog.csdn.net/zouxy09 机器学习算法与Python实践这个系列主要是参考<机器学习实战>这本书.因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学习算法.恰好遇见这本同样定位的书籍,所以就参考这本书的过程来…