李宏毅机器学习--PM2.5预测】的更多相关文章

一.说明 给定训练集train.csv,要求根据前9个小时的空气监测情况预测第10个小时的PM2.5含量. 训练集介绍: (1).CSV文件,包含台湾丰原地区240天的气象观测资料(取每个月前20天的数据做训练集,12月X20天=240天,每月后10天数据用于测试,对学生不可见); (2).每天的监测时间点为0时,1时......到23时,共24个时间节点; (3).每天的检测指标包括CO.NO.PM2.5.PM10等气体浓度,是否降雨.刮风等气象信息,共计18项: 二.数据处理 根据要求,要用…
版权声明:小博主水平有限,希望大家多多指导.本文仅代表作者本人观点,转载请联系知乎原作者——BG大龍. 目录 1 什么是机器学习? 2 机器学习的3个步骤 3 李宏毅老师的机器学习课程 4 按“模型的不同学习理论”分,机器学习的模型可以分为有监督学习,半监督学习,无监督学习,迁移学习和强化学习. ——4.1[解读] 有监督学习(Supervised Learning) ————4.1.1 监督学习Supervised Learning-> 回归Regression ————4.1.2 监督学习S…
本文为作者学习李宏毅机器学习课程时参照样例完成homework1的记录. 任务描述(Task Description) 现在有某地空气质量的观测数据,请使用线性回归拟合数据,预测PM2.5. 数据集描述(Dataset Description) train.csv 该文件中是2014年每月前20天每小时的观察数据,每小时的数据是18个维度的(其中之一是PM2.5). test.csv 该文件中包含240组数据,每组数据是连续9个小时的所有观测数据(同样是18个维度). 请预测每组数据对应的第10…
参考: 原视频:李宏毅机器学习-Keras-Demo 调参博文1:深度学习入门实践_十行搭建手写数字识别神经网络 调参博文2:手写数字识别---demo(有小错误) 代码链接: 编程环境: 操作系统:win7 - CPU anaconda-Python3-jupyter notebook tersonFlow:1.10.0 Keras:2.2.4 背景: 视频里宝可梦大师提供的部分参数设置不能得到好的结果,这里记录一下后续调参 1-载入数据报错的问题: 载入数据运行时报错:[WinError 1…
李宏毅机器学习课程---4.Gradient Descent (如何优化) 一.总结 一句话总结: 调整learning rates:Tuning your learning rates 随机Gradient Descent:Stochastic Gradient Descent 特征缩放:Feature Scaling stochastic英 [stə'kæstɪk]  美 [sto'kæstɪk] adj. [数] 随机的:猜测的 1.如何调整 Learning Rates? 比如先大后小:…
李宏毅机器学习课程---3.Where does the error come from 一.总结 一句话总结:机器学习的模型中error的来源是什么 bias:比如打靶,你的瞄准点离准心的偏移 variance:比如打靶,你的实际打靶的位置 偏离你的瞄准点的距离:相当于方差 1.机器学习中为什么需要判断error的来源? 有的放矢,改进模型:因为你的模型出错,你肯定需要改进模型,知道错误来源后才方便改进模型 2.做多次实验,一次函数和多次函数的函数在图上如何分布? 多次函数在多次实验中分布的线…
李宏毅机器学习课程---2.Regression - Case Study 一.总结 一句话总结: 分类讨论可能是比较好的找最佳函数的方法:如果 有这样的因素存在的话 模型不够好,可能是因素没有找全 因素以及函数的复杂度,并不是越高越好,适合的才是最好的 1.AI训练师的工作是什么? 为机器挑选[合适的model 和 loss function],不同的model和loss function,来适合解决不同的问题 loss英 [lɒs]  美 [lɔs] n. 减少:亏损:失败:遗失n. (Lo…
一.作业说明 给定训练集train.csv,要求根据前9个小时的空气监测情况预测第10个小时的PM2.5含量. 训练集介绍: (1)CSV文件,包含台湾丰原地区240天的气象观测资料(取每个月前20天的数据做训练集,12月X20天=240天,每月后10天数据用于测试,对学生不可见); (2)每天的监测时间点为0时,1时......到23时,共24个时间节点; (3)每天的检测指标包括CO.NO.PM2.5.PM10等气体浓度,是否降雨.刮风等气象信息,共计18项. 用excel打开,繁体字会出现…
python也不会,计算机也不会,啥都不会,只带了个脑子考了计算机研究生.研究生选了人工智能方向.看来注定是漫长的学习之旅. PM2.5作业,我是一个字都看不懂.所以我采用了直接看答案的方案.把答案看懂也是一种本事. 把答案CV上来. import sysimport pandas as pdimport numpy as np #环境,就不说了.ananconda真的难装.#提取TEST数据集 data = pd.read_csv('work/hw1_data/train.csv', enco…
一.作业说明 给定训练集spam_train.csv,要求根据每个ID各种属性值来判断该ID对应角色是Winner还是Losser(0.1分类). 训练集介绍: (1)CSV文件,大小为4000行X59列; (2)4000行数据对应着4000个角色,ID编号从1到4001; (3)59列数据中, 第一列为角色ID,最后一列为分类结果,即label(0.1两种),中间的57列为角色对应的57种属性值. 二.思路分析及实现 2.1 思路分析 这是一个典型的二分类问题,结合课上所学内容,决定采用Log…