下面一文章就总结几点关键: 1.要学会观察,尤其是输入数据的特征提取时,看各输入数据和输出的关系,用绘图看! 2.训练后,看测试数据和训练数据误差,确定是否过拟合还是欠拟合: 3.欠拟合的话,说明模型不准确或者特征提取不够,对于特征提取不够问题,可以根据模型的反馈来看其和数据的相关性,如果相关系数是0,则放弃特征,如果过低,说明特征需要再次提炼! 4.用集成学习,bagging等通常可以获得更高的准确度! 5.缺失数据可以使用决策树回归进行预测! 转自:http://blog.csdn.net…
项目地址 https://www.kaggle.com/c/titanic 项目介绍: 除了乘客的编号以外,还包括下表中10个字段,构成了数据的所有特征 Variable Definition Key survival 是否存活 0 = No, 1 = Yes pclass 票的等级 1 = 1st, 2 = 2nd, 3 = 3rd sex 性别   Age 年龄   sibsp 同乘配偶或兄弟姐妹   parch 同乘孩子或父母   ticket 票号   fare 乘客票价   cabin…
一直想着抓取股票的变化,偶然的机会在看股票数据抓取的博客看到了kaggle,然后看了看里面的题,感觉挺新颖的,就试了试. 题目如图:给了一个train.csv,现在预测test.csv里面的Passager是否幸存.train.csv里面包含的乘客信息有 PassagerId 乘客id Survived 乘客是否幸存 Pclass 仓位 Name 乘客姓名 Sex 乘客性别 Age 乘客年龄 SibSp 船上是否有兄弟姐妹 Parch 穿上是否有父母子女 Ticket 船票信息 Fare 票价…
泰坦尼克号幸存预测是本小白接触的第一个Kaggle入门比赛,主要参考了以下两篇教程: https://www.cnblogs.com/star-zhao/p/9801196.html https://zhuanlan.zhihu.com/p/30538352 本模型在Leaderboard上的最高得分为0.79904,排名前13%. 由于这个比赛做得比较早了,当时很多分析的细节都忘了,而且由于是第一次做,整体还是非常简陋的.今天心血来潮,就当做个简单的记录(流水账). 导入相关包: import…
项目简介: 在Linux环境下用C语言开发的Vsftpd的简化版本,拥有部分Vsftpd功能和相同的FTP协议,系统的主要架构采用多进程模型,每当有一个新的客户连接到达,主进程就会派生出一个ftp服务进程来为客户提供服务.同时每个ftp服务进程配套了nobody进程(内部私有进程),主要是为了做权限提升和控制. 实现功能: 除了基本的文件上传和下载功能,还实现模式选择.断点续传.限制连接数.空闲断开.限速等功能. 用到的技术: socket.I/O复用.进程间通信.HashTable 欢迎技术交…
故事A段:发现整站SQL对外输出: 有个朋友的网站,由于是外包项目,深圳某公司开发的,某天我帮他检测了一下网站相关情况. 我查看了页面源代码,发现了个惊人的事情,竟然整站打印SQL到Html里,着实吓我一跳: PS:2年前秋色园系列文章有分享一文是整站SQL打印用于分析网站性能,不过也只是本地优化调试,而服务器上也采用某特殊条件才打印. 于是把这赤祼祼的对外公开的SQL问题反映了过去,之后算是取消了.  故事B段:错误异常打印了SQL,诱人:  过了些许天,我又抽空看了看: 原始路径为:http…
自己亲自写的第一个小项目,学了几天写出来的一个小模块,可能还不是很完美,但是还算可以了,初学者看看还是很有用的,代码注释不是很多,有问题可以加我QQ 281754043 一.项目介绍 目的: 测试某官方网站登录功能模块可以正常使用 用例: 1.输入格式正确的用户名和正确的密码,验证是否登录成功: 2.输入格式正确的用户名和不正确的密码,验证是否登录失败,并且提示信息正确: 3.输入格式正确的用户名和任意密码,验证是否登录失败,并且提示信息正确: 4.用户名和密码两者都为空,验证是否登录失败,并且…
A Data Science Framework: To Achieve 99% Accuracy https://www.kaggle.com/ldfreeman3/a-data-science-framework-to-achieve-99-accuracy/notebook 额,总共花了2天时间才把上面这个优秀回答运行完,前面还算看得懂,如何清理数据,和画图看联系 但是后面的数据处理,使用各种模型,不知道原理是什么,后面还得花点时间补一下,现在这里记录一下 疑问汇总: 第一问,第21行,左…
docker自动化部署前端项目实战一 本文适用于个人项目,如博客.静态文档,不涉及后台数据交互,以部署文档为例. 思路 利用服务器node脚本,监听github仓库webhook push事件触发post请求,自动拉取最新代码,再用docker接管项目编译.部署. 环境 本文使用云服务器搭建,环境版本: OS:CentOS Linux release 8.2.2004 docker:19.03.12 node:14.5.0 git:2.18.4 云服务器如果没有安装以下环境,需要安装. dock…
此模型中,输入是28*28*1的图片,经过两个卷积层(卷积+池化)层之后,尺寸变为7*7*64,将最后一个卷积层展成一个以为向量,然后接两个全连接层,第一个全连接层加一个dropout,最后一个全连接层输出10个分类的预测结果,然后计算损失,进行训练. 代码如下: import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #定义一个获取卷积核的函数 def weight_variable(…