NaN 计算softmax loss时要用numeric robust 的计算方式. softmax与 loss可能要分开计算. 得到前者的计算方式可以是常规方法. 但计算后者时要注意无穷大和NaN的出现. NaN的出现一定是因为出现了无穷大. 无穷大的出现则是因为变量存储的数值超出了变量数据类型能表示的最大值.使用GPU计算常用float32, 它的最大表示值在\(10^{38.5}\)附近. learning_rate太大可能导致非数的出现: weight值会变得很大(超过10应该就算大了)…
衔接上文[解读REST] 5.Web的需求 & 推导REST,上文根据Web的需求推导出了REST架构风格,以及REST的详细描述和解释.自从1994年以来,REST架构风格被用于指导Web架构的设计和开发工作,最重要的两点体现是在设计HTTP和URI两个互联网规范协议中,以及实现这些规范的libwww-perl客户端库,Apache HTTP项目(httpd)以及其他的实现中,所得到的经验以及教训. 其实REST也用于指导约束超媒体的设计工作,比如HTML,但是Fielding并未在论文中详细…
作者 | 孙健波(阿里巴巴技术专家).赵钰莹 导读:云原生时代,Kubernetes 的重要性日益凸显.然而,大多数互联网公司在 Kubernetes 上的探索并非想象中顺利,Kubernetes 自带的复杂性足以让一批开发者望而却步.本文中,阿里巴巴技术专家孙健波在接受采访时基于阿里巴巴 Kubernetes 应用管理实践过程提供了一些经验与建议,以期对开发者有所帮助. 在互联网时代,开发者更多是通过顶层架构设计,比如多集群部署和分布式架构的方式来实现出现资源相关问题时的快速切换,做了很多事情…
参考文章: http://blog.csdn.net/u013059662/article/details/52770198 caffe的安装配置,以及fcn的使用在我前边的文章当中都已经提及到了,这边不会再细讲.在下边的内容当中,我们来看看如何使用别人提供的数据集来训练自己的模型!在这篇文章之后,我计划还要再写如何fine-tune和制作自己的数据集,以及用自己的数据集fine-tune. (一)数据准备(以SIFT-Flow 数据集为例) 下载数据集:  http://pan.baidu.c…
一年前,我决定开始探索生成式对抗网络(GANs).自从我对深度学习产生兴趣以来,我就一直对它们很着迷,主要是因为深度学习能做到很多不可置信的事情.当我想到人工智能的时候,GAN是我脑海中最先出现的一个词. GANs生成的人脸(StyleGAN) 但直到我第一次开始训练GAN时,我才发现了这种有趣算法的双面性:训练极其困难.确实,在我尝试之前,我从论文上和其他人的尝试中了解到这一点,但我一直认为他们夸大了一个本来很小但很容易克服的问题. 事实证明我错了. 当我尝试生成与传统的MNIST案例不同的东…
这是训练的路锥.警示柱的数据,也就是小物体的.小物体有两个定义,一个是本身像素少,另一个是物体相对于整张图片的比例小 这是把图片缩小到600 proposal_target_layer选取用来训练的proposal的情况: 下图是缩小到900的: 其实我想知道为什么小物体,经过proposal_Target_layer后出来的proposal这么少了 个人感觉是nms过滤掉了很多,因为其他地方不太可能 可以发现,把缩小的尺寸扩大后,proposal的总体增多,特别是负例增多特别多,正例多数还是不…
作者 | 孙健波(天元)  阿里巴巴技术专家 导读:本文整理自孙健波在 ArchSummit 大会 2019 北京站演讲稿记录.首先介绍了阿里巴巴基于 Kubernetes 项目进行大规模应用实践过程中遇到的问题:随后会逐一介绍解决这些问题的现有实践及其本身存在的局限性:最后会介绍阿里巴巴目前正在进行的尝试和社区在这一领域的发展方向. 如今,阿里巴巴内部维护了数十个大规模的 K8s 集群,其中最大的集群约 1 万个节点,每个集群会服务上万个应用:在阿里云的 Kubernetes 服务 ACK 上…
这两天在初学目标检测的算法及步骤,其中人脸检测作为最经典的算法,于是进行了重点研究.该算法最重要的是建立人脸检测分类器,因此我用了一天的时间来学习分类器的训练.这方面的资料很多,但是能按照一个资料运行出结果的确实没有找到,因此我总结了自己的训练经验. 目标检测分为三个步骤: 1.样本的创建 2.训练分类器 3.利用训练的分类器进行目标检测 第一步:样本的创建 ◆     样本分两种: 正样本与负样本(也有人翻译成:正例样本和反例样本),其中正样本是指待检目标样本(例如人脸,汽车,鼻子等),负样本…
仿佛是忽然间产生的问题,每次程序退出时候,必然崩溃,花了整整一天才找到原因,就是对数据库的IO读写错误.主要是因为析构函数调用了Disconnect函数,内容如下: void SFTPTool::Disconnect() { if (!m_valided) IsCompteValide(); if (!m_valided) { return; } QString strModule = "soft"; if (!m_taskname.isEmpty()) strModule = m_t…
目录 darknet优化经验 1. AlexeyAB改进项 2. Linux下编译选项 3. 训练经验 4. 提升检测效果 5. 总结 6. AlexeyAB大神改进 darknet优化经验 主要来自于:AlexeyAB 版本darknet 1. AlexeyAB改进项 提供window支持 相较于原版pjreddie版本darknet提升了训练速度 添加了二值化网络,XNOR(bit) ,速度快,准确率稍低https://github.com/AlexeyAB/darknet/blob/mas…
本教程讲解如何使用深度强化学习训练一个可以在 CartPole 游戏中获胜的模型.研究人员使用 tf.keras.OpenAI 训练了一个使用「异步优势动作评价」(Asynchronous Advantage Actor Critic,A3C)算法的智能体,通过 A3C 的实现解决了 CartPole 游戏问题,过程中使用了贪婪执行.模型子类和自定义训练循环. 该过程围绕以下概念运行: 贪婪执行——贪婪执行是一个必要的.由运行定义的接口,此处的运算一旦从 Python 调用,就要立刻执行.这使得…
本教程讲解如何使用深度强化学习训练一个可以在 CartPole 游戏中获胜的模型.研究人员使用 tf.keras.OpenAI 训练了一个使用「异步优势动作评价」(Asynchronous Advantage Actor Critic,A3C)算法的智能体,通过 A3C 的实现解决了 CartPole 游戏问题,过程中使用了贪婪执行.模型子类和自定义训练循环. 该过程围绕以下概念运行: 贪婪执行——贪婪执行是一个必要的.由运行定义的接口,此处的运算一旦从 Python 调用,就要立刻执行.这使得…
http://forum.china.unity3d.com/thread-25087-1-9.html 在Unite Europe 2017的Keynote主题演讲中,我们为大家分享了将主机游戏<影子战术>现场移植到移动平台的过程,并分享了游戏针对移动平台进行的优化.今天这篇文章将为大家分享该游戏制作过程中总结的开发经验. 这其中的很多问题只有当你真正在制作主机游戏.手机游戏.或者处理巨量游戏内容时才会出现.如果在开发的早期就能把这些问题考虑进去,那么在开发过程中,你会更轻松,而你的游戏也会…
文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 数智物语(公众号ID:decision_engine)出品 策划.编写:卷毛雅各布 「我们相信,在垃圾泛滥的互联网海洋中,真正有价值的信息是绝对的稀缺品.」知乎CTO李大海曾在全球移动互联网大会提到知乎诞生的初心,而这位CTO也在各种场合不遗余力的提到知乎对于AI投入和应用. 知乎合伙人.CTO李大海 对于一个的坐拥1.4亿多用户,平均日活跃用户量超过 3400 万,人均日访问时长 1 小时,月累计…
不久前,我接受了51Testing的访问,讨论了软件测试的一些问题.以下是全文. 1.史亮老师,作为我们51Testing的老朋友,能和我们说说您最近在忙些什么吗? 自2011年起,我加入Microsoft Office部门,参与了Microsoft Office 2013的研发,主要工作是测试Windows版本的Office产品.目前,我正参与研发下一代的Microsoft Office,主要工作是测试产品和开发测试辅助工具. 今年,我的新书<软件测试实战>问世.这本书基于一个很朴素的想法:…
一.技能学习经验 有什么技能比90%的人更好? 这个问题问的就很emmmm..我觉得自己的推理和逻辑思维能力比较出众,面对新事物的自学速度比较快. 针对技能谈一下成功的经验. 每一项出众的技能都是与平时息息相关的.我的自学能力跟我从小所处的环境和教育方式挂钩.小时候爸妈就不怎么管我的学习,我的学习压力就没有这么大,所以平常就喜欢自己提前学习完要学的教材然后可以去干其他自己想干的事情.而且我的初中高中的教学方式也比较注重自学的能力.平常也喜欢和同学们玩桌游,类似于狼人杀.阿瓦隆等等需要很强推理能力…
读后感 我花时间仔细阅读了娄老师公众号上的那5篇关于自己各个方面学习经历的文章,随后深为震撼又自愧不如. 我实在没想到,这套学习方法竟有如此巨大的力量!纵使在娄老师不熟悉的乒乓球领域,娄老师也能通过这样的努力来让自己变得强大. 在读这些文章时,我脑子里最常浮现出的是这样一句话--"种一棵树最好是在十年前,其次是现在".我们经常拿着"现在学已经晚了,学不会了"这样的借口来安抚自己的慵懒与不争,却把"只怕有心人"视而不见. 可以看得出来,娄老师一直秉…
目录 1 概述:在平凡中求变 2 专业分流:一个时代的终点,我的新起点 2.1 我在专业分流前夕的境况 2.2 专业分流情况概述,以及对一篇文章的回顾 2.3 总结与余绪 2.4 附:关于理科与工科的看法 3 说不出口:两个世界间的阻隔 3.1 观念世界的"光荣孤立" 3.2 几次尝试,以及一点初步的看法 3.3 结论:期待突破 4 关于南洋赛艇俱乐部:一些感想 5 有关非功利:若干经验与教训 5.1 建立在个人观念上的非功利意识 5.2 在非功利观念指导下获得的若干"成就&…
部分转自:https://zhuanlan.zhihu.com/p/37618829 一.语义分割基本介绍 1.1 概念 语义分割(semantic segmentation) : 就是按照"语义"给图像上目标类别中的每一点打一个标签,使得不同种类的东西在图像上被区分开来.可以理解成像素级别的分类任务. 输入: (HW3)就是正常的图片 输出: ( HWclass )可以看为图片上每个点的one-hot表示,每一个channel对应一个class,对每一个pixel位置,都有class…
原文地址:DeepLabv3 代码: TensorFlow Abstract DeepLabv3进一步探讨空洞卷积,这是一个在语义分割任务中:可以调整滤波器视野.控制卷积神经网络计算的特征响应分辨率的强大工具.为了解决多尺度下的目标分割问题,我们设计了空洞卷积级联或不同采样率空洞卷积并行架构.此外,我们强调了ASPP(Atrous Spatial Pyramid Pooling)模块,该模块可以在获取多个尺度上卷积特征,进一步提升性能.同时,我们分享了实施细节和训练方法,此次提出的DeepLab…
欢迎访问网易云社区,了解更多网易技术产品运营经验. 这个双十一,人工智能市场火爆,从智能音箱到智能分拣机器人,人工智能已逐渐渗透到我们的生活的方方面面.网易云社区联合博文视点为大家带来人工智能热门图书专场,这些书籍将引领我们一起去解密人工智能,了解这位即将走进我们生活的"朋友". 知乎活动的帖子:https://zhuanlan.zhihu.com/p/50078535 参与规则:在知乎帖子评论回复以下你最想看的一本书名称即可.注意是知乎帖子回复,不是本帖回复哦 以下为奖品图书简介:…
1.How do you keep updating lastest IT knowledge? 1).keep an eye on current project technology evethod I didn't apply it directly such as the CDN product Achmai, the caching framework terrorcoctoer, witch is not the same as the KV mechanism caching sy…
2019年春季学期 计算机学院<软件构造>课程 Lab 2实验报告 姓名 刘帅 学号 班号 1703008 电子邮件 1609192321@qq.com 手机号码 目录   1 实验目标概述··· 1 2 实验环境配置··· 1 3 实验过程··· 1 3.1 Poetic Walks· 1 3.1.1 Get the code and prepare Git repository· 1 3.1.2 Problem 1: Test Graph <String>· 1 3.1.3 P…
结对编程项目总结   一.项目需求分析与功能总结 (1)用户注册功能 用户提供手机号码,点击注册将收到一个注册码,用户可使用该注册码完成注册. (2)设置密码功能 密码6-10位,必须含大小写字母和数字. 有两种场景需要修改密码: ①新注册用户首次设置密码,用户输入两次密码匹配后设置密码成功. ②已注册用户登录状态下修改旧密码.用户在登录状态下可修改密码,输入正确的原密码,再输入两次相同的新密码后修改密码成功. (3)设置试卷功能 ①选择题目难度类型:小学.初中或高中. ②设置题目数量. (4)…
Theano https://github.com/Theano/Theano 描述: Theano 是一个python库, 允许你定义, 优化并且有效地评估涉及到多维数组的数学表达式. 它与GPUs一起工作, 并且在符号微分方面表现优秀. 文档: http://deeplearning.net/software/theano/ 概述: Theano是数值计算的主力, 它支持了许多我们列表当中的其他的深度学习框架. Theano由 frederic bastien 创建, 这是蒙特利尔大学机器学…
(防扒小助手) 本人CSDN博客: https://blog.csdn.net/m0_61753302https://blog.csdn.net/m0_61753302本人博客园博客(同步CSDN): https://www.cnblogs.com/kalesky/https://www.cnblogs.com/kalesky/如果对你有用的话欢迎点赞关注哟! 目录 1.实验目标概述 2.实验环境配置 3.实验过程 3.1 Poetic Walks 3.1.1 Get the code and …
Henrique Lobo Weissmann是一位来自于巴西的软件开发者,他是itexto公司的联合创始人,这是一家咨询公司.近日,Henrique在博客上撰文谈到了关于MongoDB的一些内容,其中有些观点值得我们,特别是正在和打算使用MongoDB的开发者关注. 到目前为止,MongoDB在巴西是最为流行的NoSQL数据库(至少根据关于MongoDB的博客数量以及文章所判断).MongoDB是个非常棒的解决方案,不过困扰我们的是很少有人了解过关于它的一些限制.这样的事情正在不断上演:人们看…
这个问题,当初在分析touch事件处理的时候按理应该分析到的,可是由于我当时觉得这块代码和touch的主题不是那么紧密, 就这么忽略掉了,直到后来在这上面遇到了问题.其实这个现象做Android开发的应该或多或少的都遇到过,我在我们自己的app中 也发现了这一现象,当初是百思不得其解,因为按照我自己的研究.分析,只有在一个view接受按下的touch事件时,才会调到view 自己的setPressed方法,从而改变background状态啊.这里的case明显没有按下这个子view啊,按下的是V…
1. Memcached简介 Memcached是以LiveJurnal旗下Danga Interactive公司的Bard Fitzpatric为首开发的高性能分布式内存缓存服务器.其本质上就是一个内存key-value数据库,但是不支持数据的持久化,服务器关闭之后数 据全部丢失.Memcached使用C语言开发,在大多数像Linux.BSD和Solaris等POSIX系统上,只要安装了libevent即可使用.在Windows下,它也有一个可用的非官方版本(http://code.jelly…
阿里巴巴集团技术丛书 深入分析Java Web技术内幕(修订版)(阿里巴巴集团技术丛书.技术大牛范禹.玉伯.毕玄联合力荐!大型互联网公司开发应用实践!) 许令波 著   ISBN 978-7-121-23293-0 2014年8月出版 定价:79.00元 464页 16开 编辑推荐 让读者知其然,并知其所以然,是<深入分析Java Web技术内幕(修订版)>一书最大的特色. 作者来自淘宝技术一线,亲历了淘宝网PV从1亿到10亿的发展历程,直接经历了在这个过程中技术的不断突破.飞跃等变迁,并积累…