BendFord's law's Chi square test】的更多相关文章

http://www.siam.org/students/siuro/vol1issue1/S01009.pdf bendford'law e=log10(1+l/n) o=freq of first digit / total x2= N*sum(power((o-e),2)/e) 1-9的乘法表中的数字算出来的chisquare test is 4.881 其第一个数字出现频率和benford标准值放大一百倍为: Digit Benford Probability Observed Prob…
The chi squared distance d(x,y) is, as you already know, a distance between two histograms x=[x_1,..,x_n] and y=[y_1,...,y_n] having n bins both. Moreover, both histograms are normalized, i.e. their entries sum up to one.The distance measure d is usu…
https://www.fdic.gov/regulations/examinations/credit_card/ch8.html Types of Scoring FICO Scores    VantageScore    Other Scores              Application Scoring              Attrition Scoring              Bankruptcy Scoring              Behavior Scor…
// // 问题到数据 理解问题 理解客户的问题:谁是客户(某航空公司)?交流,交流,交流! 问题要具体 某航空公司: 乘客体验如何?哪方面需要提高? 类别:比较.描述.聚类,判别还是回归 需要什么样的数据:现有数据,数据质量,需要收集的数据,自变量,因变量 哪些方面的满意度?哪些主要竞争对手? 内部数据?外部数据? 领导不关心的问题都是没有未来的! 设计问卷 礼貌(Courtesy) 友善(Friendliness) 能够提供需要的帮助(Helpfulness) 食物饮料服务(Service)…
与第一篇博文特征脸方法不同,LBP(Local Binary Patterns,局部二值模式)是提取局部特征作为判别依据的.LBP方法显著的优点是对光照不敏感,但是依然没有解决姿态和表情的问题.不过相比于特征脸方法,LBP的识别率已经有了很大的提升.在[1]的文章里,有些人脸库的识别率已经达到了98%+. 1.LBP特征提取 最初的LBP是定义在像素3x3邻域内的,以邻域中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0.这样,…
生成对抗网络(Generative Adversarial Networks,GANs),由2014年还在蒙特利尔读博士的Ian Goodfellow引入深度学习领域.2016年,GANs热潮席卷AI领域顶级会议,从ICLR到NIPS,大量高质量论文被发表和探讨.Yann LeCun曾评价GANs是"20年来机器学习领域最酷的想法". Generative Adversarial Nets(GAN) Generative Adversarial Networks论文提出了一种通过对抗过…
http://blog.csdn.net/pipisorry/article/details/49515215 统计函数Statistical functions(scipy.stats) Python有一个很好的统计推断包.那就是scipy里面的stats. Scipy的stats模块包含了多种概率分布的随机变量,随机变量分为连续的和离散的两种.所有的连续随机变量都是rv_continuous的派生类的对象,而所有的离散随机变量都是 rv_discrete的派生类的对象. This modul…
python信用评分卡(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share  banking case1 http://ucanalytics.com/blogs/data-visualization-case-study-banking/ A…
scipy.stats Scipy的stats模块包含了多种概率分布的随机变量,随机变量分为连续的和离散的两种.所有的连续随机变量都是rv_continuous的派生类的对象,而所有的离散随机变量都是 rv_discrete的派生类的对象. This module contains a large number of probability distributions as well as a growing library of statistical functions. Each univ…
分析人:BUPT_LX 研究目的 用某些算法对2014年12月份的16家国内A股上市的商业银行当中11项財务数据(资产总计.负债合计.股本.营业收入.流通股A.少数股东权益.净利润.经营活动的现金流量净额.投资活动的现金流量净额.筹资活动的现金流量净额.汇率变动对现金的影响)提取分析,得出股票价格的財务影响原因.更加清楚地指导银行股价与財务数据指标之间的联系. 研究方法 主要有描写叙述性分析.因子分析.回归法 方法概述: 1. 先对上述的財务数据进行提取.然后用常规的描写叙述方法(平均.最大.最…