如何判断宽窄依赖: =================================== 6. Spark 底层逻辑 导读 从部署图了解 Spark 部署了什么, 有什么组件运行在集群中 通过对 WordCount 案例的解剖, 来理解执行逻辑计划的生成 通过对逻辑执行计划的细化, 理解如何生成物理计划   如无特殊说明, 以下部分均针对于 Spark Standalone 进行介绍 部署情况 在 Spark 部分的底层执行逻辑开始之前, 还是要先认识一下 Spark 的部署情况, 根据部署情…
Spark Streaming 导读 介绍 入门 原理 操作 Table of Contents 1. Spark Streaming 介绍 2. Spark Streaming 入门 2. 原理 3. 操作 1. Spark Streaming 介绍 导读 流式计算的场景 流式计算框架 Spark Streaming 的特点 新的场景 通过对现阶段一些常见的需求进行整理, 我们要问自己一个问题, 这些需求如何解决? 场景 解释 商品推荐 京东和淘宝这样的商城在购物车, 商品详情等地方都有商品推…
Python的很多教材中并没有讲内存方面的知识,但是内存的知识非常重要,对于计算机工作原理和方便理解编程语言是非常重要的,尤其是小白,因此需要把这一方面加上,能够更加深入的理解编程语言.这里引用了C语言关于内容的详细讲解,其实很多知识都是相同的. 第一部分:程序(计算机运行)为什么需要内存? 对于内存的理解是对编程语言直接相关的,如果没有对内存有很深的认识的话,对于编程语言也就是没有根本的认识,编程语言跟内存有千丝万缕的联系. 1.1 计算机程序运行的目的 计算机为什么需要编程?编程已经编了那么…
顾名思义,jmeter在做性能测试时,可以在不停止脚本的情况下修改负载压力,达到期望的测试效果.我们将通过Constant Throughput Timer(吞吐量计时器)和Beanshell服务器来组合完成. 1:在jmeter中添加Constant Throughput Timer.我们将通过设置“目标吞吐量”值来控制在测试中每分钟执行的请求数.由于我们要通过命令行更新此值,因此必须将其定义为参数.通过编写${__P(hits,1200)},默认值将设置为1200. 吞吐量将基于每个线程进行…
第一部分   Ubuntu简介 Ubuntu(乌班图)是一个机遇Debian的以桌面应用为主的Linux操作系统,据说其名称来自非洲南部祖鲁语或科萨语的“Ubuntu”一词,意思是“人性”.“我的存在是因为大家的存在”,是非洲传统的一种价值观. Ubuntu的目的在于为一般用户提供一个最新同时又相当稳定,主要以自由软件构建而成的操作系统.Ubuntu目前具有庞大的社区力量支持,用户可以方便的从社区获得帮助. 第二部分 安装(略:参照环境配置) 第三部分   磁盘类型和分区(常识了解) 3.1  …
通过对内存这一个部分的讲解,对编程会有一个相对深入的认识.数据结构是整个内存的一个重要内容,那么关于数据结构这方面的问题还需要对进制.位运算.编码这三个方面再进行阐述一下.前面说将的数据结构是从逻辑上进行这方面的讲解,现在从原理和过程角度进行阐述. 我们编程其实就是在跟数据进行打交道,计算机每时每刻都在运算(计算这些数据),那么计算机是通过什么方式把大千世界的数据转换成计算机能看得懂的“语言”?通过下面这三方面会对这个过程有更深入的认识. 第一部分:进制 1.1   进制这个概念是从哪里来的?…
学完条件控制语句和循环控制语句后,在这里就会把“语言”的精妙之处进行讲解,也就是语句的嵌套.我们在看别人代码的时候总会对一些算法拍案叫绝,里面包含精妙和精密的逻辑分析.语句的嵌套也就是在循环体内可以嵌入条件结构语句,在条件结构语句中也可以嵌入循环体,进行互为条件的计算,计算出包罗万千的个中算法和得到想要的结果. 另外,我们在这里要补充4个关键字,也就是在语句嵌套中起到“调味剂”的作用. (1) break 作用:跳出for和while循环,目的就是为了结束循环. 注意:它只能跳出距离它最近的那一…
这一部分分三个主题进行讲解,主要为后面的模块.包.第三方库的概念补充一些相关的内容. 1. 路径(Path): 相对路径和绝对路径. 举例1:我们先导入一个os库(模块)来观察一下路径 import os # 绝对路径 print(os.path.abspath(".")) # 表示当前所处的文件夹的绝对路径 print(os.path.abspath("..")) # 表示当前所处的文件夹上一级文件夹的绝对路径 # 返回值: # F:\QUANT\练习 # F:\…
函数:这个词属于一个数学概念,在编程语言借鉴了这个概念,表现形式是一段程序代码的组合,也叫“程序集”.有过编程基础的人很容易理解这个概念,当我们编写程序越来越多的时候,程序设计大师们会把散乱的程序进行高度的抽象化的概念.可能有:程序-函数-模块-包-库,这样一个路径. 怎么认识函数? 函数是在一个完整的项目中,某些功能会返回使用,那么我们会讲功能进行“封装”,当我们要使用功能的时候直接调用函数即可. 本质:函数就是对功能的封装 优点: 1. 简化了代码结构,增加了代码的复用度(重复使用的程度)…
Python正如其他语言一样存在两种常用的逻辑判断体(也叫结构化程序设计).所谓逻辑判断体是通过你想要完成的编程思路,通过在逻辑判断体中的相互判断和作用得到你想要的结果.逻辑判断体也叫控制语句,Python分为两种:第一种叫:条件控制语句:第二种叫:循环控制语句.另外,还会对这两种判断体之间的组合进行举例,也就是所谓语句的嵌套.这里要特别说明的,基本上来说,任何语言对于语句的执行过程都是从上而下,从左至右的这么一个过程,这个逻辑必须要有!这部分的内容是最有意思,并且是Python语言的重中之重,…