转SISD、MIMD、SIMD、MISD计算机的体系结构的Flynn分类法

1. 计算平台介绍 Flynn于1972年提出了计算平台的Flynn分类法,主要根据指令流和数据流来分类,共分为四种类型的计算平台,如下图所示: 单指令流单数据流机器(SISD) SISD机器是一种传统的串行计算机,它的硬件不支持任何形式的并行计算,所有的指令都是串行执行.并且在某个时钟周期内,CPU只能处理一个数据流.因此这种机器被称作单指令流单数据流机器.早期的计算机都是SISD机器,如冯诺.依曼架构,如IBM PC机,早期的巨型机和许多8位的家用机等. 单指令流多数据流机器(SIMD) S…

多核CPU硬件架构介绍

转自:http://book.51cto.com/art/201004/197196.htm SISD.MIMD.SIMD.MISD计算机的体系结构 1. 计算平台介绍 Flynn于1972年提出了计算平台的Flynn分类法,主要根据指令流和数据流来分类,共分为四种类型的计算平台,如下图所示: 单指令流单数据流机器(SISD) SISD机器是一种传统的串行计算机,它的硬件不支持任何形式的并行计算,所有的指令都是串行执行.并且在某个时钟周期内,CPU只能处理一个数据流.因此这种机器被称作单指令流单…

向量体系结构(2)----SIMD指令集扩展和GPU

进行SIMD多媒体扩展的设计,源于一个很容易观察到的事实: 许多多媒体应用程序操作的数据类型比对32位处理器进行针对性优化的数据类型更窄一些. 图像三基色,都是8位.音频采样也都是8位和16位来表示. SIMD的多媒体扩展指令与标准的SIMD指令相比,它指定的操作数更少,因此使用的寄存器堆更小. SIMD扩展主要对一下三项进行了简化: 1)多媒体SIMD扩展固定了操作代码中数据操作数的数目,从而在x86的体系结构的MMX,SSE,AVX中添加了数百条指令. 2)多媒体SIMD没有提供向量体系结构…

[转]SIMD、MMX、SSE、AVX、3D Now!、NEON

转载来源<[整理]SIMD.MMX.SSE.AVX.3D Now!.neon> 本文摘取部分内容,详细请看原文. SIMD NEON是通用的SIMD(单指令多数据)引擎. 对于SISD,每个指令只能处理一个数据,而SIMD一个指令可以处理多个数据,因为多个数据的处理是平行的,因此从时间来说,一个指令执行的时间,SISD和SIMD是差不多的.由于SIMD一次可以处理N个数据,所以它的处理的时间也就缩短到SISD的1/N.需要指出一点,NEON是需要硬件支持的,需要有一块寄存器放到硬件上来处理这个…

JVM体系结构与工作方式

JVM全程是java virtual machine(java虚拟机). 以计算为中心来看计算机的体系结构可以分为以下几个部分: 1.指令集:这个计算机所能识别的机器语言的命令集合; 2.计算单元:能够识别并控制指令执行的功能模块; 3.寻址方式:地址的位数.最小地址和最大地址范围,以及地址的运行规则; 4.寄存器定义:包括操作数寄存器.变址寄存器.控制寄存器等的定义.数量和使用方式; 5.存储单元:能够存储操作数和保存操作结构的单元,如内核级缓存.内存和磁盘等; 执行引擎是JVM的核心部分,它…

《Linux内核分析》第一节计算机是如何工作的

第一节计算机是如何工作的张嘉琪原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 一.存储程序计算机冯诺依曼体系结构二.X86汇编基础常见汇编指令几种常见的寻址方式三.汇编一个简单的C程序实验部分将完整的C代码输入使用 gcc –S –o main.s main.c -m32 命令编译成汇编代码,删去多余部分得到如下代码 2.过程分析下面对汇编代码…

第七章 JVM体系结构与工作方式

JVM能跨计算机体系结构来执行Java字节码,主要是由于JVM屏蔽了与各个计算机平台的软件和硬件之间的差异. 7.1 JVM体系结构 7.1.1 何谓JVM 模拟一个计算机来达到一个计算机所具有的计算功能. 以计算为中心来看计算机的体系结构可以分为如下几个部分. 指令集计算机能识别的机器语言的命令集合. 计算单元能够识别并且控制指令执行的功能模块. 寻址方式地址的位数,最小地址和最大地址范围,以及地址的运行规则. 寄存器定义包括操作数寄存器,变址寄存器,控制寄存器等的定义,数量…

JVM 体系结构与工作方式

.katex { display: block; text-align: center; white-space: nowrap; } .katex-display > .katex > .katex-html { display: block; } .katex-display > .katex > .katex-html > .tag { position: absolute; right: 0px; } .katex { font: 1.21em/1.2 KaTeX_M…

Linux Barrier I/O 实现分析与barrier内存屏蔽总结

一直以来.I/O顺序问题一直困扰着我.事实上这个问题是一个比較综合的问题,它涉及的层次比較多,从VFS page cache到I/O调度算法,从i/o子系统到存储外设.而Linux I/O barrier就是当中重要的一部分. 可能非常多人觉得,在做了文件写操作后,调用fsycn就能保证数据可靠地写入磁盘.大多数情况下,确实如此. 可是,由于缓存的存在.fsycn这些同步操作.并不能保证存储设备把数据写入非易失性介质. 假设此时存储设备发生掉电或者硬件错误.此时存储缓存中的数据将会丢失.这对于像…

CUDA与OpenCL架构

CUDA与OpenCL架构目录 CUDA与OpenCL架构目录 1 GPU的体系结构 1.1 GPU简介 1.2 GPU与CPU的差异 2 CUDA架构 2.1 硬件架构 2.1.1 GPU困境 2.1.2 芯片结构 2.2 软件架构 2.3 编程模型 2.3.1 线程层次结构 2.3.2 存储器层次结构 2.3.3 主机(Host)和设备(Device) 2.4 CUDA软硬件 2.4.1 CUDA术语 2.4.2 硬件利用率 3 OpenCL架构 3.1 简介 3.2 框架组成 3.2.…

分布式计算课程补充笔记 part 1

▶ 高性能计算机发展历程真空管电子计算机,向量机(Vector Machine),并行向量处理机(Parallel Vector Processors,PVP),分布式并行机(Parallel Processors,PP),对称多处理机(Symmetric Multiprocessors,SMP),分布式共享并行机(Distributed Share Memory,DSM),大规模并行机(Massively Parallel Processors, MPP),大规模加速并行机(Massivel…

NVIDIA---CUDA

http://en.wikipedia.org/wiki/CUDA CUDA From Wikipedia, the free encyclopedia CUDA Developer(s) NVIDIA Corporation Stable release 6.0 / November 14, 2013; 4 days ago Operating system Windows XP and later,Mac OS X, Linux Platform Supported GPUs Typ…

从零開始学习OpenCL开发（一）架构

多谢大家关注转载本文请注明:http://blog.csdn.net/leonwei/article/details/8880012 本文将作为我<从零開始做OpenCL开发>系列文章的第一篇. 1 异构计算.GPGPU与OpenCL OpenCL是当前一个通用的由非常多公司和组织共同发起的多CPU\GPU\其它芯片异构计算(heterogeneous)的标准,它是跨平台的.旨在充分利用GPU强大的并行计算能力以及与CPU的协同工作,更高效的利用硬件高效的完毕大规模的(尤其是并行度高的)计…

从零开始学习OpenCL开发（一）架构

1 异构计算.GPGPU与OpenCL OpenCL是当前一个通用的由很多公司和组织共同发起的多CPU\GPU\其他芯片异构计算(heterogeneous)的标准,它是跨平台的.旨在充分利用GPU强大的并行计算能力以及与CPU的协同工作,更高效的利用硬件高效的完成大规模的(尤其是并行度高的)计算.在过去利用GPU对图像渲染进行加速的技术非常成熟,但是我们知道GPU的芯片结构擅长大规模的并行计算(PC级的GPU可能就是CPU的上万倍),CPU则擅长逻辑控制,因此不只局限与图像渲染,人们希望将这…

从零开始学习OpenCL开发（一）架构【转】

转自:http://blog.csdn.net/leonwei/article/details/8880012 多谢大家关注转载本文请注明:http://blog.csdn.net/leonwei/article/details/8880012 本文将作为我<从零开始做OpenCL开发>系列文章的第一篇. 1 异构计算.GPGPU与OpenCL OpenCL是当前一个通用的由很多公司和组织共同发起的多CPU\GPU\其他芯片异构计算(heterogeneous)的标准,它是跨平台的.旨在充…

【并行计算-CUDA开发】从零开始学习OpenCL开发（一）架构

多谢大家关注转载本文请注明:http://blog.csdn.net/leonwei/article/details/8880012 本文将作为我<从零开始做OpenCL开发>系列文章的第一篇. 1 异构计算.GPGPU与OpenCL OpenCL是当前一个通用的由很多公司和组织共同发起的多CPU\GPU\其他芯片异构计算(heterogeneous)的标准,它是跨平台的.旨在充分利用GPU强大的并行计算能力以及与CPU的协同工作,更高效的利用硬件高效的完成大规模的(尤其是并行度高的)计算…

使用CUDA Warp-Level级原语

使用CUDA Warp-Level级原语 NVIDIA GPU以SIMT(单指令,多线程)的方式执行称为warps 的线程组.许多CUDA程序通过利用warp执行来实现高性能.本文将展示如何使用cuda9中引入的原语,使warp级编程安全有效. Figure 1: The Tesla V100 Accelerator with Volta GV100 GPU. SXM2 Form Factor. 图1:Volta GV100 GPU的特斯拉V100加速器.SXM2外形尺寸. Warp-level…

用unity4.3发布WINDOWS STORE APP应用的方法

http://www.cnblogs.com/suxsho/ 原创,转载请声明 ======================================================================================== WSA(这是啥)一个不被国内开发者重视的市场,但是我相信依然有人会重视,于是找不到教程,于是自己苦逼研究,最后我写了文章分享大众. =======================================================…

网络存储技术(3) based on zt

各种术语介绍一 ESCON 1991 年,IBM公司在S/390服务器中推出了ESCON(Enterprise System Connection)技术.它是基于光纤介质,最大传输速率达17MB/s的服务器访问存储器的一种连接方式.在此基础上,进一步推出了功能更强的 ESCON Director(FC SWitch),构建了一套最原始的SAN系统. SAN 存储方式创造了存储的网络化.存储网络化顺应了计算机服务器体系结构网络化的趋势.FC-SAN的支撑技术是光纤通道(FC Fiber…

网络存储技术介绍(2) ( based on zt)

http://www.educity.cn/tx/429084.html 互联网技术DAS.NAS和SAN存储方案的比较按照设备位置和接入方式,磁盘存储可以分为内置存储和外挂存储,外挂存储又分为直连存储和网络存储(Fabric-Attached Storage,FAS)等方式,如图10-31所示. yxr注:其实是存储历史发展的一个过程,从附属部分走向独立,从单独硬件走向网络! 1.DAS与NAS存储方案的比较 DAS是大型服务器主要采用的外挂存储方式,由于存储利用率和扩展的原因, DAS必须…

linux内核数据结构学习总结

目录 . 进程相关数据结构 ) struct task_struct ) struct cred ) struct pid_link ) struct pid ) struct signal_struct ) struct rlimit . 内核中的队列/链表对象 ) singly-linked lists ) singly-linked tail queues ) doubly-linked lists ) doubly-linked tail queues . 内核模块相关数据结构 ) st…

深入Java虚拟机读书笔记第二章平台无关性

Java的体系结构对平台无关的支持 Java平台 Java的体系结构通过几种途径支持Java程序的平台无关性,其中主要是通过Java平台自己.Java平台扮演一个运行时Java程序与其下的硬件和操作系统之间的缓冲角色.Java程序被编译为可运行于Java虚拟机中的二进制程序,并且假定Java API的class文件在运行时都是可用的.接着虚拟机运行程序,那些API则给予程序访问底层计算机资源的能力.无论Java程序被部署到何处,它只需要与Java平台交互,而不需要担心底层的硬件和操作系统.因此,…

linux性能调优概述

- 什么是性能调优?(what) - 为什么需要性能调优?(why) - 什么时候需要性能调优?(when) - 什么地方需要性能调优?(where) - 什么人来进行性能调优?(who) - 怎么样进行性能调优?(How) - 总结 # 什么是性能调优?(what) # ![](http://i.imgur.com/RkFKTz6.jpg) 在说什么是性能调优之前我们先来说一下,计算机的体系结构. 如上图,简单来说包括三块:硬件.操作系统.应用程序.其实,性能调优就是调节这些内容,包括硬件.操…

浅谈SQL Server 对于内存的管理

简介理解SQL Server对于内存的管理是对于SQL Server问题处理和性能调优的基本,本篇文章讲述SQL Server对于内存管理的内存原理. 二级存储(secondary storage) 对于计算机来说,存储体系是分层级的.离CPU越近的地方速度愉快,但容量越小(如图1所示).比如:传统的计算机存储体系结构离CPU由近到远依次是:CPU内的寄存器,一级缓存,二级缓存,内存,硬盘.但同时离CPU越远的存储系统都会比之前的存储系统大一个数量级.比如硬盘通常要比同时代的内存大一个数量级.…

SYSTEM_INFO

SYSTEM_INFO结构体包含了当前计算机的信息.这个信息包括计算机的体系结构.中央处理器的类型.系统中中央处理器的数量.页面的大小以及其他信息. SYSTEM_INFO,Win32 API函数GetSystemInfo所使用的结构体. typedef struct _SYSTEM_INFO { // sinf union { DWORD dwOemId; 已废弃的成员,保留这个成员是为了向以前版本的Windows NT保持兼容.从Windows NT3.51和Windows 95的预发行版本…