引言

我们在前面分析了ORPSoC,or1200_top,和or1200_cpu的整体架构,在最近,我们也分析了or1200的pipeline(流水线)中的两级,EX级和IF级。

但是,我们还没有从宏观的角度,整体的了解一下or1200的流水线结构,本小节就做这件事情。

1,流水线

1>概述

关于流水线的概念,历史,划分等等这些内容,在很多文献里都提到过,而且我们之前也介绍过,这里不再展开阐述,如有疑问请参考:

http://blog.csdn.net/rill_zhen/article/details/8038697

或者

http://en.wikipedia.org/wiki/Pipeline_(computing)

2>or1200的流水线

在分析or1200的流水线之前,我们有必要先了解一下关于or1200_top(OpenRISC的一种实现,包括core和外围模块)。

下面一段内容来自官网的翻译:http://opencores.org/or1k/OR1200_OpenRISC_Processor

1》概述

or1200是一个32-bit的标量RISCharvard架构的微处理器。具有5级整型流水(没有fpu),支持MMU和基本的DSP处理能力。

默认配置下,or1200的dcache和icache都是8K直接映射,cacheline是16B。dcache和icache都是物理索引(也就是说cache的地址是物理地址,关于什么是物理索引,虚拟索引,虚拟物理混合索引,我们之前介绍过,请参考:http://blog.csdn.net/rill_zhen/article/details/9491095)。

默认配置下,or1200的dmmu和immu中的TLB都是基于散列的,映射方式采用直接映射,dtlb和itlb都是64 entry。

or1200除了最基本的模块外,还增加了debug,tt,pic,pm等模块。

2》基本架构组成

a,核心模块:CPU/DSP

b,兼容IEEE754单精度的FPU

c,直接映射数据cache

d,直接映射指令cache

e,基于散列DTLB的数据MMU

f,基于散列ITLB的指令MMU

g,具有功耗管理单元和功耗管理接口

h,嘀嗒定时器

i,中断控制器和中断接口

j,指令总线和数据总线都是wishbone B3

3》目前状态

or1200是稳定版本,并且已经在很多商用ASIC和FPGA上实现了。但是为了增加新的特性和进一步的完善它,所以开发还在继续。

4》验证

or1200利用or1ksin(or1200的simulator),在模拟器上跑了很多C和汇编程序。

5》调试接口

一般情况下,or1200都有一个debug nuit模块,和JTAG模块来实现对or1200的在线调试。

6》or1200的实现

or1200在0.18u 6LM工艺下,工作在150MHz时,测量其性能有150多个dhrystone,相当于2.1MIPS,MAC运算能力为150个。(Dhrystone是测量处理器运算能力的最常见基准程序之一,常用于处理器的整型运算性能的测量。程序是用C语言编写的,因此C编译器的编译效率对测试结果也有很大影响。Dhrystone的计量单位为每秒计算多少次Dhrystone,后来把在VAX-11/780机器上的测试结果1757 Dhrystones/s定义为1 Dhrystone MIPS(百万条指令每秒))。

如果采用默认配置,整个or1200所用的门的数量大概是40K个。

7》实现和性能统计

采用默认配置,在FPGA上实现的情况统计:
15K core cells (1850 FFs, 48 block RAMs) at 25MHz on Actel ProASIC3 technology

4K LUTs, 7 block RAM at 60MHz on Xilinx Virtex 5 technology

ORPSoC的性能统计:(benchmarks run within ORPmon)

OR1200, 8KByte/4KByte I/D cache, hardware multiply/divide disabled, @20MHz on Actel ProASIC3, SDR SDRAM
Dhrystone (120,000 runs): 17,000 Dhrystones/second

CoreMark 1.0 : 11.954573 (0.6 CoreMark/MHz) / GCC4.5.1-or32-1.0rc1 -O2 -msoft-mul -msoft-div -msoft-float / STACK
OR1200, 8KByte/4KByte I/D cache, hardware multiply/divide enabled, @20MHz on Actel ProASIC3, SDR SDRAM
Dhrystone (120,000 runs): 20,000 Dhrystones/second

CoreMark 1.0 : 25.773196 (1.25 CoreMark/MHz) / GCC4.5.1-or32-1.0rc1 -O2 -mhard-mul -mhard-div -msoft-float / STACK
OR1200, 32KByte/32KByte I/D cache, hardware multiply/divide enabled, @50MHz on Xilinx ML501
Dhrystone (500,000 runs): 50,000 Dhrystones/second

CoreMark 1.0 : 66.788100 (1.34 CoreMark/MHz) / GCC4.5.1-or32-1.0rc1 -O3 -mhard-mul -mhard-div -msoft-float -nostdlib / STACK

最小配置时,在FPGA上的实现:
7K core cells (1100 FFs, 4 block RAMs) at 35MHz on Actel ProASIC3 technology
2.4K LUTs, 1 block RAM at 125MHz on Xilinx Virtex 5 technology

2,or1200的流水线结构

1>a general picture

惯例,在分析or1200 core的流水线结构之前,我们先看一下or1200_cpu的所有模块的连接图,如下所示:

从中我们可以看出,整个or1200的CPU =内核一共由14个module组成。

2>or1200的流水线线结构

一般,在进行computer architecture design时,大体上分为两部分工作,一部分是数据通路的设计,另外一部分是控制通路的设计。所以,我们在分析or1200的架构时,也从这两个方面分析。

通过前面的介绍,我们知道or1200 的内核采用经典五级流水,由14个子模块组成,那么整体结构如何,各个流水线阶段都由那些子模块组成呢?如下所示:

3>子模块功能

之前,我们已经分析了IF级和EX级的模块,请参考:

IF级:

http://blog.csdn.net/rill_zhen/article/details/9733811

EX级:

http://blog.csdn.net/rill_zhen/article/details/9700155

EX级需要说明的是fpu模块虽然从图中看是实现了浮点运算,但实际上这个模块内部什么都没有,不要以为有一个叫fpu的模块就说or1200支持浮点运算。

下面我们简单说一下其它三个流水线阶段。

ID级:

也就是指令解码阶段,这个阶段由ctrl一个模块组成,其功能就是根据IF级的if模块读取指令cache获得的指令,根据指令格式进行解析,产生各种控制信号。

MA级:

也就是访存阶段,这个阶段由lsu(load store unit)一个模块组成,其功能就是读写外部的主存,当然,要先经过dmmu和dcache两道关卡。

WB级:

也就是写回阶段,这个阶段由wb_mux和rf两个模块组成,由于想进行写回操作的模块不止一个,所以需要一个mux。rf就是寄存器堆,其物理结构是两个双端口的RAM,值得注意的是这两个RAM的两个地址端口连在一起,而两个数据输出端口是分开的。而两个RAM分别存放第一个操作数和第二操作数,这样组织的结果就是只要一次写操作,同时写两个操作数,只需要一次读操作,就可以同时读到两个操作数。其结构如下:

3,小结

本小节从宏观的角度介绍了or1200的流水线的结构,并对每个流水阶段做了简单介绍。

OpenRisc-44-or1200的pipeline整体分析的更多相关文章

  1. Openrisc的or1200

    1 什么是OpenRISC OpenRISC 是硬件开源社区opencores开发的RISC指令集处理器架构,包括32 bits 的Openrisc1000 和64 bitsOpenrisc 2000 ...

  2. OpenRisc-45-or1200的ID模块分析

    引言 之前,我们分析了or1200流水线的整体结构,也分析了流水线中IF级,EX级,本小节我们来分析ID(insn decode)级的一些细节. 1,基础 or1200的pipeline的ID阶段包含 ...

  3. OpenRisc-39-ORPSoC,or1200的memory hierarchy整体分析

    引言 前面我们简单分析了ORPSoC的整体结构,or1200_top的整体结构,or1200_cpu的整体结构. 并对ORPSoC的启动过程,ORPSoC的debug子系统,clock子系统进行了介绍 ...

  4. Redis学习笔记7--Redis管道(pipeline)

    redis是一个cs模式的tcp server,使用和http类似的请求响应协议.一个client可以通过一个socket连接发起多个请求命令.每个请求命令发出后client通常会阻塞并等待redis ...

  5. A trip through the Graphics Pipeline 2011_12 Tessellation

    Welcome back! This time, we’ll look into what is perhaps the “poster boy” feature introduced with th ...

  6. A trip through the Graphics Pipeline 2011_09_Pixel processing – “join phase”

    Welcome back!    This post deals with the second half of pixel processing, the “join phase”. The pre ...

  7. A trip through the Graphics Pipeline 2011_07_Z/Stencil processing, 3 different ways

    In this installment, I’ll be talking about the (early) Z pipeline and how it interacts with rasteriz ...

  8. A trip through the Graphics Pipeline 2011_06_(Triangle) rasterization and setup

    Welcome back. This time we’re actually gonna see triangles being rasterized – finally! But before we ...

  9. A trip through the Graphics Pipeline 2011_04

    Welcome back. Last part was about vertex shaders, with some coverage of GPU shader units in general. ...

随机推荐

  1. mysql数据库安装方法

    前言 MySQL 有三种安装方式:RPM安装.二进制包安装.源码包安装.这3种种方式各有特色,主要特点参考下表.实际应用中,可以根据你所用的主机环境进行优化,选择 最佳的配置值,安装定制更灵活.访问M ...

  2. MyKTV项目,走起!

    MyKTV项目,走起! 第一部分:这个项目对于新手来说有一点难度,但是当你理清类之间的关系和怎样去实现功能后就会感觉轻松很多. 话不多说,先上类图: 接着是数据库表间关系: 本项目要实现以下功能: 明 ...

  3. AjaxManager的实现

    在NeralJS思路整理一章中我们提到过实用ajax管理模块控制ajax请求,以减少ajax请求数量,优化加载,以下是ajax模块的实现,我已经确保经历简单. /** * Created by wil ...

  4. maven项目java包名的路径问题

    maven项目中错误: 找不到或无法加载主类

  5. jQuery Easy UI (适应屏幕分辨率大小)布局(Layout)

    一.jQuery Easy UI (适应屏幕分辨率大小)布局(Layout) 1.首先应用的是jquery-easyui-1.4 版本(版本不同,兼容性不同) 2.实现整个页面的布局( layout: ...

  6. Android应用开发中关于this.context=context的理解

    在Android应用开发中,有的类里面需要声明一个Context的成员变量,然后还需要在该类的构造函数中加上this.context=context;这行代码.为什么要这么写呢?不写不行么? 先看下面 ...

  7. 国内开源html5游戏引擎全收录

    本文引自<国内开源html5游戏引擎全收录> 游戏开发这潭水太深,英文水平太差,不敢看国外的, 而且这几年国内技术水平也挺高了不少,特别是JS方面.(我个人感觉) 最近看了几个国产的js游 ...

  8. CentOS6.4 GOOGLE chrome install

    yum install http://people.centos.org/hughesjr/chromium/6/i386/RPMS/chromium-28.0.1500.45-205727.i686 ...

  9. ie浏览器下HTML上传控件input=file的美化

    近期写东西用到了input=file这个按钮,给其添加背景,在其它浏览器上都可以正常的显示,可一到ie上便不听话了,完全没有添加上,显的很难看.今天在网上找到一方法,试过后感觉很好,终于把这个问题给解 ...

  10. Android Recovery的汉化 显示中文

    Android Recovery的汉化 显示中文,有需要的朋友可以参考下. 首先下载开源的recovery源码,地址为https://github.com/xiaolu/android_bootabl ...