(5) 微处理器结构与实现技术简介

Post on 03-Feb-2016

140 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

(5) 微处理器结构与实现技术简介. 浙江大学计算机学院 陈文智 wzchen@cad.zju.edu.cn 2005 年 3 月. 微处理器的系统结构设计 微处理器的执行机制设计 微处理器流水线结构设计 微处理器逻辑设计与实现 处理器逻辑综合 (Synopsys) 处理器物理综合 (Candence) 处理器的验证与测试. 今天计算机体系结构的研究内容. 进一步提高单个微处理器的性能 基于微处理器的多处理器体系结构。 全面提高计算机的系统性能: 可用性,可维护性,可缩放性。 新型器件的处理器。. 进一步提高单个微处理器的性能. - PowerPoint PPT Presentation

TRANSCRIPT

(5) 微处理器结构与实现技术简介

浙江大学计算机学院浙江大学计算机学院陈文智陈文智

wzchen@cad.zju.edu.cnwzchen@cad.zju.edu.cn20052005 年年 33 月月

22

微处理器的系统结构设计 微处理器的执行机制设计 微处理器流水线结构设计 微处理器逻辑设计与实现 处理器逻辑综合 (Synopsys) 处理器物理综合 (Candence) 处理器的验证与测试

33

今天计算机体系结构的研究内容今天计算机体系结构的研究内容 进一步提高单个微处理器的性能进一步提高单个微处理器的性能 基于微处理器的多处理器体系结构。基于微处理器的多处理器体系结构。 全面提高计算机的系统性能:全面提高计算机的系统性能: 可用性,可维护性,可缩放性。可用性,可维护性,可缩放性。 新型器件的处理器。新型器件的处理器。

44

进一步提高单个微处理器的性能进一步提高单个微处理器的性能

器件技术(器件技术( 20052005 年的 年的 ICIC 技术)技术)– 200Mtransistors, 0.1 feature size/onechip; 200Mtransistors, 0.1 feature size/onechip;

– 2.0-3.5GHz, Pentium 1GHz;2.0-3.5GHz, Pentium 1GHz;

– 0.9-1.2V (0.9-1.2V ( 工作电压)工作电压) 高性能体系结构高性能体系结构

– Embedded Computer SystemEmbedded Computer System

– Reconfigurable computer ArchitectureReconfigurable computer Architecture

– Power-aware computer ArchitecturePower-aware computer Architecture

55

高性能处理器所采用的一些技术高性能处理器所采用的一些技术– on-chip multilevel cacheon-chip multilevel cache 及及 pre-fetch bufferpre-fetch buffer

– 硬件实现进程的上下文切换硬件实现进程的上下文切换– 大规模的片上分布式大规模的片上分布式 DRAMDRAM

– 深度流水线 深度流水线 8-128-12 20 20 级以上级以上– Advanced Super-scalarAdvanced Super-scalar :: 16-3216-32 指令指令 /clock cycle/clock cycle

– Super-speculative ProcessorSuper-speculative Processor :: fine-grain heavy speculatifine-grain heavy speculationon

– Trace ProcessorTrace Processor

– Vector Intelligent RAM Procssor, V-IRAMVector Intelligent RAM Procssor, V-IRAM

– on-chip multiprocessoron-chip multiprocessor

– Instruction-level Distributed Processing ( ILDP)Instruction-level Distributed Processing ( ILDP)

– Clustered Dependence-based ArchitectureClustered Dependence-based Architecture

66

新型器件的处理器新型器件的处理器

光速极限问题光速极限问题– ICIC 电路有极限:电路有极限:• 线宽不能无限缩小;线宽不能无限缩小;• 性能价格 性能价格 + + 低功耗低功耗

新型器件新型器件– 光计算机光计算机– 分子计算机分子计算机– DNADNA 计算机:利用计算机:利用 DNADNA 保存复杂信息的巨大存保存复杂信息的巨大存

储能力。用核苷酸的排列表示各种信息,生物酶充储能力。用核苷酸的排列表示各种信息,生物酶充当加减乘除操作,通过化学反应得出计算结果。当加减乘除操作,通过化学反应得出计算结果。

77

88

99

instruction set

software

hardware

1010

1111

指令集体系结构的设计内容指令集体系结构的设计内容 数据格式:数据格式:硬件能直接识别和处理的数据类型和格式等硬件能直接识别和处理的数据类型和格式等 寻址方式寻址方式::寻址方式的种类、表示方法和地址计算等寻址方式的种类、表示方法和地址计算等 寄存器组织寄存器组织::操作数寄存器、变址寄存器、控制寄存器、及专用操作数寄存器、变址寄存器、控制寄存器、及专用

寄存器等的定义、数量和使用方法。寄存器等的定义、数量和使用方法。 指令系统指令系统::指令的选取。指令的操作数类型和格式。指令操作码指令的选取。指令的操作数类型和格式。指令操作码

优化和控制机构等。优化和控制机构等。 存贮器系统存贮器系统::最大可编址空间、最小编址单位、编址方式和主存最大可编址空间、最小编址单位、编址方式和主存

容量等。容量等。 中断机构中断机构::中断的类型、中断分级、中断处理功能和中断入口地中断的类型、中断分级、中断处理功能和中断入口地

址等。址等。 机器级的I/O结构机器级的I/O结构::I/O的联接方式、设备访问方式、数据I/O的联接方式、设备访问方式、数据

的源、目的和吞吐量等。其它还包括:操作结束和出错指示。机的源、目的和吞吐量等。其它还包括:操作结束和出错指示。机器工作状态的定义和切换。信息保护保护方式等。器工作状态的定义和切换。信息保护保护方式等。

1212

指令系统结构评价的常规方法

1313

测试程序的选择(测试程序的选择( 11 ))

实际程序实际程序– 用户用来解决问题的实际工作程序,即实际的工作负载用户用来解决问题的实际工作程序,即实际的工作负载

,尽管不知道在工作负载中所占的比例,尽管不知道在工作负载中所占的比例 ..• 一般选择被用户广泛使用的、具有一定代表性的实际程序一般选择被用户广泛使用的、具有一定代表性的实际程序

。。• 如如 CC 编译器编译器 ,, 文本编辑器等文本编辑器等 , , 有输入有输入 ,, 输出输出 ,, 参数参数

核心基准测试程序核心基准测试程序 (kernel benchmark)(kernel benchmark)– 从实际程序中抽出来的能代表整个程序运行的主要工作从实际程序中抽出来的能代表整个程序运行的主要工作

的核心代码段,适于独立评价某一方面的性能的核心代码段,适于独立评价某一方面的性能• 抽取条件:这一段代码必须决定整个程序的执行时间抽取条件:这一段代码必须决定整个程序的执行时间• 如如 Livemore Loops(Livemore Loops(浮点循环浮点循环 ), Linpack), Linpack 等等

1414

测试程序的选择(测试程序的选择( 22)) 简单基准测试程序简单基准测试程序 (toy benchmark)(toy benchmark)

– 事先知道结果的小程序事先知道结果的小程序 (10~100(10~100 行行 ) )

如快速排序如快速排序 ,,八皇后问题 等八皇后问题 等

综合基准程序综合基准程序 (synthetic benchmark)(synthetic benchmark)

– 和核心基准程序有点类似,但它不是从单个实际程序中和核心基准程序有点类似,但它不是从单个实际程序中提取,而是通过对大量的实际程序的执行情况进行统计提取,而是通过对大量的实际程序的执行情况进行统计,根据各类操作和操作数的使用频率,人为设计出来的,根据各类操作和操作数的使用频率,人为设计出来的一段小规模测试程序。一段小规模测试程序。

– 如如 Whetstone, DhrystoneWhetstone, Dhrystone 等等

1515

指令系统与处理器结构的关系

1616

指令系统与处理器结构的关系

1717

指令系统考虑的问题

1818

微处理器的系统结构设计 微处理器的执行机制设计 微处理器流水线结构设计 微处理器逻辑设计与实现 处理器逻辑综合 (Synopsys) 处理器物理综合 (Candence) 处理器的验证与测试

1919

微处理器的执行机制设计

2020

微处理器的执行机制设计

2121

微处理器的执行机制设计

2222

微处理器的执行机制设计

2323

微处理器的执行机制设计

2424

微处理器的执行机制设计

2525

流水线相关说明

2626

微处理器的执行机制设计

2727

微处理器的执行机制设计

2828

微处理器的执行机制设计

2929

3030

3131

3232

3333

多线索处理器举例

3434

微处理器的系统结构设计 微处理器的执行机制设计 微处理器流水线结构设计 微处理器逻辑设计与实现 处理器逻辑综合 (Synopsys) 处理器物理综合 (Candence) 处理器的验证与测试

3535

微处理器流水线结构设计

流水深度 流水段的任务分配 流水线相关 时钟设计 :周期 ,双时钟 寄存器与锁存器

3636

流水深度

3737

流水段的任务分配

3838

微处理器的系统结构设计 微处理器的执行机制设计 微处理器流水线结构设计 微处理器逻辑设计与实现 处理器逻辑综合 (Synopsys) 处理器物理综合 (Candence) 处理器的验证与测试

3939

微处理器逻辑设计与实现

处理器结构级评价工具总结 寄存器级结构图 指令逻辑寄存器级描述 指令物理寄存器级描述 数据通路设计 控制器设计 中断控制设计 处理器集成

4040

处理器结构级评价工具总结 : 指令级模拟

4141

寄存器级结构图

4242

微处理器设计

4343

处理器逻辑设计 : 数据通路和控制器

4444

微处理器的系统结构设计 微处理器的执行机制设计 微处理器流水线结构设计 微处理器逻辑设计与实现 处理器逻辑综合 (Synopsys) 处理器物理综合 (Candence) 处理器的验证与测试

4545

5 行为级 / 逻辑级验证

功能级验证–确保处理器与系统结构一致

等价验证–确保设计结果与功能模型相匹配

电子验证–确保电路的正确性, 在运行电压温度等环境

下的稳定性 流片前验证 流片后验证

4646

验证的层次 系统验证 芯片上系统验证 行为级验证

– 验证所实现的与所描述的一致性 寄存器传输级

– 结构验证– 模拟验证– 模型检验

门级 / 晶体管级– 逻辑等式检验

4747

微处理器的系统结构设计 微处理器的执行机制设计 微处理器流水线结构设计 微处理器逻辑设计与实现 处理器逻辑综合 (Synopsys) 处理器物理综合 (Candence) 处理器的验证与测试

4848

6 逻辑综合

4949

逻辑综合

5050

工艺库

top related