Multiple-issue----SuperScalar & VLIW

:material-circle-edit-outline: 约 530 个字 :material-clock-time-two-outline: 预计阅读时间 2 分钟

[!ABSTRACT]

我们希望进一步改进处理器的性能，但目前的框架下，似乎 IPC 只能到 1

我们可以超越现有的框架

超标量 Superscalar

增加 decoder 数量，一次 fetch 多个指令，同时把多条指令发射（Issue）到不同的译码器或者后续处理的流水线中去，保证所有 FU 始终 busy

CPU 需要在指令执行之前，判断指令之间是否有依赖关系，如果有就不能分发到执行阶段

依赖关系的识别分静态和动态

超标量 CPU 又被称为动态多发射处理器，依赖关系的检测使得 CPU 电路变得十分复杂

我们能不能不把分析和解决依赖关系的事情，放到软件里面来干呢

程序的 CPU 执行时间 = 指令数 × CPI × Clock Cycle Time

我们可以通过改进编译器来优化 指令数 这个指标

在乱序执行和超标量的 CPU 架构里，指令的前后依赖关系，是由 CPU 内部的硬件电路来检测的，而到了超长指令字的架构里面，这个工作交给了编译器这个软件

下一组指令并不是等上一组指令执行完成之后再执行，而是在上一组指令的指令译码阶段，就开始取指令了

相当于原来是一个个指令进行流水，现在是一个个指令包进行流水

使用这项技术的一个处理器叫 Explicitly Parallel Instruction Computer，缩写 EPIC