计算机体系结构基础

This document was uploaded by one of our users. The uploader already confirmed that they had the permission to publish it. If you are author/publisher or own the copyright of this documents, please report to us by using this DMCA report form.

Simply click on the Download Book button.

Yes, Book downloads on Ebookily are 100% Free.

Sometimes the book is free on Amazon As well, so go ahead and hit "Search on Amazon"

本书由国内从事微处理器设计的一线科研人员编写而成。作者从微处理器设计的角度出发,充分考虑计算机体系结构的学科完整性,强调体系结构、基础软件、电路和器件的融会贯通。全书共分 12 章,包括指令系统结构、计算机硬件结构、CPU 微结构、并行处理结构、计算机性能分析等主要内容,重点放在作为软硬件界面的指令系统结构,以及包含 CPU、GPU、南北桥协同的计算机硬件结构上。本书可作为高等院校“计算机体系结构”课程的本科生教材,同时也适合相关专业研究生或计算机技术人员参考阅读。

Author(s): 胡伟武
Series: 计算机类专业系统能力培养系列教材
Publisher: 机械工业出版社
Year: 2023

Language: Chinese
City: 北京

第一部分 引言
引言
计算机体系结构的研究内容
一以贯之
什么是计算机
计算机的基本组成
衡量计算机的指标
计算机的性能
计算机的价格
计算机的功耗
计算机体系结构的发展
摩尔定律和工艺的发展
计算机应用和体系结构
计算机体系结构发展
体系结构设计的基本原则
平衡性
局部性
并行性
虚拟化
本章小结
习题
第二部分 指令系统结构
指令系统
指令系统简介
指令系统设计原则
指令系统发展历程
指令内容的演变
存储管理的演变
运行级别的演变
指令系统组成
地址空间
操作数
指令操作和编码
RISC指令集比较
指令格式比较
寻址方式比较
公共指令功能
不同指令系统的特色
C语言的机器表示
过程调用
流程控制语句
循环语句
本章小结
习题
特权指令系统
特权指令系统简介
异常与中断
异常分类
异常处理
中断
存储管理
存储管理的原理
TLB的结构和使用
TLB地址翻译相关异常的处理
本章小结
习题
软硬件协同
应用程序二进制接口
寄存器约定
函数调用约定
进程虚拟地址空间
栈帧布局
六种常见的上下文切换场景
函数调用
异常和中断
系统调用
进程
线程
虚拟机
六种上下文切换场景的对比
同步机制
基于互斥的同步机制
非阻塞的同步机制
本章小结
习题
第三部分 计算机硬件结构
计算机组成原理和结构
冯·诺依曼结构
计算机的组成部件
运算器
控制器
存储器
输入/输出设备
计算机系统硬件结构发展
CPU-GPU-北桥-南桥四片结构
CPU-北桥-南桥三片结构
CPU-弱北桥-南桥三片结构
CPU-南桥两片结构
SoC单片结构
处理器和IO设备间的通信
IO寄存器寻址
处理器和IO设备之间的同步
存储器和IO设备之间的数据传送
龙芯3A3000+7A1000桥片系统中的CPU、GPU、DC通信
本章小结
习题
计算机总线接口技术
总线概述
总线分类
片上总线
内存总线
系统总线
HyperTransport总线
HT包格式
设备总线
PCIE总线
PCIE包格式
本章小结
习题
计算机启动过程分析
处理器核初始化
处理器复位
调试接口初始化
TLB初始化
Cache初始化
总线接口初始化
内存初始化
IO总线初始化
设备的探测及驱动加载
多核启动过程
初始化时的多核协同
操作系统启动时的多核唤醒
核间同步与通信
本章小结
习题
第四部分 CPU的微结构
运算器设计
二进制与逻辑电路
计算机中数的表示
MOS晶体管工作原理
CMOS逻辑电路
简单运算器设计
定点补码加法器
减法运算实现
比较运算实现
移位器
定点补码乘法器
补码乘法器
Booth乘法器
华莱士树
本章小结
习题
指令流水线
单周期处理器
流水线处理器
指令相关和流水线冲突
数据相关引发的冲突及解决办法
控制相关引发冲突及解决方法
结构相关引发冲突及解决办法
流水线与异常处理
提高流水线效率的技术
多发射数据通路
动态调度
转移预测
高速缓存
本章小结
习题
第五部分 并行处理结构
并行编程基础
程序的并行行为
指令级并行性
数据级并行性
任务级并行性
并行编程模型
单任务数据并行模型
多任务共享存储编程模型
多任务消息传递编程模型
共享存储与消息传递编程模型的编程复杂度
典型并行编程环境
数据并行SIMD编程
POSIX编程标准
OpenMP标准
消息传递编程接口
习题
多核处理结构
多核处理器的发展演化
多核处理器的访存结构
通用多核处理器的片上Cache结构
存储一致性模型
Cache一致性协议
多核处理器的互连结构
多核处理器的同步机制
典型多核处理器
龙芯3A5000处理器
Intel SandyBridge架构
IBM Cell处理器
NVIDIA GPU
Tile64处理器
本章小结
习题
第六部分 系统性能评价与分析
计算机系统性能评价与性能分析
计算机系统性能评价指标
计算机系统常用性能评价指标
并行系统的性能评价指标
测试程序集
微基准测试程序
SPEC CPU基准测试程序
并行系统基准测试程序
其他常见的基准测试程序集
性能分析方法
分析建模的方法
模拟建模的方法和模拟器
性能测量的方法
性能测试和分析实例
SPEC CPU基准测试程序的分值对比
微结构相关统计数据
基础性能参数
本章小结
习题