RISCV32
RISC-V 是一种开源的指令集架构,由加州大学伯克利分校的计算机科学家开发。与其他专有架构(如 ARM 或 x86)不同,RISC-V 完全开源,允许任何人使用、修改和扩展。
RISC-V 32
Section titled “RISC-V 32”在 RISC-V 32 位架构中,处理器在复位后会从一个预定义的启动地址开始执行第一条指令。复位后的取指地址由具体平台或实现定义,不能假设为固定的 0x00000000 或 0xFFFFFFF0。复位后的第一条指令通常是用于初始化系统的引导加载程序(Bootloader)的开始。
RISC-V 64
Section titled “RISC-V 64”在 RISC-V 64 位架构(riscv64)中,处理器在复位后会从一个预定义的启动地址开始执行第一条指令。复位后的取指地址同样由具体平台或实现定义。
RISC-V 指令集架构(ISA)是一个模块化和可扩展的指令集,设计上分为基础指令集和多个标准扩展。以下是 RISC-V 指令集各部分的详细说明:
RV32I 和 RV64I
Section titled “RV32I 和 RV64I”- RV32I:32 位整数基本指令集,是所有 RISC-V 实现的基础,包含基本的算术、逻辑、控制流和内存访问指令。
- RV64I:64 位整数基本指令集,类似于 RV32I,但寄存器和操作数是 64 位宽。
基础指令分类
Section titled “基础指令分类”- 算术指令:
ADD,SUB,ADDI等。 - 逻辑指令:
AND,OR,XOR,ANDI等。 - 移位指令:
SLL,SRL,SRA,SLLI,SRLI,SRAI等。 - 比较指令:
SLT,SLTI,SLTU,SLTIU等。 - 内存访问指令:
LW,SW,LB,SB,LH,SH,LBU,LHU等。 - 控制流指令:
JAL,JALR,BEQ,BNE,BLT,BGE,BLTU,BGEU等。 - 系统指令:
ECALL,EBREAK等。
M 扩展(整数乘除扩展)
Section titled “M 扩展(整数乘除扩展)”- 提供乘法和除法指令,例如
MUL,MULH,DIV,DIVU,REM,REMU。
A 扩展(原子操作扩展)
Section titled “A 扩展(原子操作扩展)”- 支持原子读 - 修改 - 写指令,用于多处理器同步,例如
LR.W,SC.W,AMOSWAP.W,AMOADD.W等。
F 扩展(单精度浮点扩展)
Section titled “F 扩展(单精度浮点扩展)”- 支持 IEEE 754 单精度浮点运算指令,例如
FADD.S,FSUB.S,FMUL.S,FDIV.S,FSQRT.S,FMIN.S,FMAX.S等。
D 扩展(双精度浮点扩展)
Section titled “D 扩展(双精度浮点扩展)”- 支持 IEEE 754 双精度浮点运算指令,例如
FADD.D,FSUB.D,FMUL.D,FDIV.D,FSQRT.D,FMIN.D,FMAX.D等。
Q 扩展(四倍精度浮点扩展)
Section titled “Q 扩展(四倍精度浮点扩展)”- 支持 IEEE 754 四倍精度浮点运算指令。
C 扩展(压缩指令集扩展)
Section titled “C 扩展(压缩指令集扩展)”- 提供 16 位压缩指令,减少程序的内存占用,例如
C.ADDI,C.LW,C.SW,C.JAL,C.JR等。
B 扩展(位操作扩展)
Section titled “B 扩展(位操作扩展)”- 提供位操作指令,例如
ANDN,ORN,XNOR,CLZ,CTZ,CPOP,SEXT.B,SEXT.H,ROL,ROR等。
J 扩展(动态可插拔指令扩展)
Section titled “J 扩展(动态可插拔指令扩展)”- 支持动态可插拔指令。
H 扩展(硬件线程扩展)
Section titled “H 扩展(硬件线程扩展)”- 提供硬件线程管理指令。
独立的小扩展
Section titled “独立的小扩展”- 用于独立的小扩展,如:
- Zifencei:指令流 FENCE 扩展,用于确保指令流的一致性。
- Zicsr:控制状态寄存器扩展,提供对 CSR 的访问指令。
特殊用途指令
Section titled “特殊用途指令”特殊用途寄存器指令
Section titled “特殊用途寄存器指令”- CSRRW:控制状态寄存器读写。
- CSRRS:控制状态寄存器读并设置。
- CSRRC:控制状态寄存器读并清除。
以下是一个使用多种 RISC-V 指令的示例程序:
.section .datanum1: .dword 5 // 定义第一个数num2: .dword 10 // 定义第二个数
.section .text.globl _start_start: la t0, num1 // 将 num1 的地址加载到临时寄存器 t0 li t1, 20 // 将立即数 20 加载到临时寄存器 t1 add t2, t0, t1 // 将 t0 和 t1 相加,结果存储在 t2 mv a0, t2 // 将 t2 的值复制到 a0
// 浮点运算示例 fcvt.s.w ft0, t1 // 将整数 t1 转换为单精度浮点数 fadd.s ft1, ft0, ft0 // 将两个单精度浮点数相加
// 原子操作示例 li t3, 1 // 将 1 加载到 t3 amoswap.w.aq t4, t3, (t0) // 交换 t0 地址处的值与 t3
// 退出程序(假设在一个支持的模拟器或操作系统中运行) li a7, 93 // ecall 退出系统调用号(Linux) ecall // 执行系统调用RISC-V 32 位架构(riscv32)有 32 个通用寄存器,每个寄存器都是 32 位宽。每个寄存器都有特定的用途和惯例名称,以便在汇编编程中使用。以下是 riscv32 寄存器的详细信息:
RISC-V 的通用寄存器由 x0 到 x31 表示,使用惯例名称以帮助识别其典型用途。
- x0 (zero):值永远为 0,读写该寄存器不会改变它的值。
- x1 (ra, return address):存储函数返回地址。
- x2 (sp, stack pointer):指向当前栈顶,用于栈操作。
- x3 (gp, global pointer):全局指针,用于全局数据访问。
- x4 (tp, thread pointer):线程指针,用于线程局部存储。
- x5-x7 (t0-t2, temporary registers):临时寄存器,在函数调用过程中不需要保存。
- x8 (s0/fp, saved register/frame pointer):保存寄存器/帧指针,在函数调用过程中需要保存。
- x9 (s1, saved register):保存寄存器,在函数调用过程中需要保存。
- x10-x11 (a0-a1, function arguments/return values):函数参数和返回值寄存器。
- x12-x17 (a2-a7, function arguments):函数参数寄存器。
- x18-x27 (s2-s11, saved registers):保存寄存器,在函数调用过程中需要保存。
- x28-x31 (t3-t6, temporary registers):临时寄存器,在函数调用过程中不需要保存。
寄存器用途和描述
Section titled “寄存器用途和描述”|寄存器|名称|用途| |---|---|---| |x0|zero|常值 0| |x1|ra|返回地址| |x2|sp|栈指针| |x3|gp|全局指针| |x4|tp|线程指针| |x5|t0|临时寄存器| |x6|t1|临时寄存器| |x7|t2|临时寄存器| |x8|s0/fp|保存寄存器/帧指针| |x9|s1|保存寄存器| |x10|a0|函数参数/返回值| |x11|a1|函数参数/返回值| |x12|a2|函数参数| |x13|a3|函数参数| |x14|a4|函数参数| |x15|a5|函数参数| |x16|a6|函数参数| |x17|a7|函数参数| |x18|s2|保存寄存器| |x19|s3|保存寄存器| |x20|s4|保存寄存器| |x21|s5|保存寄存器| |x22|s6|保存寄存器| |x23|s7|保存寄存器| |x24|s8|保存寄存器| |x25|s9|保存寄存器| |x26|s10|保存寄存器| |x27|s11|保存寄存器| |x28|t3|临时寄存器| |x29|t4|临时寄存器| |x30|t5|临时寄存器| |x31|t6|临时寄存器|
以下是一个简单的 RISC-V 汇编程序,演示了如何使用这些寄存器来进行基本运算:
.section .datanum1: .word 5 // 定义第一个数num2: .word 10 // 定义第二个数
.section .text.globl _start_start: lw x10, num1 // 将 num1 加载到寄存器 a0 (x10) lw x11, num2 // 将 num2 加载到寄存器 a1 (x11) add x12, x10, x11 // 将 a0 和 a1 相加,结果存储在 x12 // 这里假设程序到此结束 // 通常你会需要一个系统调用来退出程序,但这是一个简单示例RISC-V 32 位架构(RV32)的指令集设计简洁、模块化,包含了各种基础指令以及可选的扩展指令。以下是 RISC-V 32 位架构的基本指令集(RV32I)的一些常见指令和说明:
RISC-V 的指令格式分为以下几种主要类型:
- R 型指令:用于寄存器到寄存器的运算。
- I 型指令:用于立即数运算和内存加载。
- S 型指令:用于内存存储。
- B 型指令:用于条件分支。
- U 型指令:用于加载高位立即数。
- J 型指令:用于跳转。
R 型指令用于寄存器之间的算术和逻辑运算。格式如下:
opcode | rd | funct3 | rs1 | rs2 | funct7rd:目标寄存器。rs1:第一个源寄存器。rs2:第二个源寄存器。funct3和funct7:指定具体操作。
常见 R 型指令:
add rd, rs1, rs2 // rd = rs1 + rs2sub rd, rs1, rs2 // rd = rs1 - rs2and rd, rs1, rs2 // rd = rs1 & rs2or rd, rs1, rs2 // rd = rs1 | rs2xor rd, rs1, rs2 // rd = rs1 ^ rs2sll rd, rs1, rs2 // rd = rs1 << rs2 (逻辑左移)srl rd, rs1, rs2 // rd = rs1 >> rs2 (逻辑右移)sra rd, rs1, rs2 // rd = rs1 >>> rs2 (算术右移)I 型指令用于立即数运算和内存加载。格式如下:
opcode | rd | funct3 | rs1 | immimm:立即数。
常见 I 型指令:
addi rd, rs1, imm // rd = rs1 + immandi rd, rs1, imm // rd = rs1 & immori rd, rs1, imm // rd = rs1 | immxori rd, rs1, imm // rd = rs1 ^ immslli rd, rs1, shamt // rd = rs1 << shamt (逻辑左移)srli rd, rs1, shamt // rd = rs1 >> shamt (逻辑右移)srai rd, rs1, shamt // rd = rs1 >>> shamt (算术右移)lw rd, imm(rs1) // 从内存地址rs1+imm加载字到rdlb rd, imm(rs1) // 从内存地址rs1+imm加载字节到rdlh rd, imm(rs1) // 从内存地址rs1+imm加载半字到rdS 型指令用于内存存储。格式如下:
opcode | imm[11:5] | rs2 | rs1 | funct3 | imm[4:0]常见 S 型指令:
sw rs2, imm(rs1) // 将rs2存储到内存地址rs1+immsb rs2, imm(rs1) // 将rs2的低8位存储到内存地址rs1+immsh rs2, imm(rs1) // 将rs2的低16位存储到内存地址rs1+immB 型指令用于条件分支。格式如下:
opcode | imm[12] | imm[10:5] | rs2 | rs1 | funct3 | imm[4:1] | imm[11]常见 B 型指令:
beq rs1, rs2, offset // 如果rs1 == rs2,则跳转到当前地址加上offsetbne rs1, rs2, offset // 如果rs1 != rs2,则跳转到当前地址加上offsetblt rs1, rs2, offset // 如果rs1 < rs2,则跳转到当前地址加上offsetbge rs1, rs2, offset // 如果rs1 >= rs2,则跳转到当前地址加上offsetU 型指令用于加载高位立即数。格式如下:
opcode | rd | imm常见 U 型指令:
lui rd, imm // 将imm加载到rd的高20位auipc rd, imm // 将PC+imm加载到rd的高20位J 型指令用于跳转。格式如下:
opcode | rd | imm常见 J 型指令:
jal rd, offset // 跳转到当前地址加上offset,并将返回地址存储到rdjalr rd, imm(rs1) // 跳转到rs1+imm,并将返回地址存储到rdRISC-V 还有一些特殊指令,例如用于系统调用和控制寄存器的指令:
ecall // 环境调用,用于系统调用ebreak // 环境断点,用于调试csrrw rd, csr, rs1 // 读写控制状态寄存器csrrs rd, csr, rs1 // 读并设置控制状态寄存器csrrc rd, csr, rs1 // 读并清除控制状态寄存器下面是一个简单的 RISC-V 汇编程序示例,它实现了两个数的加法并将结果存储在一个寄存器中:
.section .datanum1: .word 5 // 定义第一个数num2: .word 10 // 定义第二个数
.section .text.globl _start_start: lw x10, num1 // 加载num1到寄存器x10 lw x11, num2 // 加载num2到寄存器x11 add x12, x10, x11 // 将x10和x11相加,结果存储到x12
// 退出程序(假设在一个支持的模拟器或操作系统中运行) li a7, 93 // ecall退出系统调用号(Linux) ecall // 执行系统调用RISC-V 伪指令(Pseudo Instructions)是一种便于编程的汇编指令,它们不是直接在硬件上执行的指令,而是由汇编器(Assembler)翻译成一个或多个实际的机器指令。伪指令简化了汇编编程,使代码更易读、易写。以下是一些常见的 RISC-V 32 位伪指令及其等效的真实指令:
常见伪指令及其等效指令
Section titled “常见伪指令及其等效指令”-
li rd, imm(加载立即数)-
加载一个立即数到寄存器
rd。 -
等效指令:
li rd, imm // 当 imm 可以用 12 位表示时或
lui rd, imm[31:12]addi rd, rd, imm[11:0]
-
-
mv rd, rs(寄存器间移动)-
将寄存器
rs的值复制到寄存器rd。 -
等效指令:
addi rd, rs, 0
-
-
nop(空操作)-
不执行任何操作。
-
等效指令:
addi x0, x0, 0
-
-
j offset(无条件跳转)-
跳转到当前地址加上偏移量
offset。 -
等效指令:
jal x0, offset
-
-
jr rs(寄存器无条件跳转)-
跳转到寄存器
rs所指向的地址。 -
等效指令:
jalr x0, 0(rs)
-
-
ret(返回)-
从子程序返回。
-
等效指令:
jalr x0, 0(ra)
-
-
call label(调用子程序)-
调用子程序并保存返回地址。
-
等效指令:
auipc ra, %pcrel_hi(label)jalr ra, %pcrel_lo(label)(ra)
-
-
tail label(尾调用)-
跳转到子程序,不保存返回地址。
-
等效指令:
auipc x0, %pcrel_hi(label)jalr x0, %pcrel_lo(label)(x0)
-
-
la(加载地址)- 加载符号的地址
以下是一个使用伪指令的简单 RISC-V 汇编程序示例:
.section .text.globl _start_start: li t0, 10 // 将立即数 10 加载到临时寄存器 t0 li t1, 20 // 将立即数 20 加载到临时寄存器 t1 add t2, t0, t1 // 将 t0 和 t1 相加,结果存储在 t2 mv a0, t2 // 将 t2 的值复制到 a0
// 退出程序(假设在一个支持的模拟器或操作系统中运行) li a7, 93 // ecall退出系统调用号(Linux) ecall // 执行系统调用在这个示例中,伪指令 li 和 mv 被使用来简化代码的编写和阅读。
需要的软件
- qemu
- gcc
- gdb-multiarch
main.c
#define UART_BASE 0x10000000 // UART 基地址
volatile char *uart = (volatile char *)UART_BASE;
void uart_putc(char c) { *(volatile char *)uart = c;}
void uart_puts(const char *s) { while (*s) { uart_putc(*s++); }}
void main() { uart_puts("Hello, RISC-V!\n"); while (1); // 无限循环,防止程序退出}start.s
.section .text.global _start
_start: la sp, stack_top # 设置栈指针 call main # 调用 main 函数 nop # 如果 main 返回,停在这里
.section .bss .align 12 .space 4096 # 定义一个简单的栈stack_top:编译
riscv64-linux-gnu-gcc -g -nostdlib -Ttext=0x80000000 -no-pie -o hello.elf start.s main.c在 qemu 中运行
qemu-system-riscv64 -nographic -machine virt -bios none -serial mon:stdio -S -s -kernel hello.elf.gdbinit
target remote :1234gdb-multiarch -x .gdbinit hello.elf