AI Engineering Handbook

Home
Chapters

LLM
3. Post-training

AI Engineering Handbook
LLM

On this page

SFT
RL
RLHF
PPO
DPO
optimized DPO

LLM
3. Post-training

3. Post-training

SFT

RL

RLHF

PPO

DPO

optimized DPO

PEFT

prompt tuning

p-tuning

prefix tuning

p-tuning v2

adaptor tuning

LORA

what is LoRA
what is lora+
vera
lora-fa
ada-lora
dora
x-lora