LoRA | 提拉的Studio

LoRA Low-rank adaptation

LoRA（低秩自适应）是一种参数高效微调（PEFT）方法。其核心思想是通过低秩矩阵分解模拟大模型参数的增量更新：冻结预训练模型权重，仅在原始权重旁注入可训练的秩分解矩阵（一对小型线性投影矩阵），通过矩阵乘法实现参数调整。该方法显著减少需优化的参数量（通常降至原模型的0.1%），同时保持原始模型结构不变。

    graph LR
A[加载预训练模型] --> B[冻结所有权重]
B --> C[识别关键层插入LoRA模块]
C --> D[仅训练LoRA矩阵A/B]
D --> E[保存LoRA权重文件]
E --> F[实时加载适配器预测]

LoRA原理

核心原理：冻结权重+低秩分解

LoRA的革新性在于以下核心技术：

1.冻结原始模型

     保持预训练模型的所有权重固定不变
     避免对原始知识造成干扰

2.创建低秩适应矩阵


# 伪代码示例
import torch
import torch.nn as nn

# 原始权重矩阵 W ∈ ℝ^{d×k}
class LoRA_Adapter(nn.Module):
    def __init__(self, d, k, r=8):  # r为低秩参数
        super().__init__()
        self.A = nn.Parameter(torch.randn(r, k) * 0.02)  # A ∈ ℝ^{r×k}
        self.B = nn.Parameter(torch.zeros(d, r))         # B ∈ ℝ^{d×r}
    
    def forward(self, x, original_weight):
        # ΔW = BA (低秩分解)
        delta_W = self.B @ self.A  # ∈ ℝ^{d×k}
        return x @ (original_weight + delta_W)  # W' = W + ΔW

```        
#### 3.数学表达
对于任何权重矩阵 W ∈ ℝ^{d×k}，LoRA将其更新表示为：ΔW = BA
 
 
     其中：

     A ∈ ℝ^{r×k}（随机初始化的低秩矩阵）
     B ∈ ℝ^{d×r}（初始为零矩阵）
     r 是远小于 d 和 k 的秩（典型值：4, 8, 16）       

#### 4.实际应用代码及技巧
##### 实际应用代码：
```python
from transformers import AutoModelForCausalLM
from peft import get_peft_model, LoraConfig
 
# 基础模型（约7B参数）
model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-2-7b-hf")
 
# LoRA配置（实际训练参数仅57M）
peft_config = LoraConfig(
    r=8,                      # 低秩维度
    lora_alpha=32,            # 缩放因子
    target_modules=["q_proj", "v_proj"],  # 仅修改查询/值投影层
    lora_dropout=0.1,
    task_type="CAUSAL_LM"
)
 
# 创建PEFT模型（Parameter-Efficient Fine-Tuning）
model = get_peft_model(model, peft_config)
model.print_trainable_parameters()  # 输出：trainable params: 57,344,000
 
# 训练（仅需单个消费级GPU）
trainer.train()

高级应用技巧

  1. 层选择策略：
     最佳实践：仅微调transformer的注意力层
     关键目标层：query, key, value 投影矩阵
     避免层：embedding和分类头（效果有限）

  2. 秩(r)的选择
     | 秩 | 参数量 | 适用场景 |
     |----|--------|----------|
     | 4 | ≥0.01% | 简单任务/资源极度受限 |
     | 8 | ≈0.1% | 标准推荐值（85%任务） |
     | 32 | ≤1% | 复杂任务/高精度需求 |

  3. 多适配器融合

# 同时加载多个LoRA（需支持框架如text-generation-webui）
adapters = {
    "medical": "path/to/medical-lora",
    "legal": "path/to/legal-lora"
}
model.set_active_adapters(["medical", "legal"])

为什么需要LoRA

挑战	传统微调	LoRA解决方案
计算成本	需更新数十亿参数	仅更新0.01%-0.1%参数
存储需求	每个任务需完整模型副本 (GB级)	仅存储小矩阵 (MB级)
灾难性遗忘	微调后丢失原始知识	保持原始权重不变
任务切换	需重新加载整个模型	瞬时切换LoRA模块