跳转至

Draymonder Docs

线性回归

Draymonder Docs

主页
编码人生
编码人生
- 机器学习
  机器学习
  - 大模型
    大模型
    
    Agent调研
    
    深入理解LangManus
    
    IMO Agent
  - 自然语言处理
    自然语言处理
    
    NLP简介
  - 数据分析
    数据分析
    
    Pandas教程
  - 深度学习
    深度学习
    
    PyTorch教程
    
    线性回归线性回归
    目录
    
    原生实现
    
    torch工具类实现
    
    多层感知机
    
    SoftMax
- 计算机科学
  计算机科学
  - 操作系统
    操作系统
    
    MiniOS-xv6
    
    Linux C++开发
    
    Linux常用命令
    
    Linux IO
    
    Linux Memory
    
    面试常考题
  - 网络
    网络
    
    Web/RPC 框架
    
    图解Http
    
    正/反向代理
    
    DNS应用
  - 经典书籍
    经典书籍
    
    设计数据密集型应用
- 中间件
  中间件
  - 关系数据库
    关系数据库
    
    MySQL-InnoDB引擎
    
    MySQL-踩坑
    
    BoltDB
  - 非关系数据库
    非关系数据库
    
    Bitcask
  - 缓存
    缓存
    
    Redis
    
    缓存-踩坑
  - 消息队列
    消息队列
    
    Kafka
    
    RocketMQ
- 系统设计
  系统设计
  - 性能测试平台
  - 设计原则
  - 微服务
    微服务
    
    微服务设计
    
    DNS & CDN & 异地多活
    
    日志 & 链路追踪 & 监控
  - go im
  - 视频进度设计
  - 评论中台设计
- 信息安全
  信息安全
  - 游戏外挂调研
- 其他
  其他
点滴生活
点滴生活
- 年度总结
  年度总结
  - 2025
  - 2024
  - 2023
  - 2022
  - 2021
- 书籍
  书籍
  - 传记
    传记
    
    邓小平传
    
    江泽民传
    
    马斯克传
    
    乔布斯传
  - 投资
    投资
    
    金钱心理学
    
    聪明的投资者
    
    财富的真相
    
    纳瓦尔宝典
  - 社交
    社交
    
    人性的弱点
  - 历史
    历史
    
    明朝那些事儿
  - 人文
    人文
    
    文化苦旅
  - 情感
    情感
    
    人间告白
- 理财
  理财
  - 理财实践
  - 诈骗总结
- 运动
  运动
  - 骑行
    骑行
    
    2024 渐入佳境
    
    2023 初试
- 游玩
  游玩
  - 2025
    2025
    
    2025初冬
    
    2025国庆
    
    2025七夕
    
    2025端午
    
    2025五一
    
    2025清明
  - 2024
    2024
    
    2024冬季
    
    2024国庆
    
    2024中秋
    
    2024暑假
    
    2024端午
    
    2024女友见家长
    
    2024五一
    
    2024清明
    
    2024元旦
  - 2023
    2023
    
    2023石家庄
    
    2023团建
    
    2023国庆
- 考试
  考试
  - 教师招聘记录
- 视频
  视频
  - 科技发展
  - 生活向追剧
  - 纪录片
    纪录片
    
    人生海海
- 品尝
  品尝
  - 粤菜
- 开车
  开车
  - 考驾照

线性回归

原生实现

思路，数据是线性分布的，即 y = w * x + b

人工生成w_real，b_real，并以此生成特征集和结果
随机生成拟合的 w_predict 和 b_predict
设置 learning_rate(学习率), batch_size(随机样本大小)，epoch(训练次数) 超参数
对于特征集和结果，每次训练，随机抽取 batch_size 的数据，进行训练
- 对 w_predict * x + b_predict与真实y 进行平方差求梯度
- 按照 负梯度*学习率 对w_predict和b_predict进行更新

import math
import time
import numpy as np
import torch
import random
from d2l import torch as d2l

# 生成数据  wx+b=y, n是case数量
def gen_data(w, b, n):
    x = torch.normal(0, 1, (n, len(w)))
    y = torch.matmul(x, w) + b
    y += torch.normal(0, 1, y.shape)
    return x, y.reshape(-1, 1)

# 对于features/labels，每次随机抽batch_size的数据用作训练
def data_iter(features, labels, batch_size):
    ndim = len(features)
    idx = [i for i in range(ndim)]
    idx = random.shuffle(idx)
    for i in range(ndim):
        st, ed = i, min(i+batch_size, ndim)
        yield features[st:ed], labels[st:ed]

# 预测值与真实值的 R2 距离
def squared_loss(y_predict, y):
    return (y - y_predict.reshape(y.shape))**2 / 2

# 根据w,b计算预测值 （线性回归）
def linreg(X, w, b):
    return torch.matmul(X, w) + b

# 随机梯度下降
def sgd(params, lr, batch_size):
    with torch.no_grad():
        for param in params:
            down_grad = lr * param.grad / batch_size
            # print("param: ", param, "down_grad: ",down_grad)
            param -= down_grad
            param.grad.zero_()

w_real = torch.Tensor([2.0, -2])
b_real = -5
features, labels = gen_data(w_real, b_real, 100)

w = torch.zeros((2,1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)
#print(w)

lr = 0.001 # learning rate
epochs = 50
net = linreg # 线性回归
loss = squared_loss #均方损失
batch_size = 10

epoch_ = []
loss_ = []

for epoch in range(epochs):
    for X, y in data_iter(features, labels, batch_size):
        l = loss(net(X, w, b), y)
        l.sum().backward()
        sgd([w, b], lr, batch_size)
    with torch.no_grad():
        train_l = loss(net(features, w, b), labels)
        real_loss = float(train_l.mean())
        #print(f'epoch {epoch + 1}, loss {real_loss:f}')
        epoch_.append(epoch)
        loss_.append(real_loss)
d2l.plt.plot(epoch_, loss_)


print(f'w估计误差: {w_real - w.reshape(w_real.shape)}')
print(f'b估计误差: {w_real - w.reshape(w_real.shape)}')
print(w_real, b_real)
print(w, b)

torch工具类实现

w_real = torch.Tensor([2.0, -2])
b_real = -5
features, labels = d2l.synthetic_data(w_real, b_real, 1000) # 生成数据

def load_array(data_arrays, batch_size, is_train=True):
    dataset = data.TensorDataset(*data_arrays)
    return data.DataLoader(dataset, batch_size, shuffle=is_train)


# next(iter(data_iter)) # 随机抽数据进行拟合
net = nn.Sequential(nn.Linear(2, 1))
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)
trainer = torch.optim.SGD(net.parameters(), lr=0.03) # sgd表示随机梯度下降

loss = nn.MSELoss() #平方差

batch_size = 10
data_iter = load_array((features, labels), batch_size)

epochs = 3
for epoch in range(epochs):
    for X, y in data_iter:
        l = loss(net(X), y)
        trainer.zero_grad()
        l.backward()
        trainer.step()
    l = loss(net(features), labels)
    print(f'epoch {epoch + 1}, loss {l:f}')

w = net[0].weight.data
b = net[0].bias.data

print(w_real, b_real)
print(w, b)

评论