跳转至

Draymonder Docs

PyTorch教程

Draymonder Docs

主页
编码人生
编码人生
- 机器学习
  机器学习
  - 大模型
    大模型
    
    Agent调研
    
    深入理解LangManus
    
    IMO Agent
  - 自然语言处理
    自然语言处理
    
    NLP简介
  - 数据分析
    数据分析
    
    Pandas教程
  - 深度学习
    深度学习
    
    PyTorch教程 PyTorch教程
    目录
    
    入门教程
    
    引用
    
    线性回归
    
    多层感知机
    
    SoftMax
- 计算机科学
  计算机科学
  - 操作系统
    操作系统
    
    MiniOS-xv6
    
    Linux C++开发
    
    Linux常用命令
    
    Linux IO
    
    Linux Memory
    
    面试常考题
  - 网络
    网络
    
    Web/RPC 框架
    
    图解Http
    
    正/反向代理
    
    DNS应用
  - 经典书籍
    经典书籍
    
    设计数据密集型应用
- 中间件
  中间件
  - 关系数据库
    关系数据库
    
    MySQL-InnoDB引擎
    
    MySQL-踩坑
    
    BoltDB
  - 非关系数据库
    非关系数据库
    
    Bitcask
  - 缓存
    缓存
    
    Redis
    
    缓存-踩坑
  - 消息队列
    消息队列
    
    Kafka
    
    RocketMQ
- 系统设计
  系统设计
  - 性能测试平台
  - 设计原则
  - 微服务
    微服务
    
    微服务设计
    
    DNS & CDN & 异地多活
    
    日志 & 链路追踪 & 监控
  - go im
  - 视频进度设计
  - 评论中台设计
- 信息安全
  信息安全
  - 游戏外挂调研
- 其他
  其他
点滴生活
点滴生活
- 年度总结
  年度总结
  - 2025
  - 2024
  - 2023
  - 2022
  - 2021
- 书籍
  书籍
  - 传记
    传记
    
    邓小平传
    
    江泽民传
    
    马斯克传
    
    乔布斯传
  - 投资
    投资
    
    金钱心理学
    
    聪明的投资者
    
    财富的真相
    
    纳瓦尔宝典
  - 社交
    社交
    
    人性的弱点
  - 历史
    历史
    
    明朝那些事儿
  - 人文
    人文
    
    文化苦旅
  - 情感
    情感
    
    人间告白
- 理财
  理财
  - 理财实践
  - 诈骗总结
- 运动
  运动
  - 骑行
    骑行
    
    2024 渐入佳境
    
    2023 初试
- 游玩
  游玩
  - 2025
    2025
    
    2025初冬
    
    2025国庆
    
    2025七夕
    
    2025端午
    
    2025五一
    
    2025清明
  - 2024
    2024
    
    2024冬季
    
    2024国庆
    
    2024中秋
    
    2024暑假
    
    2024端午
    
    2024女友见家长
    
    2024五一
    
    2024清明
    
    2024元旦
  - 2023
    2023
    
    2023石家庄
    
    2023团建
    
    2023国庆
- 考试
  考试
  - 教师招聘记录
- 视频
  视频
  - 科技发展
  - 生活向追剧
  - 纪录片
    纪录片
    
    人生海海
- 品尝
  品尝
  - 粤菜
- 开车
  开车
  - 考驾照

PyTorch

入门教程

依据pytorch官方文档以及土堆pytorch视频，训练一个模型，分别有如下几步

挑选数据集
网络模型构建 (线性层，非线性激活，卷积层，池化层)
loss函数 (分类用交叉熵，回归用均方差)
优化函数（梯度下降）
设置超参数（lr，epoch，batch_size）
模型训练
模型保存
(optional). TensorBoard画图观察

import torch.utils.data
import torchvision
from PIL import Image
import torchvision.transforms as transforms
from torch import nn
from torch.optim import SGD
from torch.utils.tensorboard import SummaryWriter
from torchvision.utils import make_grid
from tqdm import tqdm


def choose_device():
    return ("cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu")

device = choose_device()
print(device)
# 确保使用 LANCZOS 替代 ANTIALIAS
if not hasattr(Image, 'ANTIALIAS'):
    Image.ANTIALIAS = Image.LANCZOS

# 图片转tensor
transform = transforms.Compose([
    transforms.ToTensor()
])

# 超参数
lr = 0.01
epoches = 100
batch_size = 64

# 数据集
train_dataset = torchvision.datasets.CIFAR10("../data", train=True, transform=transform, download=True)
test_dataset = torchvision.datasets.CIFAR10("../data", train=False, transform=transform, download=True)
train_dataloader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_dataloader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size)


# 模型
class Model(nn.Module):
    # 输入是64*3*32*32
    def __init__(self):
        super().__init__()
        # 卷积层
        self.conv = nn.Sequential(
            nn.Conv2d(in_channels=3, out_channels=3, kernel_size=3, stride=1,padding=1, device=device),
            nn.MaxPool2d(kernel_size=2), # 3*16*16
            nn.Conv2d(in_channels=3, out_channels=3, kernel_size=3, stride=1, padding=1, device=device),
            nn.MaxPool2d(kernel_size=2), # 3*8*8
        )

        # 线性层
        self.line = nn.Sequential(
            nn.Flatten(),
            nn.Linear(in_features=3*8*8, out_features=128, device=device),
            nn.ReLU(),
            nn.Linear(in_features=128, out_features=64, device=device),
            nn.ReLU(),
            nn.Linear(in_features=64, out_features=10, device=device),
            nn.ReLU(),
        )

    def forward(self, X):
        X = self.conv(X)
        X = self.line(X)
        return X

m = Model()

step = 1
loss_fn = nn.CrossEntropyLoss()
opti = SGD(params=m.parameters(), lr=lr)

#writer = SummaryWriter(log_dir="./board")

for epoch in range(epoches):
    loss_all, correct = 0.0, 0
    print(f"==== epoch {epoch} start ====")
    m.train()
    for imgs, target in tqdm(train_dataloader, desc="train"):
        imgs = imgs.to(device)
        target = target.to(device)
        #print(f"imgs shape {imgs.shape} target shape {target.shape}")
        pred = m(imgs)
        opti.zero_grad()
        loss = loss_fn(pred, target)
        loss_all += loss.item()
        loss.backward()
        opti.step()
        step += 1

    m.eval()
    for imgs, target in tqdm(test_dataloader, desc="eval"):
        with torch.no_grad():
            imgs = imgs.to(device)
            target = target.to(device)
            pred = m(imgs)
            classes = torch.argmax(pred, dim=1)
            correct += (classes == target).sum()
    #if step % 100 == 0:
    print(f"correct: {correct / len(test_dataset) * 100}%")
    #for imgs, target in test_dataset:
    # print(f"pred shape {pred.shape}")
    #writer.add_image(tag="img", img_tensor=make_grid(imgs, ncols=8), global_step=step)
    #writer.add_image(tag="pred", img_tensor=make_grid(pred, ncols=8), global_step=step)
# writer.close()

引用

评论