在PyTorch中实现迁移学习通常包括以下步骤:
- 加载预训练模型:首先加载一个预训练的模型,例如在ImageNet数据集上训练好的模型。
import torch import torchvision.models as models model = models.resnet18(pretrained=True)
- 修改模型的最后一层:通常迁移学习的目的是将预训练模型应用到新的任务上,因此需要将模型的最后一层替换成新任务的输出层。你可以通过修改模型的全连接层来实现这一步。
n_features = model.fc.in_features model.fc = torch.nn.Linear(n_features, num_classes) # num_classes为新任务的类别数
- 冻结模型的参数:在迁移学习中,通常会冻结预训练模型的参数,只训练新添加的层的参数。通过设置参数的requires_grad属性可以实现参数的冻结。
for param in model.parameters(): param.requires_grad = False
- 定义损失函数和优化器:定义适合新任务的损失函数和优化器。
criterion = torch.nn.CrossEntropyLoss() optimizer = torch.optim.SGD(model.parameters(), lr=0.001)
- 训练模型:使用新的数据集对模型进行训练。
for epoch in range(num_epochs): for inputs, labels in dataloader: optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step()
这样就完成了迁移学习的实现过程。通过以上步骤,你可以利用预训练的模型在新任务上快速进行模型训练。