pytorch 实现模型不同层设置不同的学习率方式_Python

pytorch 实现模型不同层设置不同的学习率方式

2020-05-08 09:52-wxrui- Python

今天小编就为大家分享一篇pytorch 实现模型不同层设置不同的学习率方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

在目标检测的模型训练中，我们通常都会有一个特征提取网络backbone，例如YOLO使用的darknet SSD使用的VGG-16。

为了达到比较好的训练效果，往往会加载预训练的backbone模型参数，然后在此基础上训练检测网络，并对backbone进行微调，这时候就需要为backbone设置一个较小的lr。

									class net(torch.nn.Module):

									  def __init__(self):

									    super(net, self).__init__()

									    # backbone

									    self.backbone = ...

									    # detect

									    self....

在设置optimizer时，只需要参数分为两个部分，并分别给定不同的学习率lr。

									base_params = list(map(id, net.backbone.parameters()))

									logits_params = filter(lambda p: id(p) not in base_params, net.parameters())

									params = [

									  {"params": logits_params, "lr": config.lr},

									  {"params": net.backbone.parameters(), "lr": config.backbone_lr},

									]

									optimizer = torch.optim.SGD(params, momentum=config.momentum, weight_decay=config.weight_decay)