c# - 使用 C# 加载(预训练的)CNTK 模型

标签 c# cntk

我正在使用 CNTK.GPU v2.2.0 并使用以下方法保存模型:

model.Save(modelFilePath);

现在我想再次加载它,例如继续训练或只是评估样本。我可以通过两种方式看到这是如何可能的。一种方法可行,但不可行。第二个不起作用。

  1. 我再次从头开始构建神经网络的整个结构,然后在其上调用以下方法:

    model.Restore(modelFilePath);
    

的确,这行得通。

  1. 我使用以下静态方法创建我的模型:

    Function.Load(modelFilePath, DeviceDescriptor.GPUDevice(0));
    

这行不通。

在这些操作之后,我只是为模型创建了一个训练器,创建了一个 minibatchSource 并尝试以与保存模型之前相同的方式训练模型。

但是使用第二种策略我得到以下异常:

System.ArgumentOutOfRangeException:'1 个必需参数'Input('features', [28 x 28 x 1], [, #])' 的值,即请求的输出'Output('aggregateLoss ', [], []), Output('lossFunction', [1], [, #]), Output('aggregateEvalMetric', [], [])' 依赖,未提供。

[CALL STACK]
    > CNTK::Internal::  UseSparseGradientAggregationInDataParallelSGD
    - CNTK::Function::  Forward
    - CNTK::  CreateTrainer
    - CNTK::Trainer::  TotalNumberOfSamplesSeen
    - CNTK::Trainer::  TrainMinibatch (x2)
    - CSharp_CNTK_Trainer_TrainMinibatch__SWIG_0
    - 00007FFA34AE8967 (SymFromAddr() error: The specified module could not be found.)

它说没有提供输入功能。我在训练和从头开始创建模型时使用输入:

var input = CNTKLib.InputVariable(_imageDimension, DataType.Float, _featureName);
var scaledInput = CNTKLib.ElementTimes(Constant.Scalar<float>(0.002953125f, _device), input);
...

所以我认为我必须将加载模型的输入替换为我为训练创建的输入,并在我从头开始创建模型时使用 - 尽管输入没有不同。 但我坚持尝试这个,因为我无法检索模型对象的输入,我需要替换它(我认为)。

model.FindByName(inputLayerName);

只是返回 null,尽管我可以清楚地看到该名称与调试器中模型“输入”列表中的层名称相匹配。

因此我不知道如何正确加载已保存的模型。我希望有人能帮助我。

最佳答案

幸好我自己找到了答案。我将其张贴在这里,因为可能还有其他 CNTK 初学者,他们可能会遇到这个问题,或者通常想知道如何正确加载模型。

问题是我没有使用相同的输入对象进行训练和模型创建。换句话说,如果我让用提到的静态方法创建我的模型,我仍然必须确保模型中的对象和用于训练的对象是相同的。这应该可以通过以下方式实现:

  1. 用您自己的输入对象替换加载模型的输入,并将此对象也用于训练。我没有对此进行测试,但它应该可以工作。
  2. 提取加载模型的输入并将其用于训练。我刚刚测试了这个并且它有效。 有我使用的代码:

    var labels =
        CNTKLib.InputVariable(new int[] {_classesNumber}, DataType.Float, _labelNa
    
    Variable input;
    Function model;
    if (File.Exists(_modelFile))
    {
        model = Function.Load(_modelFile, DeviceDescriptor.GPUDevice(0));
        input = model.Arguments.Single(a => a.Name == _featureName);
    }
    else
    {
        input = CNTKLib.InputVariable(_imageDimension, DataType.Float, _featureName);
        model = BuildNetwork(input);
    }
    
    var trainer = CreateTrainer(model, labels);
    
    IList<StreamConfiguration> streamConfigurations = new StreamConfiguration[]
    {
        new StreamConfiguration(_featureName, _imageSize), 
        new StreamConfiguration(_labelName, _classesNumber)
    };
    
    var minibatchSource = MinibatchSource.TextFormatMinibatchSource(
        Path.Combine(_ressourceFolder, _trainingDataFile),
        streamConfigurations,
        MinibatchSource.InfinitelyRepeat);
    
    TrainModel(minibatchSource, trainer, labels, input);
    

我一开始也犯了一个错误,就是使用

Variable layer model.FindByName(inputLayerName)

虽然我不得不使用

Variable layer = model.Arguments.Single(a => a.Name == inputLayerName);

关于c# - 使用 C# 加载(预训练的)CNTK 模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46829741/

相关文章:

c# - Regex.Split 特定字符

python - CNTK教程:"Hands-On Lab: Image recognition with Convolutional Networks, Batch Normalization, and Residual Nets"python问题

c# - 如何在 Excel 中以编程方式对工作表进行分组(移位选择)

c# - 如何正确分组我的 LINQ 查询?

c# - twilio中如何确认是否查看了已发送的消息?

c# - 如何对具有相同成员的不同类型参数使用相同的函数?

python - 我想在 CNTK 中实现正则化技术 "Shakeout"

machine-learning - CNTK 中的 cntk.blocks.Stabilizer() 函数有什么作用?

c# - CNTK LSTM 评估