网推：深度学习源码解读-ch0-talk is cheap-推生意网

为什么要做源码解读系列？

在被 deep learning、卷积神经网络等术语轰炸了朋友圈半年后，小张发现，他依然不懂什么是 deep learning（以下简称为 DL）。正如 Linus Torvalds 的名言所说

Talk is cheap. Show me the code.

小张意识到，上的 DL 文章转发再多都是学不会DL 的，作为工程师，必须得读源代码。DL 的开源框架有很多，最出名的三个是：

Caffe，C++Torch，LuaTheano，Python

出于对 C++ 的信仰，小张第一时间选择了 Caffe

git clone

马上就后悔了，依赖的第三方库过多（这一点原作者贾扬清也承认了），适合拿来用，但不适合 hack 和阅读理解，同时官方版本不支持 Windows，身为 Visual Studio 党完全无法接受。

幸好，Princeton 大学发布了 Marvin，这个名字是双关，既是《银河系漫游指南》中的忧郁机器人，也是人工智能之父 Marvin Minsky。

Marvin 是一个基于 CUDA 和 C++ 的深度学习框架，和 Caffe 相比它有以下优点：代码结构简单直接，方便原型开发没有复杂的 C++ 语法技巧GPU-only，代码更少，不再需要写上一堆抽象类，CPU 和 GPU 各实现一次。除了 CUDA 和 CUDNN 外不依赖任何第三方库，用 N 卡做深度学习，这两个库是必备的：）git clone 网推：深度学习源码解读-ch0-talk is cheap

整个框架的核心代码只有两个文件 marvin.cu 和 marvin.hpp。神经网络 101，class Net{}

在贴大段大段的代码之前稍微介绍下什么是神经网络。

神经网络中是由很多层（layer）组成的，layer 是对输入数据的操作。

下图的 layer 输出的运算结果 y 是 x1 * w1 + x2 * w2 + x3 * w3 + 1 * b

layer 的输入（X）和输出（y）被称为响应（Response）。网推：深度学习源码解读-ch0-talk is cheap

layer有许多其他形式，Marvin 中预设的有

DataLayer，负责提供原始数据给神经网络，包括 TensorLayer、MemoryDataLayer 以及 DiskDataLayer。ConvolutionLayerInnerProductLayerDropoutLayerSoftmaxLayerActivationLayerPoolingLayerLRNLayerReshapeLayerROIPoolingLayerROILayerElementWiseLayerConcatLayerLossLayer

这些 layer 的功能及代码实现将在后续文章中一一介绍。我们先看下最重要的 Net类包括什么成员变量：

class Net { public: Phase phase; std::vector<Layer*> layers; std::vector<Response*> responses; std::vector<LossLayer*> loss_layers; int GPU; bool debug_mode; int train_iter; int test_iter; cudnnHandle_t cudnnHandle; cublasHandle_t cublasHandle; ... ... };

结合下图的神经网络，Net::layers 变量保存所有的层，即图片中的箭头。Net::responses 对应的是圆圈。DataLayer 是第一层的类型，负责读取磁盘或内存中的图片，并将数据转化为Marvin 可以理解的内部格式（这种格式叫 Tensor，即 N 维数组，以后会讲）。

这个网络的最终输出为两个0 ～ 1之间的浮点数，表示网络认为输入的图片是 cat 的概率以及 not cat 的概率。这个例子中 cat 的值为 0.9，表示很像猫。

但是，并不是每个网络都这么智能，比如这位，居然认为这不是一只猫。

对此，我们需要结合网络输出的结果（Network Output）和真实的训练数据（Ground Truth），对没有达标的网络进行惩罚。通过这种惩罚机制，使得网络的输出结果接近训练数据。我们的目标是对所有的训练图片，最小化惩罚值。这正是 Net::loss_layers 存在的意义。

今天的专栏就到这里，休息，休息一会。

转载请保留作者名、注明源自公众号“黑客与画家”（HackerAndPainter），关注游戏开发、计算机视觉、图形学、虚拟现实、体感交互等好玩的内容。网推：深度学习源码解读-ch0-talk is cheap

网推：深度学习源码解读-ch0-talk is cheap

相关推荐