编者荐语
深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intelligence)。
深度学习的概念源于人工神经网络的研究,含多个隐藏层的多层感知机(MLP,Multilayer Perceptron)就是一种典型的深度学习结构。
最简单(只含一个隐层)的MLP
深度学习通过组合简单(低层次)的特征形成更加抽象(高层次)的特征表示属性类别或特征,以发现数据的分布式特征表示。深度学习从原始数据的输入到最终任务目标的输出,不夹杂任何人为操作,即所谓End-to-End(端到端)的学习。
深度学习
如图所示,深度学习除了模型学习,还有特征学习、特征抽象等任务模块的参与,借助多层任务模块完成最终学习任务,故称其为“深度”学习。
深度学习中的一类代表算法是神经网络算法,包括深度置信网络(DBN,Deep Belief Networks)、递归神经网络(RNN,Recursive Neural Network)和卷积神经网络(CNN,Convolutional Neural Networks)等等。
特别是卷积神经网络,目前在计算机视觉、自然语言处理、医学图像处理等领域“大红大紫”,它也是作者主要介绍的一类深度学习算法。