在深度学习中区分炒作与现实

下载幻灯片

深度学习最近很流行,但是深度学习能做什么,媒体炒作从哪里开始呢?在这次演讲中,我将消除关于深度学习的常见神话,这些神话不一定是真的,并帮助您决定是否应该在软件堆栈中实际使用深度学习。

首先,我将对常见的神经网络架构(如cnn、rnn、GANs)及其常见用例(如计算机视觉、语言理解或无监督机器学习)进行技术概述。然后我将围绕以下问题将炒作与现实分开:

•什么时候应该选择传统的ML系统,如scikit learn或Spark。ML代替深度学习?
•如果使用深度学习,您是否不再需要进行仔细的特征提取和标准化?
•在训练神经网络时,你真的需要tb级的数据吗?或者你可以通过迁移学习从公共模型中“窃取”预先训练好的底层吗?
•如何决定在神经网络中使用哪个激活函数(如ReLU、leaky ReLU、ELU等)或优化器(如Momentum、AdaGrad、RMSProp、Adam等)?
•你应该随机初始化网络中的权重,还是使用更高级的策略,如Xavier或He初始化?
•神经网络过拟合/过度训练有多容易?卵形过拟合的常用技术有哪些(如l1/l2正则化,dropout和早期停止)?

会话标签:#DDSAIS14



«回来
关于Sameer Farooqui

我是OctoML的产品营销经理,该公司构建了Apache TVM(一个优化模型以更快地运行推理的ML编译器)。在此之前,我是谷歌Cloud的大数据战略云工程师,Databricks的培训师和布道师,以及Hortonworks的解决方案架构师。