在深度学习中区分炒作与现实

深度学习最近很流行，但是深度学习能做什么，媒体炒作从哪里开始呢?在这次演讲中，我将消除关于深度学习的常见神话，这些神话不一定是真的，并帮助您决定是否应该在软件堆栈中实际使用深度学习。

首先，我将对常见的神经网络架构(如cnn、rnn、GANs)及其常见用例(如计算机视觉、语言理解或无监督机器学习)进行技术概述。然后我将围绕以下问题将炒作与现实分开:

•什么时候应该选择传统的ML系统，如scikit learn或Spark。ML代替深度学习?
•如果使用深度学习，您是否不再需要进行仔细的特征提取和标准化?
•在训练神经网络时，你真的需要tb级的数据吗?或者你可以通过迁移学习从公共模型中“窃取”预先训练好的底层吗?
•如何决定在神经网络中使用哪个激活函数(如ReLU、leaky ReLU、ELU等)或优化器(如Momentum、AdaGrad、RMSProp、Adam等)?
•你应该随机初始化网络中的权重，还是使用更高级的策略，如Xavier或He初始化?
•神经网络过拟合/过度训练有多容易?卵形过拟合的常用技术有哪些(如l1/l2正则化，dropout和早期停止)?

会话标签:#DDSAIS14

«回来

关于Sameer Farooqui

我是OctoML的产品营销经理，该公司构建了Apache TVM(一个优化模型以更快地运行推理的ML编译器)。在此之前，我是谷歌Cloud的大数据战略云工程师，Databricks的培训师和布道师，以及Hortonworks的解决方案架构师。