克里斯蒂安·格兰特是深度学习工程师、数据科学家、大数据架构师和自动驾驶汽车工程师。他专注于人工智能、深度学习、自动驾驶汽车技术、物联网、安卓、大数据和实时流媒体的结合。他拥有丰富的财富500强公司项目工作经验,包括:德蒙德、飞利浦电子、德勤、IBM、日立、安联、庞巴迪航空、波音和马士基。目前,他正在研究嵌入式设备上的TensorFlow、Keras和TensorFlow Lite的语音分离和音频处理解决方案。
很多人都很擅长在多人说话的场景中把注意力集中在一个人或一个声音上,并“静音”其他人和背景噪音。这就是所谓的鸡尾酒会效应。对于其他人来说,分离音频源是一个挑战。
在这次演讲中,我将重点讨论用深度神经网络和TensorFlow来解决这个问题。我将与观众分享技术和实现细节,并讨论解决方案的收益、痛点和优点,因为它涉及:
*准备、转换和增强语音分离和噪声去除的相关数据。
*创建、训练和优化各种神经网络架构。
*在小型设备上运行网络的硬件选项。
*最终目标:小型嵌入式平台上的实时语音分离。bob体育客户端下载
我将展示未来的智能空气舱、智能耳机和智能助听器,它们将运行深度神经网络。
与会者将深入了解在嵌入式设备上使用深度神经网络进行语音分离的一些最新进展和局限性,涉及:
*数据转换和增强。
*用于语音分离和去除噪声的深度神经网络模型。
*训练更小更快的神经网络。
*创建实时语音分离管道。