卢卡斯·帕特里奇

软件工程师,通用航空数字

    卢卡斯·帕特里奇博士原本是一名生物学家,后来转行从事软件工程。在IBM工作了12年后,他加入了GE航空公司,自2012年起,他一直在英国南安普顿支持一个数据科学家团队。他在团队中的主要关注点是确保数据科学家的算法能够在Apache Spark上扩展大数据。

    过去的会议

    GE航空公司有数百名数据科学家和工程师在开发算法。这些人中的大多数没有时间学习Apache Spark,并继续在本地机器上使用Python或r进行开发。我们也有许多历史代码不是为Spark开发的。然而,该业务希望尽快部署到Spark环境以获得可伸缩性。那么我们是如何弥合差距的呢?数据科学家和软件工程师将共同出席,分享我们如何处理构建、统一和扩展这些算法的问题。