Avrilia Floratou

资深科学家,微软

    Avrilia资深科学家是微软的灰色系统实验室(GSL)。

    她的研究广泛领域的数据管理在于最近关注机器学习模型管理和大规模的流处理。她目前的工作试图简化生命周期数据科学通过自动化的一些任务数据科学家今天手动执行。她也工作等出现系统问题,在大规模复杂流管道的性能改善以及云部署的资源利用率。她积极贡献的设计Dhalion图书馆被用来有效地解决一些在生产上面的问题。Avrilia也使开源贡献Apache鹭(提交者)和MLflow

    Avrilia收到她从威斯康辛大学麦迪逊分校的计算机科学博士学位。在加入微软之前,她花了3年在IBM阿尔马登研究中心致力于SQL-on-Hadoop引擎和数据库自然语言接口。

    过去的会议

    峰会的欧洲2019 提高数据科学家的生活:自动化通过MLflow毫升生命周期

    2019年10月16日凌晨5点PT

    科学数据生命周期包含多个迭代步骤:数据收集、数据清洗/勘探、工程特点、模型训练、模型部署和得分。这个过程往往是乏味和容易出错,需要相当大的人力物力。除了这些挑战,当涉及到利用毫升在企业应用程序中,尤其是在监管环境中,数据处理水平的审查,模型公平、用户隐私和debuggability非常高。在这次演讲中,我们群的基本特征,采用端到端的平台,促进毫升的企业应用程序。bob体育客户端下载我们将这个新类的应用程序称为企业等级机器学习(EGML)。群利用MLflow简化和自动化支持EGML应用程序所涉及的步骤,允许数据科学家花大部分的时间在改进毫升模型。群利用MLflow模型和实验跟踪但延伸和补充,它提供了自动记录,更深层次的整合与关系数据库通常存储机密数据,模型优化和支持ONNX模型格式和推理的ONNX运行时。我们还将提出我们的正在进行的工作数据和ML模式之间自动跟踪血统在监管环境是至关重要的。我们将展示群的功能通过使用微软Azure Data Studio和MLflow演示。