雅克·皮埃尔·弗朗索瓦甜香槟

数据科学家,爱思唯尔

    雅克datascientist甜香槟目前爱思唯尔致力于实体识别。他小说内容重复数据删除,以及内容共享版权合规。新人道发达强大的领域知识以及专业技术自2011年他加入了爱思唯尔作为市场营销的一部分,然后webanalytics团队。nBefore加入爱思唯尔,雅克训练作为一个结构生物化学家与特殊利益与蛋白质和脂类交互。

    过去的会议

    峰会的欧洲2019 一个推荐的故事:提高后端数据质量,同时降低成本

    2019年10月15日凌晨5点PT

    一个推荐的故事:提高后端数据质量,同时减少costsnInformation超载是一个学者面临的最大挑战每天,找到合适的推进科学知识。大约7 k每天研究的文章被发表,你如何找到合适的呢?

    爱思唯尔是一个全球性的信息分析业务,帮助机构和专业人员促进医疗、开放科学和提高性能。与许多数据源和信号,数据科学和大数据工程提供完美的机会研究人员提供更多的价值。

    这里我们将关注Mendeley,开放的(免费的)学术内容平台帮助研究人员发现新信息通过人群来源收集等功能相关的学术文件(目录)和各种各样的个性化推荐bob体育客户端下载系统。MendeleySuggest,推荐系统,帮助全世界数以百万计的研究人员发现文档和人们有关他们的研究领域,它们还不知道存在。个性化推荐系统是由Mendeley目录,集群20亿记录正确规范记录,最先进的算法和大数据解决方案(例如火花)。

    在过去的几年里,我们注意到我们的内容增长,规范质量记录开始漂流由于可伸缩性问题。因此,我们面临的聚类精度问题,反过来,影响推荐系统。在这个演讲,我们将强调如何重新架构Mendeley目录,以改善其制造的可伸缩性和准确性。此外,我们将展示如何从Hadoop Map减少迁移到火花帮助我们降低成本以及提高可维护性。

    弗朗索瓦甜香槟雅克·皮埃尔