跳转到主要内容
人工智能的数据

Hadoop的迁移时的首要考虑

分享这篇文章

Apache Hadoop超过15年前成立作为一个开源的,分布式存储和计算平台为大型数据集设计和大规模的批处bob下载地址理。bob体育客户端下载在早期,它是便宜的比传统的数据存储解决方案。当时,企业不需要在特定的硬件上运行它。的Hadoop生态系统也包含多个开放源代码项目,它可以部署本地和云端,但是bob下载地址它是复杂的。

但是15岁的技术并不是专为今天的工作负载。当它归结到它,动物园的Hadoop是一个精心设计的系统技术。这是资源密集型和需要高技能的人来管理和经营环境。数据增长,需要更多的高级分析AI / ML,我们很少看到高级分析项目在Hadoop部署在生产。最后,它未能支持的基本面分析。在以前的博客,我们探讨了高的金融和运行Hadoop的资源税;环境是固定的,服务操作24/7,环境大小的峰值处理,可以是昂贵的升级,是集中维护。组织需要专门的团队保持灯,和系统的脆弱性影响他们的能力从所有的数据值。

有效地利用AI /毫升和所有数据的价值需要一个现代化的建筑。这个博客将穿过如何做到这一点和顶部考虑当组织计划迁移的Hadoop。

现代化的数据架构的重要性

一个企业级云数据和现代人工智能体系结构提供了无缝的规模和高性能,齐头并进的云以具有成本效益的方式。性能作为标准常常被低估,但是执行时间越短,云成本越低。

它还需要简单的管理,以便数据团队可以更加关注构建用例,不管理基础设施。和架构需要提供一个可靠的方法来处理各种各样的数据,使预测和实时分析用例驱动创新。进入砖Lakehouse平台bob体育客户端下载,从头构建的云支持\ AWS) \ \ Azure, \质量。管理协作环境,结合数据处理、分析通过砖的SQL、先进的分析数据科学和机器学习等与实时流数据(ML)。这消除了需要缝合多个工具和担心脱节的安全或移动数据——数据驻留在组织内的云存储三角洲湖。一切都在开放格式访问开放源码工具,使组织保持完全控制他们的数据和代码。bob下载地址

规划你的迁移Hadoop时的首要考虑

时的首要考虑组织正在计划他们的迁移的Hadoop

内部的问题

让我们开始谈论计划迁移。有几件事数据团队、cio和债务抵押债券需要经历,与任何旅程。最开始的问题,我现在在哪里?我需要去哪里?然后评估当前的基础设施和计划的构成新的世界。将会有很多新的知识和自我发现,发生在这一点。数据团队将测试和验证一些假设。最后,他们可以执行迁移本身。一组开始迁移前组织应该问的问题包括:

  • 我们为什么要迁移?不再有价值,你不是创新你的竞争对手一样快,Hadoop的承诺不再存在。有一个昂贵的许可更新了最后一个特定版本的我们的生活Hadoop环境或硬件刷新在地平线上,首席信息官和首席财务官想要避免的。可能上述等等。
  • 所需的开始和结束日期是什么?
  • 支持所需的内部利益相关者是谁?
  • 谁需要参与每个阶段?这将有助于地图需要哪些资源。
  • 最后,迁移如何融入整个云策略?组织要AWS, Azure,还是质量?

迁移评估

组织必须先把库存的所有移民项目。注意环境和各种工作负载,然后优先考虑用例需要迁移。而大爆炸的方法是可行的,一个更实际的方法将迁移项目对于大多数项目。此外,组织需要了解工作运行的代码是什么样子。在大多数情况下,组织还必须建立一个商业理由迁移,包括现有的所有权的总成本计算和预测和成本数据砖本身。最后,组织将有一个更好的了解他们的迁移时间和与原计划时间表完成迁移评估。

技术规划阶段

技术阶段携带大量的重量在Hadoop迁移。在这里,组织需要思考自己的目标架构并确保它将长期支持业务。一般的数据流将类似于已存在的东西。在许多情况下,过程包括旧技术映射到新的或者只是和优化。组织还必须评估他们的数据移动到云的工作负载。会有,或者更变革在砖利用新功能?或两者的混合?其他因素包括数据治理和安全,和引进的自动化在可能的情况下,确保顺利迁移,因为它可以不容易错误,并介绍了可重复的过程。这里,还组织应该确保现有生产流程结转到云,绑定到现有的监视和操作。

评估和实施

要了解新平台提供,如何翻译。bob体育客户端下载砖不是Hadoop,但是它提供了类似的功能更大的性能和规模的所有数据在数据处理和数据分析。也建议进行某种形式的评估,有针对性的演示,也许研讨会,或共同计划生产试点兽医对环境的一种方法。

迁移执行

最后考虑的是执行迁移。迁移绝非易事。然而,完成它正确的第一次现代化计划的成功是至关重要的,如何迅速组织终于可以开始规模分析实践,降低成本和提高整体团队的生产力数据。组织应该首先部署一个环境,然后迁移用例的用例,将整个数据,然后代码。确保业务连续性,组织应考虑运行工作负载在Hadoop和砖。需要验证,以确保在新环境中都是相同的。当事情很好,这个决定可以削减到砖和解除Hadoop的用例。组织将清洗和重复的所有剩余的用例,直到他们都转移,之后整个Hadoop环境可以退役。

迁移的Hadoop不是“如果”的问题,但“当”

大量的信用去Hadoop的创新推动的时候甚至几年前的《盗梦空间》。然而,作为组织做更多的与他们的数据,使数据团队做更多的分析和人工智能,和更少的基础设施维护、数据管理、数据和人工智能的世界需要一个Hadoop的选择。全球组织已经意识到,它不再是一种如果迁移需要保持竞争力和创新,而是一个时间的问题。组织等待的时间越长,发展他们的数据架构,以满足日益增长的客户需求和竞争压力,他们背后的进一步下跌而导致增加成本。随着现代化组织开始他们的旅程,他们需要一个循序渐进的方法,深入探索五因素在整个组织和竖井内不仅业务。了解更BOB低频彩多关于砖迁移,访问www.neidfyre.com/solutions/migration

从Hadoop数据迁移Lakehouse假人
以更低的成本更快的见解,当你从遗留Hadoop架构迁移到Lakehouse。

免费试着砖
看到所有数据策略的帖子