术语表
无所不包的
替代数据是什么?替代数据收集的信息通过使用替代来源的数据其他人不使用; non-traditional information sources. Analysis of alternative data can provide insights beyond that which an in{…}
Apache蜂巢是什么?Apache蜂巢是开源数据仓库软件阅读,写作,和管理大型数据集从Apache Hadoop分布式文件系统中提取(HDFS),更大的Hadoop生态系统的一个方面。与exten{…}
Apache捻角羚是什么?Apache捻角羚是一个自由和开放源码Apache bob下载地址Hadoop柱状存储系统发达。这是一个引擎用于结构化数据,支持低延迟随机存取millisecond-scale访问单个行{…}
Apache麒麟是什么?分布式开放源码Apache麒麟是联机分析处理(OLAP)引擎bob下载地址互动分析大数据。Apache麒麟被设计来提供SQL接口和多维分析(OLAP) Hadoop / S{…}
Apache火花是什么?Apache火花是一个开源的分析引擎用bob下载地址于大数据的工作量。它可以处理两个批次以及实时分析和数据处理工作负载只Apache引发2009年开始作为一个研究项目{…}
Apache火花作为服务是什么?Apache火花是一个开源集群计算框架bob下载地址,用于快速实时大规模数据处理只自2009年成立以来在加州大学伯克利分校的AMPLab,引发了主要的增长。目前它是类风湿性关节炎{…}
图{margin-top: 20 px !重要;margin-bottom: 50 px !重要}数据分析平台是什么?bob体育客户端下载数据分析平台是一个生态系统的服务和bob体育客户端下载技术,需要执行大量的分析,复杂和动态数据{…}
什么是数据Lakehouse ?数据lakehouse是一个新的、开放数据管理体系结构,结合了灵活性,成本效益,和规模的数据湖泊与数据管理和数据仓库的ACID事务,支持业务int{…}
什么是DataFrame ?DataFrame是一种数据结构,将数据组织成一个二维表的行和列,就像一个电子表格。DataFrames是最常见的一种数据结构在现代数据分析,因为它们使用{…}
数据集是类型安全的版本的火花的结构化的Java API和Scala。这个API是在Python和R,因为这些都是动态类型语言,但它是一个强大的工具用Scala编写大型应用程序和Java。Recal{…}
ETL是什么?的数据量、数据来源和数据类型在组织成长,利用这些数据的重要性分析,数据科学和机器学习计划获得业务洞察力增长。需要公关{…}
HDFS HDFS (Hadoop分布式文件系统)是主要的存储系统由Hadoop应用程序使用。这种开源框bob下载地址架是通过迅速节点之间传输数据。它常常被公司需要处理和存储大数据。{…}
Hadoop生态系统是什么?Apache Hadoop生态系统是指各种组件的Apache Hadoop软件图书馆;它包括开源项目以及一个完bob下载地址整的范围的补充工具。一些最知名的工具{…}
托管火花是什么?Apache火花是一个快速和大数据集群计算系统建立在速度、易用性和先进的分析,最初建于2009年在加州大学伯克利分校。它提供高级api在Scala中,Java, Py{…}
什么是Jupyter笔记本?Jupyter笔记本是一个开源的web应用程序,它bob下载地址允许数据科学家创建和共享文档,包括代码,方程,和其他多媒体资源。Jupyter笔记本使用佛是什么{…}
Keras模型是什么?Keras深度学习是一个高级库,Theano和Tensorflow之上。写在Python和提供一个清洁和方便的方式来创建一系列深度学习模型只Keras已经成为{…}
什么是Lakehouse零售吗?砖的第一特定于行业的Lakehouse Lakehouse零售。它可以帮助零售商通过解决方案加速器快速启动和运行,数据共享能力,和合作伙伴生态系统。Lakehouse佛{…}
Apache火花的机器学习库(MLlib)被设计为简单起见,可伸缩性,并且很容易与其他工具的集成。与可伸缩性、语言兼容性,和速度的火花,科学家可以专注于他们的数据问题和国防部{…}
MapReduce是什么?MapReduce是一个基于java的、分布式的执行框架Apache Hadoop生态系统内只它带走了分布式编程的复杂性,让开发人员实现的两个处理步骤:1)和地图{…}
.logo图}{margin-bottom: 10 px !重要科学数据时,毫不夸张地说,你可以改变你的生意的方式是通过使用其潜能和熊猫DataFrame。要做到这一点,你需要国际扶轮{…}
p > .video-container {padding-bottom: 10 px !重要;margin-bottom: 0 px !重要;}PyCharm是一个集成开发环境(IDE)用于计算机编程、创建Python编程语言。当使用PyCharm Databric{…}
PySpark是什么?Apache火花是用Scala编程语言写的。PySpark已经发布为了支持Apache火花和Python的合作,它实际上是一个Python API的火花。此外,wi PySpark,帮助你接口{…}
抽样是主要面向用户的API引发自成立以来。核心,一个抽样是一个不可变的分布式数据的元素集合,跨中节点集群,可以并行操作的低级API{…}
火花Elasticsearch是什么?火花Elasticsearch NoSQL,分布式数据库存储,检索和管理面向文档和半结构化数据。GitHub开源,RESTfubob下载地址l Apache Lucene搜索引擎之上,r{…}
p > .video-container {padding-bottom: 0 px !重要;margin-bottom: 10 px !重要;}流分析是如何工作的呢?流分析,也称为事件流处理,是巨大的电流和池的分析数据用力推“运动”{…}
图{margin-bottom: 50 px !重要;}2015年11月,谷歌发布了为机器学习,并命名为TensorFlow开源框架。它支持深度学习、神经网络和一般数值计算cpu、gpu,{…}
Tensorflow估计API是什么?估计是一个完整的模型也看起来直观足以减少用户。估计量的API提供了一些方法来训练模型,来判断模型的准确性,并生成预测。TensorFlow{…}
砖的统一数据分析Platform 帮助组织加快通过统一数据科bob体育客户端下载学与工程和业务创新。与砖作为统一的数据分析平台,您可以快速准备和干净的数据质量bob体育客户端下载{…}
Apache Hadoop是一个基于jabob下载地址va的开放源码的软件平台管理大数据应用程序的数据处理和存储。bob体育客户端下载平台通过bob体育客户端下载分发Hadoop大数据在集群中的节点计算和分析工作,打破它们{…}