Apache火花™
Seit ihrer Freigabe hat die统bob体育亚洲版一分析引擎Apache的火花,艾因扎格在《未到的地方》中。Online-Riesen, wie Netflix, Yahoo和eBay, haben Spark在Umfang进行了大规模的收购。Gemeinschaftlich haben sie bereits mehere Petabyte an Daten auf群集mit mehr als 8 000 Knoten verarbeitet。Rasch hat sich das Projekt zur größten开源社区im大数据- berich entwickert - mit über 1.000 aktiv beitrenden Entwicklern aus mehr als 250 Unternehmen und organisen。
Apache Spark ist zu 100 Prozent开bob下载地址源。Gehostet wid es bei der anbieterunabhängigen Apache软件基金会。数据库setzt sich für die Aufrechterhaltung dieses offenen Entwicklungsmodells in。Gemeinsam mit der Spark-Community leistet Databricks deshalb auch weiterhin einen großen Beitrag zum Apache Spark-Projekt。
火花wurde entwickelt,嗯eine möglichst gute性能gewährleisten zu können。Selbst riesige Datenmengen könnenmit der Engine 100-mal schneller verarbeitet werden, als mit Hadoop。Dafür sorgen In-Memory-Berechnungen and weitere Optimierungen。火花在那里,在那一天的节日里。Derzeit hält es den Weltrekord im Sortieren von umfangreichen Datenmengen auf Festplatten。
Spark beitzt anwenderfreundliche api für den Betrieb umfangreicher Datenmengen。Hierzu zählt auh eine Sammlung aus über 100 Operatoren für die Umwandlung von Daten und bekannten数据框架- api zur Bearbeitung von半strukturierten Daten。
Spark wid mit vielen höherrangigen Bibliotheken geliefert, darunter支持für SQL-Abfragen, Streaming-Daten,机器学习和Diagrammverarbeitung。Diese标准书目steigern die Produktivität der Entwickler und können nahtlos kombiniert werden, um complexe工作流程zu erstellen。
Die Databricks统bob体育亚洲版一分析-平台bietet Die 5-fache性能开源-变体von Spark, gemeinschaftlbob下载地址ich nutzbare笔记本,集成工作流和Sicherheit auf Enterprise-Niveau - dies alles, auf einer vollständig verwalteten云平台。
砖testenDas开源apache Spark-Projekt kann海尔heruntergeladen了