Azure宇宙DB

Azure宇宙DB是微软的全球分布,多模型数据库。Azure宇宙DB使您能够独立弹性和吞吐量规模和存储在任意数量的Azure的地理区域。它提供了吞吐量、延迟、可用性和一致性的保证全面的服务水平协议(sla)。Azure宇宙DB为下列数据模型提供了api,可以使用sdk在多种语言:

  • SQL API

  • MongoDB API

  • 卡桑德拉的API

  • 图(小鬼)API

  • 表API

这篇文章解释了如何读取数据,写入数据使用砖Azure宇宙DB。更多最新的细节Azure宇宙DB,明白了加快大数据分析利用Apache火花Azure宇宙DB连接器

重要的

这个连接器支持宇宙Azure DB的核心(SQL) API。MongoDB的宇宙DB API,使用MongoDB火花连接器。对于宇宙DB卡桑德拉API,使用卡桑德拉火花连接器

创建和连接所需的库

  1. 下载最新azure-cosmosdb-spark图书馆运行的版本的Apache火花。

  2. 上传下载的JAR文件砖后的指令上传一个Jar, Python鸡蛋,或Python轮

  3. 安装上传图书馆到你的砖集群。

使用Azure宇宙DB火花连接器

以下Scala笔记本提供了一个简单的例子,如何写数据到宇宙从宇宙DB DB和读取数据。看到[Azure宇宙DB火花连接器][Azure宇宙DB火花连接器)项目的详细文档。

Azure宇宙DB笔记本

在新标签页打开笔记本