alluxio架构_alluxio收入

alluxio架构_alluxio收入Alluxio介绍。

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

Alluxio介绍

Alluxio是什么?

Alluxio是世界上第一个用于云分析和人工智能的开源数据编排技术。它弥合了数据驱动应用程序和存储系统之间的鸿沟,使存储层的数据更接近数据驱动应用程序,并使其易于访问,使应用程序能够通过一个通用接口连接到多个存储系统。Alluxio的内存第一层体系结构使数据访问速度比现有解决方案快几个数量级。

在数据生态系统中,Alluxio介于数据驱动的应用程序(如Apache Spark、Presto、Tensorflow、Apache HBase、Apache Hive或Apache Flink)和各种持久性存储系统(如Amazon S3、Google Cloud storage、OpenStack Swift、HDFS、GlusterFS、IBM Cleversafe、EMC ECS、Ceph、NFS、Minio和阿里巴巴OSS)之间。Alluxio统一了存储在这些不同存储系统中的数据,为其上层数据驱动应用程序提供了统一的客户端API和全局名称空间。

它主要基于内存以文件的形式为上下游应用提供数据存取服务。

Ecosystem

优势

Alluxio通过简化应用程序访问数据的方式,可以让用户专注于数据的应用而非考虑数据存储的格式或位置。其优点如下:

  • 内存速度I/O:Alluxio可以用作分布式共享缓存服务,因此与Alluxio通信的计算应用程序可以透明地缓存频繁访问的数据,尤其是来自远程位置的数据,以提供内存I/O吞吐量。此外,Alluxio的分层存储可以同时利用内存和磁盘(SSD/HDD),使数据驱动应用程序的弹性扩展具有成本效益。
  • 简化的云和对象存储采用:与传统文件系统相比,云和对象存储系统使用不同的语义,这对性能有影响。常见的文件系统操作(如目录列表和重命名)通常会带来巨大的性能开销。当访问云存储中的数据时,应用程序没有节点级别的位置或跨应用程序缓存。通过使用云或对象存储部署Alluxio,可以从Alluxio而不是底层云或对象存储提供数据,从而缓解这些问题。
  • 简化的数据管理:Alluxio提供对多个数据源的单点访问。除了连接不同类型的数据源,Alluxio还允许用户同时连接到同一存储系统的不同版本,例如多个版本的HDFS,而无需复杂的系统配置和管理。
  • 易于应用程序部署:Alluxio管理应用程序与文件或对象存储之间的通信,将应用程序的数据访问请求转换为底层存储接口。Alluxio与Hadoop兼容。现有的数据分析应用程序,如Spark和MapReduce程序,可以在Alluxio上运行,无需任何代码更改。

技术创新

Alluxio将三个关键的创新领域结合在一起,提供了一套独特的功能。

  1. 全局名称空间:Alluxio作为多个独立存储系统的单点访问,而不考虑物理位置。这提供了所有数据源的统一视图和应用程序的标准界面。
  2. 智能多层缓存:Alluxio群集充当连接存储系统中数据的读写缓存。可配置策略可自动优化数据放置,以提高内存和磁盘(SSD/HDD)的性能和可靠性。缓存对用户是透明的,并使用缓冲来保持与持久存储的一致性。
  3. 服务器端API转换:Alluxio支持行业通用API,如HDFS API、S3 API、FUSE API、REST API。它可以透明地从标准客户端接口转换为任何存储接口。Alluxio管理应用程序与文件或对象存储之间的通信,无需复杂的系统配置和管理。文件数据可以看起来像对象数据,反之亦然。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/234892.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • pHP生成唯一单号

    pHP生成唯一单号

    2021年11月8日
    43
  • 负载均衡的算法有哪些_流量负载均衡

    负载均衡的算法有哪些_流量负载均衡G 公司有 n 个沿铁路运输线环形排列的仓库,每个仓库存储的货物数量不等。如何用最少搬运量可以使 n 个仓库的库存数量相同。搬运货物时,只能在相邻的仓库之间搬运。数据保证一定有解。输入格式第 1 行中有 1 个正整数 n,表示有 n 个仓库。第 2 行中有 n 个正整数,表示 n 个仓库的库存量。输出格式输出最少搬运量。数据范围1≤n≤100,每个仓库的库存量不超过 100。输入样例:517 9 14 16 4输出样例:11#include<bits/stdc++.

    2022年8月11日
    1
  • python构建IP代理池(Proxy Pool)[通俗易懂]

    python构建IP代理池(Proxy Pool)[通俗易懂]基本原理代理实际上指的就是代理服务器,它的功能是代理网络用户去取得网络信息。也可以说它是网络信息的中转站。在我们正常请求一个网站时,是将请求发送给Web服务器,Web服务器把响应传回给我们。如果设置了代理服务器,实际上就是在本机和服务器之间搭建了一个桥,此时本机不是直接向Web服务器发起请求,而是向代理服务器发出请求,请求会发送给代理服务器,然后由代理服务器再发…

    2022年5月18日
    30
  • Web API 设计摘要

    Web API 设计摘要

    2021年12月5日
    117
  • 【Activity】Activity的启动模式:SingleTask

    【Activity】Activity的启动模式:SingleTask目录1.概述2.详细过程2.1启动MainActivity2.1.1生命周期2.1.2Activity栈2.2MainActivity中启动SecondActivity2.2.1生命周期2.2.2Activity栈2.3SecondActivity中启动MainActivity2.3.1生命周期2.3.2Activity栈2.4…

    2022年6月26日
    27
  • java和 javaw 以及 javaws的区别

    java ,javaw 和 javaws的区别:首先,所有的这些都是java的启动装置,java.exe经常使用,当使用命令行输出到window的时候,会有java.exe进程,通过任务管理器可以看到。通常我们执行一些小的java程序的时候会有java.exe进程在运行。javaw.exe对于我们也比较特殊,我们也能够通过任务管理器看到javaw.exe进程的运行。javaws通

    2022年4月4日
    62

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号