- 安卓下载 相关标签
类型:系统增强
语言:简体中文
更新: 2020-10-10 13:51:02
大小:13.5 GB
平台:Win All
- 1[系统增强]Win10应用商店独立版 最新下载
- 2[系统增强]3DAnalyze最新版 v2.36b 汉化中文版
- 3[系统增强]Microsoft Windows Installer下载 v4.5 简体中文版
- 4[系统增强]免费ISO生成器 v1.0 汉化版
- 5[系统增强]Windows优化大师官方版下载 支持win10系统 最新版
- 6[系统增强]快贴云剪贴板工具 v2.1.11 官方版
- 7[系统增强]魔方优化大师单文件绿色版下载 v6.2.5 官方版
- 8[系统增强]rufus U盘启动引导制作工具电脑版下载 v3.9.1624 免费版
- 9[系统增强]Glary Disk Clenaer电脑磁盘清理程序 免费下载
- 10[系统增强]directx redist最新版官方下载 v10.2 多国语言版
Alluxio架构是一款可以用于虚拟式数据分布储存应用的实用软件,它是世界上第一款采用内存为中心建立储存的软件。应用只需要连接Alluxio,即可快速访问存储在底层任意存储系统中的数据,大大提高了运行效率,是我们的办公的好帮手!
随着电脑技术的发展,日常工作中所需要处理的信息流也越来越大,当信息过多的时候就会导致读取数据变慢的问题,非常影响体验,使用Alluxio虚拟数据存储系统可以做到将数据分布在多级缓存中,从而起到了提高读取数据速度的效果。
【Alluxio架构软件背景】
Alluxio(之前名为Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统。它统一了数据访问的方式,为上层计算框架和底层存储系统构建了桥梁。 应用只需要连接Alluxio即可访问存储在底层任意存储系统中的数据。此外,Alluxio的以内存为中心的架构使得数据的访问速度能比现有方案快几个数量级。

【Alluxio架构软件特点】
灵活的文件API:
Alluxio的本地API类似于java.io.File类,提供了 InputStream和OutputStream的接口和对内存映射I/O的高效支持。我们推荐使用这套API以获得Alluxio的完整功能以及最佳性能。
兼容Hadoop HDFS的文件系统接口:
基于这套接口Hadoop MapReduce和Spark可以使用Alluxio代替HDFS。
可插拔的底层存储:
Alluxio支持将内存数据持久化到底层存储系统。Alluxio提供了通用接口以简化对接不同的底层存储系统。目前Alluxio支持Microsoft Azure Blob Store,Amazon S3,Google Cloud Storage,OpenStack Swift,GlusterFS, HDFS,MaprFS,Ceph,NFS,Alibaba OSS,Minio以及单节点本地文件系统,后续也会支持更多其他存储系统。
Alluxio层级存储:
Alluxio可以管理内存和本地存储如SSD和HDD,以加速数据访问。如果需要更细粒度的控制,分层存储功能可以用于自动化管理不同层之间的数据,确保热数据在更快的存储层上。自定义策略可以方便地应用到Alluxio,而且pin(钉住)的概念允许用户显式地控制数据的存放位置。
统一命名空间:
Alluxio可以通过挂载功能实现不同存储系统之间的高效数据管理。并且,透明命名机制在持久化存储对象到底层存储系统时可以保留存储对象的文件名和目录层次结构。
Web UI: 用户可以通过Web UI浏览文件系统。在调试模式下,管理员还可以查看每一个文件的详细信息,包括存放位置,检查点路径等。
命令行:
用户也可以通过./bin/alluxio fs与Alluxio交互,例如:实现将数据从文件系统拷入拷出。

【Alluxio架构使用方法】
1. 前言
随着移动互联网的发展,越来越多的业务数据和日志数据需要用户处理。从而,用数据去驱动和迭代业务发展。数据处理主要包括:计算和查询。计算主要为离线计算、实时流计算、图计算、迭代计算等;查询主要包括Ahdoc、OLAP、OLTP、KV、索引等。然而,在数据业务中,我们时常听到数据需求方和数据开发方对性能慢的不满,所以,如何高效响应海量且迫切的数据需求,是大数据平台需要面对的一个关键问题,本文将介绍如何基于Alluxio建设分布式多级缓存系统对数据进行计算加速和查询加速。
2. 离线数据计算查询加速问题
对于加速组件,结合生态兼容性和系统成熟性的基础上,我们选择Alluxio,我们知道,Alluxio是通过UFS思想访问底层持久化的分布式数据。通常,我们的数据主要存放在公司私有HDFS和MySQL上。那么,如何通过UFS思想访问到私有HDFS数据进行加速是我们面对的主要问题。私有HDFS由于历史原因,其基于的HDFS版本较低,加上公司对HDFS进行了部分改造,使得开源的计算和查询组件访问公司内部的离线数据较为困难。因此,如何打通Alluxio访问私有HDFS成为了系统的关键,后面的章节中,我们会做相关介绍。
3. 基于Alluxio的解决方案
整体上,我们当前的多级缓存系统由私有HDFS(PB级别) + MEM(400G) + SSD(64T)共3层组成。 示意如下:

系统会根据类似LRU思想对热点数据进行缓存。我们主要存放热点部门核心数据。由于资源申请原因,我们的Alluxio在南方,UFS在北方,所以后面的测试数据均为跨地域性能数据,提供基于Spark、Hive、 Presto、YARN、API等方式访问数据。
对于多级分布式缓存系统,我们实现的整体示意图如下:

从上述方案中,我们可以看出,如果通过path路径方式访问私有HDFS数据,直接使用alluxio://协议路径即可;但是,如果要开源的Hive或者开源组件(基于Hive桥接)以数据表方式访问公司内部的私有HDFS数据,需要进行“表schema映射”,思路如下图:

基于上述方案,可以大致抽象出使用Alluxio的几个一般性步骤,如下:

下面,我们会一一对每个步骤进行相关说明及案例数据分析。
3.1 Alluxio Meta数据同步(load和sync)
由于UFS随时可能会有变动,导致Alluxio Meta和UFS的Meta不一致,那么,如何在Alluxio的master中同步UFS文件的Meta十分重要,由于Alluxio Meta的load和sync性能成本较高(对于load和sync区别,本文不赘述),官方不推荐过度频繁load和sync Alluxio的Meta数据。
3.2 Alluxio加载数据
3.2.1 数据加载方案
有了缓存系统,那么,我们需要提前常用数据预加载到缓存系统中,如此,当用户使用时候,直接从缓存中读取,加快读取速度。数据预加载的方式有如下图的3种方式:

3.3 Alluxio数据的读取
3.3.1 数据本地化
本地化数据,相信大家都比较清楚,使用本地数据可以有效地提到数据读取效率,具体可以将每个worker节点的alluxio.worker.hostname设置为对应的$HOSTNAME,熟悉Spark的同学知道,这个设置类似Spark中的SPARK_LOCAL_HOSTNAME设置。
3.3.2 读取性能数据1(私有HDFS-\u0026gt;Alluxio-\u0026gt;Hive/Presto)

上图中,介词through和on的区别是,前者为首次从UFS上加载数据(即直接从私有HDFS上读取数据),后者为直接从Alluxio缓存中读取数据。
【Alluxio架构应用场景】
与其他诸如HDFS、HBase、Spark等大数据相关框架一致,Alluxio也是一个主从结构的系统。它的主节点为Master,负责管理全局的文件系统元数据,比如文件系统树等,而从节点为Worker,负责管理本节点数据存储服务。另外,Alluxio还有一个组件为Client,为用户提供统一的文件存取服务接口。
当应用程序需要访问Alluxio时,通过客户端先与主节点Master通讯,或许对应文件的元数据,然后再和对应Worker节点通讯,进行实际的文件存取操作。所有的Worker会周期性地发送心跳给Master,维护文件系统元数据信息和确保自己被Master感知扔在集群中正常提供服务,而Master不会主动发起与其他组件的通信,它只是以回复请求的方式与其他组件进行通信。这与HDFS、HBase等分布式系统设计模式是一致的。
Alluxio虚拟数据存储系统免费下载 官方版其他版本
用户评论
最新评论
- 置顶 河北承德电信 网友 敷衍
好东西值得分享
- 置顶 山东菏泽联通 网友 星星少女?
凡事要乘早
- 置顶 甘肃定西电信 网友 东风寄千愁
谢谢小编大大分享,支持一下。。。
- 置顶 河南开封电信 网友 等过春秋
这软件好用,奥力给
- 置顶 云南保山联通 网友 一米阳光°几度温暖
成功下载&成功使用

Advanced SystemCare Free中文版下载 v13.7.0.308 免费版
Windows 10X体验版官方下载 MSDN镜像版
CPUBalance Pro(系统CPU优化)软件下载 v1.0.0.92 最新官方版
PC Reviver系统优化软件下载 v3.12 汉化版(附注册激活码)
Asoftech Speeder变速齿轮 v2.19 官方版
华为鸿蒙系统官方版最新下载 v2.0 电脑版
电脑管家加速小火箭最新版下载 v1.0 独立版
统信UOS操作系统官方下载 v2020 最新免费版
msdn官方win10版下载 v2020 专业版
Process Tamer(电脑防死机专家/可增加系统稳定性)2.09.01汉化绿色特别版
微软电脑管家 v1.0.0.2164 中国特供版
VisualCppRedist(运行库合集)2022一月版下载 v57 绿色版
大番茄一键重装系统 v5.7.100 免费版
EasyBCD下载(系统引导修复工具) v2.2 绿色汉化版
爱思助手官方电脑版 v7.98.50 PC版
Windows10正式版 64位 免费版
变速齿轮无广告版 v0.46 绿色版
驱动人生离线网卡版 v2021 免安装版
360驱动大师网卡版安装包下载 v2.0.0 单文件版
360安全卫士电脑版官方下载 v6.3.1 极速版
联想电脑管家2021最新电脑版下载 v3.0.700.7272 正式版
msi afterburner显卡超频工具官方版下载 v4.6.2 中文版
深度操作系统deepin官方下载 v20.2.2 支持安卓应用(网盘资源)
WIN11预览版镜像下载 v21996.1 汉化极速精简版
Wise Care365 Pro单文件版免费下载 v5.6.6 永久激活版
ProcessKO汉化版下载 v5.55 绿色版
Ashampoo WinOptimi18官方版下载 v18.00.19 中文版
OpenRefine中文版免费下载 v3.4.1 官方版
鲁大师跑分专家经典版下载 v6.1021 最新版
win10优化大师最新绿色版下载 v1.0.0.8 正式版
TriSun WinExt Pro最新官方版下载 v18.0.072 中文版
CCleaner最新官方版 v5.78.8558 中文版
网卡优化大师电脑版下载 v2 绿色免费版
cygwin下载 64/32位免费版
优麒麟开源系统下载 v20.04.1 官方版
电脑隐私清理工具(Glary Tracks Eraser) v5.0.1.190 免费版
微软Win10免费工具集PowerToys v0.23.2 官方版
EF Process Manager v20.09 官方版
Registry Finder注册表管理工具中文版下载 v2.47 绿色版
Acer Care Center(宏碁电脑管理软件)官方下载 v2.0.3029.0 免费版
UAC白名单设置工具 v1.1 绿色免费版