站内搜索

搜索

手游源码-游戏源码-棋牌源码资源网-亲测源码-游戏搭建-破解游戏-网站源码-qq技术

100金币/天 购买

数据发现平台可以解决的问题为什么需要一个数据平台?

20

主题

67

帖子

459

金币

黄钻会员

Rank: 4

积分
989
发表于 2022-1-24 00:42:59 | 显示全部楼层 |阅读模式
数据治理意义重大。传统的数据治理以文档的形式进行管理开源数据治理工具,已经不能满足大数据下的数据治理需求。而适合大数据生态系统的数据治理非常重要。

大数据下的数据治理对于很多企业来说都是一个巨大的问题。可以找到的数据解决方案并不多。幸运的是,近年来,许多公司都尝试并开源了它们。本文将对这些进行详细分析。国外数据发现平台的实现方案有十几种。

数据发现平台可以解决的问题

为什么需要数据发现平台?

在数据治理过程中,经常会遇到这些问题:数据在哪里?如何使用这些数据?数据有什么用?数据是如何产生的?数据如何更新?

. . . . .

数据发现平台的目的是解决上述问题,帮助更好地发现、理解和使用数据。

例如,Nemo 使用全文检索技术,可以快速搜索目标数据。



用户浏览数据表时,如何快速了解数据?一般的方式是显示列名、数据类型、描述,如果用户有权限可以预览数据。

以下是数据列显示功能。



数据ETL是一个大问题天外神坛源码网,尤其是如何显示是非常困难的。实际上,数据的ETL可以用数据流图来表示。很多平台都支持这个功能,比如就有。

与数据调度平台有很好的结合。

数据发现平台比较

这里有五个开源解决方案

()

开源,最初称为 . 经过一段时间的开发开源数据治理工具,于2020年2月开源

//



可以说是一个非常有活力的项目,既有表结构、搜索、数据沿袭等功能,也有用户、群组等功能。

还提供官方文件。开源版本支持 Hive、Kafka 和关系数据库中的元数据。

所以使用率还是很高的。



(来福车)

Lyft 于 2019 年 4 月开发,并于 10 月开源。

/-io/



提供搜索和排名功能,帮助更好地查找数据表。

支持的数据源非常丰富,支持hive、druid等15个以上的数据源,还提供了与任务调度的集成以及与其他BI工具的集成。

数据沿袭功能也在开发中。



( )

2018 年 6 月开源。

支持 Hive、,、S3 和 RDS 集成。

不过虽然是开源的,但是官方没有提供文档,资料也很少。

()

2018 年 10 月开源

也有很好的支持。



可以看到还在更新中,敬请期待。



阿特拉斯()

作为其数据治理计划的一部分,Atlas 于 2015 年 7 月开始孵化。

Atlas 1.0 于 2018 年 6 月发布,当前版本为 2.1。

Atlas 的主要目标是数据治理,支持与 HBase、Hive 和 Kafka 的集成。



地址

//图集



丰富的文档



如何选择

首先说一下作者的选择。虽然对and很感兴趣,最终还是选择了Atlas。



开源、文档丰富、功能都在上表中进行了详细对比。如何选择取决于实际情况。

有五个开源: Atlas

有三个文档: Atlas

强大的搜索功能:

具有数据沿袭能力:Atlas

考虑到项目周期、实施等条件,建议从Atlas入手,开辟数据治理探索之路。

当然,也有公司使用 Atlas 和 Atlas 来处理元数据管理,并使用强大的数据搜索能力进行数据搜索,这也是一个不错的选择。

更多数据治理实践,欢迎关注大数据流
【天外神坛】免责声明及帮助
1.重要:如果遇到隐藏内容回复后显示为代码状态,直接刷新一下页面即可解决此问题。
2.本文部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
3.若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
4.如果本站有侵犯、不妥之处的资源,请在网站右边客服联系我们。将会第一时间解决!
5.本站所有内容均由互联网收集整理、网友上传,仅供大家参考、学习,不存在任何商业目的与商业用途。
6.本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与商业和非法行为,请在24小时之内自行删除!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

老群被封加此新群不迷路。
上个主题 下个主题 快速回复 返回列表 客服中心 搜索 QQ加群
上个主题 下个主题 快速回复 返回列表 客服中心 搜索 QQ加群

QQ|Archiver|小黑屋|天外神坛

湘ICP备2021015333号

Powered by 天外神坛 X3.4 © 2020-2022 天外神坛