1:业务背景及需求排序
公司目前的数据需求主要分为两类:临时需求(业务突然想看看这波活动的效果,数据指标的定义随时可能改变或增加)、固化需求(每周、月度数据,数据的定义已经很明确了)。针对这两类需求,我们目前的解决方案是
这简洁明了天外神坛,但问题很明显:
这种情况下,我们要搭建一个多维分析平台,让业务端自己去取数,最好不要用SQL,因为我们大部分业务端都不会用SQL(虽然我们进行过SQL训练开源数据治理工具,还有一定的门槛)。该平台至少满足以下要求
1.SQL查询速度比较块(现在hue太慢了,简单查询要2分钟多),所以底层应该支持大数据OLAP引擎
2.比较傻的自助分析模型,最好是拖拽;(因为很多分析师没有 SQL 技能)
3.可视化有最基本的图表类型(包括数字、地图、时间趋势)
4.开源产品,免费;商业产品数据在其他人的服务器上;
5.报表/看板的过滤功能支持时间段过滤,最好是联动过滤;
6.权限达到最低阈值(可以控制修改和删除表),同时可以实现数据行级控制(很多业务部分看数据)
二:产品分析
我们直接从开源工具入手,选择了以下产品作为重点研究对象:
,,
A) (gihub star 15,670)
官方宣传功能(版本号:v0.32.9)
总的来说,从个人经验来看开源数据治理工具,亮点如下:
a) 交互体验对商务人士非常友好。通过看板和单个图像的全局搜索功能,创建“问一个”的智能场景。也就是通过搜索框咨询,系统会告诉你答案。并且整个产品的界面非常简洁明了。
b) 制作单个图表非常简单,以数据为中心,选择不同的图表(不可选择的图表自动变灰)。基本上,单张图像分析可以在半分钟内完成。
但是最大的缺点是权限管理太弱,只有粗粒度的可以修改/可见的控制,没有单独控制表是否可以删除。
各方面的详细情况如下:
1)数据源和数据管理
2)图表单图&看板
3)SQL 查询
SELECT count(*)
FROM products
WHERE 1=1
[[AND id = {{id}}]]
[[AND category = {{category}}]]
4)权限管理
5)二次开发
B) (gihub star 25,163)
官方宣传功能(版本号:v0.32.9)
总的来说,从个人经验来看,亮点如下:
a) 整个主流大数据引擎的深度,SQL查询速度体验无话可说;
b) 可视化选项非常丰富,有多套基于经纬度的地理位置可视化方案;
c) 权限控制非常精细,细化到每个功能键;
不幸的是,最大的问题是业务分析师的用户体验不是很好。可视化过程需要针对不同的图形方案进行相应的参数设置,权限控制也很复杂。
各方面的详细情况如下:
1)数据源和数据管理
2)图表单图&看板
4)权限管理
5)二次开发
C)
待续~ |