B/S 架构的数据可视化分析平台开源方案不完全集锦,供各位参考。 排名不分先后。欢迎补充。

kibana

Elasticsearch 专用的数据分析检索仪表盘。ELK Stack 中的 K。

日志系统常见的可视化开源解决方案。

使用 Nodejs+AnglarJs+React 开发, 元数据存储在 ES 的一个索引中。

Elastic 公司维护开源,社区非常活跃,持续迭代中。

grafana

可视化仪表盘和图形编辑器,是一款常用的指标分析和监控工具。支持 Graphite、Elasticsearch、OpenTSDB、Prometheus 和 InfluxDB 作为数据源。

使用 Golang+TypeScript+AngularJS 开发,元数据支持 mysql 和 postgres。

Grafana Labs 公司维护,社区非常活跃,持续迭代中。

Superset

孵化中的准企业级 BI 应用。

很多大公司都在内部使用。

支持的数据源有 MySQL、Postgres、Vertica、Oracle、Microsoft SQL Server、SQLite、Greenplum、Firebird、MariaDB、Sybase、IBM DB2、Exasol、MonetDB、Snowflake、Redshift、Clickhouse、Apache Kylin 等!

使用 Python+Flask+react+jQuery 开发,默认使用 sqlite 存储元数据。 由 Airbnb 开源,现已归属于 Apache 孵化项目,社区非常活跃,持续迭代中。

Zeppelin

支持交互式数据分析的多用途 notebook 编辑器工具,可以接入不同的数据处理引擎和解释器,包括 Apache Spark,Python,JDBC,Markdown 和 Shell 等。内置 Apache Spark 集成。

Java+Angular 开发,元数据 notebook 默认使用本地文件系统存储在 git 仓库中。 由 Apache 开源,持续迭代中,目前版本 0.8。

Hue

开发和访问 SQL、数据应用的工作台,支持智能的 SQL 和任务编辑器、Dashboard 、任务工作流调度、数据浏览器。 Hadoop 生态系统可视化利器。

SQL 支持: Hive、Impala、MySQL、Oracle、KSQL / Kafka SQL、Solr SQL、Presto、PostgreSQL、Redshift、BigQuery、AWS Athena、Spark SQL、Phoenix、Kylin 等。

任务支持:MapReduce、Java、Pig、Sqoop、Shell、DistCp、Spark 等。

使用 Python+Django+jquery 开发,元数据默认使用 SQLite 存储。

Hue 由 Cloudera Desktop 演化而来,最后 Cloudera 公司将其贡献给 Apache 基金会的 Hadoop 社区。

CBoard

国产 BI 报表和 dashboard 平台。

支持 JDBC 数据源,Saiku2.x 数据源,Kylin1.6,Elasticsearch 1.x, 2.x, 5.x。

使用 Java Spring+MyBatis+AngularJS+Bootstrap 开发。元数据使用 MySQL5+/SQLServer。

上海楚国公司开源,最近发现官方出了收费的企业版,这个社区版显得 low 了很多。

Mining

Python 写的 BI 应用(Pandas web 界面)

OpenMining 支持基于 ORM SQLAlchemy 的所有数据库。

使用 Python+Lua+AngularJs+jQuery 开发,元数据存储在 MongoDB。

由 Avelino 和 UP! Essência 开发,master 分支的最新 commit 已经是 2016 年了

Saiku

经典的 OLAP 开源方案,Saiku 是一个模块化分析套件,提供轻量级 OLAP,易于嵌入,可扩展和可配置。 支持 Mondrian, XMLA 或者 Mongo 数据源链接类型。

其提供一个 Schema 设计器、交互式的报表引擎、展示板和 nosql 连接技术。使用 REST API 连接 OLAP 系统。

使用 Java+backbone+jQuery 开发,使用 JackRabbit 管理树状元数据。

最初叫做 Pentaho 分析工具,起初是基于 OLAP4J 库用 GWT(google web toolkit)包装的一个前端分析工具。后改名 Saiku,Analytical Labs 提供支持。

Metabase

简单快速的方式使用 BI 和分析。支持 Postgres、MySQL、Druid、SQL Server、Redshift、MongoDB、Google BigQuery、SQLite、H2、Oracle、Vertica、Presto、Snowflake。支持不写 SQL 的方式做可视化分析。支持 docker、jar 包方式安装。

使用 clojure 和 node 开发,前端使用 react 框架。元数据默认存储在 H2 数据库中。

社区较为活跃,项目也在持续更新中。

redash

SQL editor+ 可视化,支持 35 种数据源:Amazon Athena、Amazon DynamoDB、Amazon Redshift、Axibase Time Series Database、Cassandra、ClickHouse、CockroachDB、CSV、Databricks、DB2 by IBM、Druid、Elasticsearch、Google Analytics、Google BigQuery、Google Spreadsheets、Graphite、Greenplum、Hive、Impala、InfluxDB、JIRA、JSON、Apache Kylin、MapD、MemSQL、Microsoft SQL Server、MongoDB、MySQL、Oracle、PostgreSQL、Presto、Prometheus、Python、Qubole、Rockset、Salesforce、ScyllaDB、Shell Scripts、Snowflake、SQLite、TreasureData、Vertica、Yandex AppMetrrica、Yandex Metrica。

后端使用 Python 前端使用 Angular、React,元数据环境使用 PostgreSQL & Redis。

该项目目前也比较活跃,持续迭代中。

SqlPad

不知放在这里是否合适,SqlPad 一款基于 web 的 SQL 编辑器,支持 MySQL, Postgres, SQL Server, Vertica, Crate, Presto, SAP HANA, 和 Cassandra,支持数据可视化。但不支持仪表板等功能。

使用 Nodejs+React 开发,元数据存储在 Nedb 中。

由 Rick Bergfalk 开发,持续维护中。

结语

这些是我收集或调研过的一些数据可视化开源方案,它们或许在成熟稳定的企业级方案面前显得支离杂乱,也或许在牛人遍地的大厂内部显得不够专业。但它们开发者给提供了优秀的参考案例和二次开发的母版,给小企业带来了几乎免费的数据分析和可视化的能力。由衷的感谢这些令人兴奋的项目,感谢为开源奉献的人们。

由于本人没有全部体验和深入调研上述项目,上述简介仅供参考,以官方为准。

感谢    赞同    分享    收藏    关注    反对    举报    ...