400 028 6601

建站动态

根据您的个性需求进行定制 先人一步 抢占小程序红利时代

数据中台的存储系统和计算平台枚举

作者:向师富 转自:阿里巴巴数据中台官网 https://dp.alibaba.com 采集&传输层
离线计算:应用系统日志 -> flume -> kafka -> hdfs -> MR作业 实时计算:应用系统日志 -> flume -> kafka -> blink/jstorm/storm/spark streaming
存储层
计算层
1、离线计算
2、实时计算
在 Spark Streaming 中,处理数据的单位是一批而不是单条,而数据采集却是逐条进行的,因此 Spark Streaming 系统需要设置间隔使得数据汇总到一定的量后再一并操作,这个间隔就是批处理间隔。批处理间隔是 Spark Streaming 的核心概念和关键参数,它决定了 Spark Streaming 提交作业的频率和数据处理的延迟,同时也影响着数据处理的吞吐量和性能。
数据服务层
阿里巴巴数据中台团队,致力于输出阿里云数据智能的最佳实践,助力每个企业建设自己的数据中台,进而共同实现新时代下的智能商业! 阿里巴巴数据中台解决方案,核心产品: Dataphin,以阿里巴巴大数据核心方法论OneData为内核驱动,提供一站式数据构建与管理能力; Quick BI,集阿里巴巴数据分析经验沉淀,提供一站式数据分析与展现能力; Quick Audience,集阿里巴巴消费者洞察及营销经验,提供一站式人群圈选、洞察及营销投放能力,连接阿里巴巴商业,实现用户增长。


原文链接
本文为云栖社区原创内容,未经允许不得转载。

名称栏目:数据中台的存储系统和计算平台枚举
当前网址:http://www.bluegullmedia.com/article/jesjpc.html

其他资讯

让你的专属顾问为你服务

0.0443s