百度开源OLAP引擎Palo,高可用的MPP数据仓库_最新动态_新闻资讯_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 新闻资讯 > 最新动态 > 百度开源OLAP引擎Palo,高可用的MPP数据仓库

百度开源OLAP引擎Palo,高可用的MPP数据仓库

 2017/8/12 18:31:22    程序员俱乐部  我要评论(0)
  • 摘要:百度昨日正式开源Palo,这是一个百度自研的基于MPP的交互式SQL数据仓库,主要用于解决报表和多维分析。Palo主要集成了GoogleMesa和ClouderaImpala技术。和其他流行的SQL-on-Hadoop系统不同的是,Palo设计为单一紧密耦合系统,不依赖其他系统。Palo不仅提供高并发低延迟的查询性能,而且提供了高吞吐量的ad-hoc分析查询。它还提供批量数据加载,以及近乎实时的小批量数据加载。Palo具有高可用性、可靠性、容错性和可扩展性,其主要特点是简单(开发、部署和使用
  • 标签:百度 数据 开源 数据仓库
class="topic_img" alt=""/>

  百度昨日正式开源 Palo ,这是一个百度自研的基于 MPP 的交互式 SQL cangku.html" target="_blank">数据仓库,主要用于解决报表和多维分析。

  Palo 主要集成了 Google Mesa 和 Cloudera Impala 技术。和其他流行的 SQL-on-Hadoop 系统不同的是,Palo 设计为单一紧密耦合系统,不依赖其他系统。

  Palo 不仅提供高并发低延迟的查询性能,而且提供了高吞吐量的 ad-hoc 分析查询。它还提供批量数据加载,以及近乎实时的小批量数据加载。

  Palo 具有高可用性、可靠性、容错性和可扩展性,其主要特点是简单(开发、部署和使用)和满足单一系统中的许多数据服务需求。

  Palo 的实现包括两个守护进程:前端(FE)和后端(BE)。下图给出了架构和用法的概述:

  Palo 的名字正好是 OLAP 倒过来写,意思是“玩转 OLAP ”,目前在百度内部有着广泛应用,如百度凤巢、百度统计、百度糯米等。

发表评论
用户名: 匿名