是选impala还是presto_Impala？难道 Presto 不香吗？

最新推荐文章于 2025-06-05 12:09:19 发布

原创

最新推荐文章于 2025-06-05 12:09:19 发布 · 926 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#是选impala还是presto

本文对比了Presto和Impala这两个即席查询引擎，介绍了Presto作为Java开发的查询引擎，具备更好的社区资源和多数据源支持，以及其SQL支持、扩展性和高性能特性。详细探讨了Presto的基本概念，包括服务进程、查询执行模型和整体架构，展示了其在大数据实时查询计算领域的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

导读(老蒙)：

Presto 是当下比较流行的即席查询引擎，相比另一个相似的引擎 Impala ，Presto 是 Java 开发的，拥有更好的社区资源(毕竟做大数据的都喜欢用 Java)。这篇文章比较基础，对 Presto 做了一个基本的讲解，包括各个进程的作用，编程模型，整体架构等等内容，是入门理解 Presto 的一篇好文章。

Presto是专为大数据实时查询计算而设计开发的产品，拥有如下特点：

多数据源：通过自定义Connector能支持Mysql，Hive，Kafka等多种数据源

支持SQL：完全支持ANSI SQL

扩展性：支持自定义开发Connector和UDF

混合计算：可以根据需要将开源于不同数据源的多个Catalog进行混合join计算

高性能：10倍于Hive的查询性能

流水线：基于Pipeline涉及，在数据处理过程当中不用等到所有数据都处理完成后再查看结果

1. 基本概念

1.1. 服务进程

Coordinator

主要作用：接受查询请求、解析查询语句、生成查询执行计划、任务调度、Worker管理

部署于服务器的一个单独节点上，是整个集群的Master节点

与Worker通信获得最新的状态信息，同时接受Client的查询请求

所有信息交互通过StatmentResource类提供的RESTful接口完成

Worker

工作节点，完成数据的处理和Task的执行

定时向Coordinator上报心跳

1.2. Presto模型

Connector

连接器，可以理解为Presto访问不同数据源的驱动程序；每个Connector都实现了Presto的标准SPI接口，因此只要自己实现SPI接口，就可以实现适合自己需求的Connector。Presto Con

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。