Apache CarbonData 2.0 开发实用系列之三：与Presto SQL集成使用-伙伴云

Apache Carbon Data 2.0 开发实用系列之三：与Presto SQL集成使用

网友投稿 786 2022-05-30

【内容提要】

本文介绍如何使用presto sql查询在spark中已生成的carbondata表

【创建carbondata表】

使用Spark SQL创建carbondata表并入库数据

请参考[Apache CarbonData 2.0 开发实用系列之一：与Spark SQL集成使用](https://bbs.huaweicloud.com/blogs/169357)

【准备Hadoop】

请参考[Apache CarbonData 2.0 开发实用系列之二：与Hive集成使用](https://bbs.huaweicloud.com/blogs/170472)

【准备hive metastore】

Apache CarbonData 2.0 开发实用系列之三：与Presto SQL集成使用

1. 下载hive 1.2.2并解压

https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-1.2.2/apache-hive-1.2.2-bin.tar.gz

2. 升级derby

拷贝SPARK_HOME/jars/derby-10.12.1.1.jar覆盖derby-10.10.2.0.jar

3. 修改配置

hive-site.xml

4. 启动metastore

export HADOOP_HOME=/opt/bigdata/hadoop-2.7.7 ./hive --service metastore

【准备carbon依赖包】

git clone https://github.com/apache/carbondata.git cd carbondata mvn -DskipTests -Pspark-2.4 -Pprestosql clean package

【准备presto】

1. 下载presto-server-316.tar.gz

下载页面：https://repo1.maven.org/maven2/io/prestosql/presto-server/316/

2. 配置presto

参考文档：https://github.com/apache/carbondata/blob/master/docs/prestosql-guide.md#presto-single-node-setup-for-carbondata

或者解压附件etc.zip后，拷贝到$PRESTO_HOME/etc

3. 部署carbondata

$PRESTO_HOME/plugin下创建carbondata目录，拷贝carbondata/integration/presto/target/carbondata-presto-x.x.x-SNAPSHOT下所有jars包至$PRESTO_HOME/plugin/carbondata

4 启动presto sql

bin/launcher start

5. 下载并启动presto CLI

链接地址：https://repo1.maven.org/maven2/io/prestosql/presto-cli/316/presto-cli-316-executable.jar

启动CLI

java -jar presto-cli-316-.jar --server localhost:8086 --catalog carbondata --schema carbondb

输入show tables后系统报错，

Query 20200831_084250_00002_9u6tk failed: com.google.common.util.concurrent.UncheckedExecutionException: java.lang.reflect.UndeclaredThrowableException

presto server日志信息如下：

Caused by: NoSuchObjectException(message:information_schema.tables table not found)

at org.apache.hadoop.hive.metastore.api.ThriftHiveMetastore$get_table_result$get_table_resultStandardScheme.read(ThriftHiveMetastore.java)

at org.apache.hadoop.hive.metastore.api.ThriftHiveMetastore$get_table_result.read(ThriftHiveMetastore.java)

at org.apache.thrift.TServiceClient.receiveBase(TServiceClient.java:86)

at org.apache.hadoop.hive.metastore.api.ThriftHiveMetastore$Client.recv_get_table(ThriftHiveMetastore.java:1993)

at org.apache.hadoop.hive.metastore.api.ThriftHiveMetastore$Client.get_table(ThriftHiveMetastore.java:1979)

... 74 more

未完待续, 修复后更新......

附件： etc.zip 1.65KB 下载次数：1次

EI企业智能智能数据表格存储服务 CloudTable

Apache CarbonData、Hudi及Open Delta的对比研究

786 2022-05-30

Apache Carbon Data 2.0 开发实用系列之三：与Presto SQL集成使用

Apache Flink 进阶（二）：时间属性深度解析（apache服务器）

Apache Flink On Yarn模式高可用(HA)集群部署

Apache CarbonData、Hudi及Open Delta的对比研究

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

简单进销存库存管理盘点

友情链接