Jupyter调用Spark Sql指导-伙伴云

Jupyter调用Spark Sql指导

网友投稿 921 2022-05-30

1 环境准备

1.1 本文测试环境

MRS版本：2.1.0 (未开启kerberos)

Anaconda：4.4.0 (python 3.6)

ECS：EulerOS 2.5 64bit

1.2 安装Anaconda

1.2.1 下载anaconda

wget https://repo.continuum.io/archive/Anaconda3-4.4.0-Linux-x86_64.sh

1.2.2 安装anaconda

bash Anaconda3-4.4.0-Linux-x86_64.sh

安装过程中需要一直回车，并输入yes命令，然后指定安装路径（如：/opt/anaconda）。

在依赖包安装完成之后，选择yes进行初始化操作。该操作会在根目录下的配置文件/root/.bashrc中添加初始化配置。（为了不影响原环境，可以备份该文件，如：cp /root/.bashrc /root/.bashrc.anaconda ,并将原文件中新添加的初始化信息删掉）

生成配置文件和密码

source /root/.bashrc.anaconda

jupyter notebook --generate-config --allow-root

ipython #打开ipython

from notebook.auth import passwd

passwd() #生成密码

修改配置文件

修改上一步中生成的文件(/root/.jupyter/jupyter_notebook_config.py)，在文件末尾添加如下配置：

c.NotebookApp.ip = 'localhost' //此处localhost修改为该ECS节点IP

c.NotebookApp.allow_root = True

c.NotebookApp.open_browser =True

c.NotebookApp.port = 8888 //未被占用的端口

c.NotebookApp.password = u'sha1:...' //此处替换为上一步生成的密码

运行jupyter

source /opt/client/bigdata_env //MRS客户端安装路径

source /root/.bashrc.anaconda

export PYSPARK_DRIVER_PYTHON="ipython"

export PYSPARK_DRIVER_PYTHON_OPTS="notebook --allow-root"

pyspark --master yarn --deploy-mode client &

Jupyter调用Spark Sql指导

登陆web UI

在本地浏览器中输入 http://EIP:8888/ //EIP为该ECS节点绑定的弹性公网IP

1.3 安装MRS集群客户端

具体操作步骤请参见官方文档说明。https://support.huaweicloud.com/usermanual-mrs/mrs_01_0091.html

2 执行Spark SQL

2.1 在jupyter上执行spark sql

启动jupyter并进入web UI

新建notebook

编写执行语句

如查看数据库中的表：

from pyspark.sql import SparkSession

spark = SparkSession.builder.enableHiveSupport().getOrCreate()

arr = spark.sql("show tables").collect()

for x in arr:

print x

查看任务状况

在MRS Manager页面，服务管理—> YARN —> 服务状态中点击ResourceManager Web UI进入到yarn页面

也可以点击ApplicationMaster查看具体作业。

EI企业智能 MapReduce服务智能数据

我是WPS的超级会员，为什么PDF转换Word的时候会显示我不是WPS的会员？（wps中pdf转成word文档要会员吗）

921 2022-05-30

Jupyter调用Spark Sql指导

怎样关联电子邮件程序？（电子邮件程序有哪些）

我是WPS的超级会员，为什么PDF转换Word的时候会显示我不是WPS的会员？（wps中pdf转成word文档要会员吗）

网络正常，但是上不了账号（原来的网络账号连接不了）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

Excel项目进度表模板，简化您的项目进度管理

智能定制家居管理系统：重新定义家庭生活方式

友情链接

Jupyter调用Spark Sql指导

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接