Ceph集群部署-伙伴云

Ceph集群部署

网友投稿 917 2022-05-28

一概述

1.1 背景

近期进行公司业务容器化改造，在为kubernetes提供存储选型方面，在选型中本地存储不可跨node，NFS共享存储不好做高可用，因此选型Ceph来为k8s提供存储类。特此笔记以备后用。

1.2 概述

Ceph是一种为优秀的性能、可靠性和可扩展性而设计的统一的、分布式文件系统。Ceph是一个开源的分布式文件系统。因为它还支持块存储、对象存储，所以很自然的被用做云计算框架openstack或cloudstack整个存储后端。当然也可以单独作为存储，例如部署一套集群作为对象存储、SAN存储、NAS存储等。可以作为k8s的存储类，来方便容器持久化存储。

1.3 支持格式

对象存储：即radosgw,兼容S3接口。通过rest api上传、下载文件。

文件系统：posix接口。可以将ceph集群看做一个共享文件系统挂载到本地。

块存储：即rbd。有kernel rbd和librbd两种使用方式。支持快照、克隆。相当于一块硬盘挂到本地，用法和用途和硬盘一样。比如在OpenStack项目里，Ceph的块设备存储可以对接OpenStack的后端存储

1.4 优势

统一存储：虽然ceph底层是一个分布式文件系统，但由于在上层开发了支持对象和块的接口

高扩展性：扩容方便、容量大。能够管理上千台服务器、EB级的容量。

高可靠性：支持多份强一致性副本，EC。副本能够垮主机、机架、机房、数据中心存放。所以安全可靠。存储节点可以自管理、自动修复。无单点故障，容错性强。

高性能：因为是多个副本，因此在读写操作时候能够做到高度并行化。理论上，节点越多，整个集群的IOPS和吞吐量越高。另外一点ceph客户端读写数据直接与存储设备(osd) 交互。

1.5 核心组件

Ceph OSDs:Ceph OSD 守护进程（ Ceph OSD ）的功能是存储数据，处理数据的复制、恢复、回填、再均衡，并通过检查其他OSD 守护进程的心跳来向 Ceph Monitors 提供一些监控信息。当 Ceph 存储集群设定为有2个副本时，至少需要2个 OSD 守护进程，集群才能达到 active+clean 状态（ Ceph 默认有3个副本，但你可以调整副本数）。

Monitors: Ceph Monitor维护着展示集群状态的各种图表，包括监视器图、 OSD 图、归置组（ PG ）图、和 CRUSH 图。 Ceph 保存着发生在Monitors 、 OSD 和 PG上的每一次状态变更的历史信息（称为 epoch ）。

MDSs: Ceph 元数据服务器（ MDS ）为 Ceph 文件系统存储元数据（也就是说，Ceph 块设备和 Ceph 对象存储不使用MDS ）。元数据服务器使得 POSIX 文件系统的用户们，可以在不对 Ceph 存储集群造成负担的前提下，执行诸如 ls、find 等基本命令。

二安装部署

2.1 主机信息

2.2 磁盘准备

需要在三台主机创建磁盘,并挂载到主机的/var/local/osd{0,1,2}

[root@master ~]# mkfs.xfs /dev/vdc [root@master ~]# mkdir -p /var/local/osd0 [root@master ~]# mount /dev/vdc /var/local/osd0/ [root@node01 ~]# mkfs.xfs /dev/vdc [root@node01 ~]# mkdir -p /var/local/osd1 [root@node01 ~]# mount /dev/vdc /var/local/osd1/ [root@node02 ~]# mkfs.xfs /dev/vdc [root@node02 ~]# mkdir -p /var/local/osd2 [root@node02 ~]# mount /dev/vdc /var/local/osd2/ 将磁盘添加进入fstab中，确保开机自动挂载复制代码

2.3 配置各主机hosts文件

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 ::1 localhost localhost.localdomain localhost6 localhost6.localdomain6 172.16.60.2 master 172.16.60.3 node01 172.16.60.4 node02 复制代码

2.4 管理节点ssh免密钥登录node1/node2

[root@master ~]# ssh-keygen -t rsa [root@master ~]# ssh-copy-id -i /root/.ssh/id_rsa.pub root@node01 [root@master ~]# ssh-copy-id -i /root/.ssh/id_rsa.pub root@node02 复制代码

2.5 master节点安装ceph-deploy工具

# 各节点均更新ceph的yum源 vim /etc/yum.repos.d/ceph.repo [ceph] name=ceph baseurl=http://mirrors.aliyun.com/ceph/rpm-jewel/el7/x86_64/ gpgcheck=0 priority =1 [ceph-noarch] name=cephnoarch baseurl=http://mirrors.aliyun.com/ceph/rpm-jewel/el7/noarch/ gpgcheck=0 priority =1 [ceph-source] name=Ceph source packages baseurl=http://mirrors.aliyun.com/ceph/rpm-jewel/el7/SRPMS gpgcheck=0 priority=1 # 安装ceph-deploy工具 yum clean all && yum makecache yum -y install ceph-deploy 复制代码

2.6 创建monitor服务

创建monitor服务,指定master节点的hostname

[root@master ~]# mkdir /etc/ceph && cd /etc/ceph [root@master ceph]# ceph-deploy new master [root@master ceph]# ll total 12 -rw-r--r-- 1 root root 195 Sep 3 10:56 ceph.conf -rw-r--r-- 1 root root 2915 Sep 3 10:56 ceph-deploy-ceph.log -rw------- 1 root root 73 Sep 3 10:56 ceph.mon.keyring [root@master ceph]# cat ceph.conf [global] fsid = 5b9eb8d2-1c12-4f6d-ae9c-85078795794b mon_initial_members = master mon_host = 172.16.60.2 auth_cluster_required = cephx auth_service_required = cephx auth_client_required = cephx osd_pool_default_size = 2 配置文件的默认副本数从3改成2，这样只有两个osd也能达到active+clean状态，把下面这行加入到[global]段（可选配置）复制代码

2.7 所有节点安装ceph

# 各节点安装软件包 yum -y install yum-plugin-priorities epel-release # master节点利用ceph-deply 部署ceph [root@master ceph]# ceph-deploy install master node01 node02 [root@master ceph]# ceph --version ceph version 10.2.11 (e4b061b47f07f583c92a050d9e84b1813a35671e) 复制代码

2.8 部署相关服务

# 安装ceph monitor [root@master ceph]# ceph-deploy mon create master # 收集节点的keyring文件 [root@master ceph]# ceph-deploy gatherkeys master # 创建osd [root@master ceph]# ceph-deploy osd prepare master:/var/local/osd0 node01:/var/local/osd1 node02:/var/local/osd2 # 权限修改 [root@master ceph]# chmod 777 -R /var/local/osd{0..2} [root@master ceph]# chmod 777 -R /var/local/osd{0..2}/* # 激活osd [root@master ceph]# ceph-deploy osd activate master:/var/local/osd0 node01:/var/local/osd1 node02:/var/local/osd2 # 查看状态 [root@master ceph]# ceph-deploy osd list master node01 node02 复制代码

2.9 统一配置

用ceph-deploy把配置文件和admin密钥拷贝到所有节点，这样每次执行Ceph命令行时就无需指定monitor地址和ceph.client.admin.keyring了

[root@master ceph]# ceph-deploy admin master node01 node02 # 各节点修改ceph.client.admin.keyring权限： [root@master ceph]# chmod +r /etc/ceph/ceph.client.admin.keyring # 查看状态 [root@master ceph]# ceph health HEALTH_OK [root@master ceph]# ceph -s cluster 5b9eb8d2-1c12-4f6d-ae9c-85078795794b health HEALTH_OK monmap e1: 1 mons at {master=172.16.60.2:6789/0} election epoch 3, quorum 0 master osdmap e15: 3 osds: 3 up, 3 in flags sortbitwise,require_jewel_osds pgmap v27: 64 pgs, 1 pools, 0 bytes data, 0 objects 15681 MB used, 1483 GB / 1499 GB avail 64 active+clean 复制代码

2.10 部署MDS服务

Ceph集群部署

我们在node01/node02上安装部署MDS服务

[root@master ceph]# ceph-deploy mds create node01 node02 # 查看状态 [root@master ceph]# ceph mds stat e3:, 2 up:standby [root@master ~]# ceph mon stat e1: 1 mons at {master=172.16.60.2:6789/0}, election epoch 4, quorum 0 master # 查看服务 [root@master ceph]# systemctl list-unit-files |grep ceph ceph-create-keys@.service static ceph-disk@.service static ceph-mds@.service disabled ceph-mon@.service enabled ceph-osd@.service enabled ceph-radosgw@.service disabled ceph-mds.target enabled ceph-mon.target enabled ceph-osd.target enabled ceph-radosgw.target enabled ceph.target enabled 复制代码

至此，基本上完成了ceph存储集群的搭建。

三创建ceph文件系统

3.1 创建文件系统

关于创建存储池确定 pg_num 取值是强制性的，因为不能自动计算。下面是几个常用的值：

少于 5 个 OSD 时可把 pg_num 设置为 128

OSD 数量在 5 到 10 个时，可把 pg_num 设置为 512

OSD 数量在 10 到 50 个时，可把 pg_num 设置为 4096

OSD 数量大于 50 时，你得理解权衡方法、以及如何自己计算 pg_num 取值

自己计算 pg_num 取值时可借助 pgcalc 工具随着 OSD 数量的增加，正确的 pg_num 取值变得更加重要，因为它显著地影响着集群的行为、以及出错时的数据持久性（即灾难性事件导致数据丢失的概率）。

[root@master ceph]# ceph osd pool create cephfs_data [root@master ceph]# ceph osd pool create cephfs_metadata [root@master ~]# ceph osd pool ls rbd [root@master ~]# ceph osd pool create kube 128 pool 'kube' created [root@master ~]# ceph osd pool ls rbd kube # 查看证书 [root@master ~]# ceph auth list installed auth entries: mds.node01 key: AQB56m1dE42rOBAA0yRhsmQb3QMEaTsQ71jHdg== caps: [mds] allow caps: [mon] allow profile mds caps: [osd] allow rwx mds.node02 key: AQB66m1dWuhWKhAAtbiZN7amGcjUh6Rj/HNFkg== caps: [mds] allow caps: [mon] allow profile mds caps: [osd] allow rwx osd.0 key: AQA46W1daFx3IxAAE1esQW+t1fWJDfEQd+167w== caps: [mon] allow profile osd caps: [osd] allow * osd.1 key: AQBA6W1daJG9IxAAQwETgrVc3awkEZejDSaaow== caps: [mon] allow profile osd caps: [osd] allow * osd.2 key: AQBI6W1dot4/GxAAle3Ii3/D38RmwNC4yTCoPg== caps: [mon] allow profile osd caps: [osd] allow * client.admin key: AQBu4W1d90dZKxAAH/kta03cP5znnCcWeOngzQ== caps: [mds] allow * caps: [mon] allow * caps: [osd] allow * client.bootstrap-mds key: AQBv4W1djJ1uHhAACzBcXjVoZFgLg3lN+KEv8Q== caps: [mon] allow profile bootstrap-mds client.bootstrap-mgr key: AQCS4W1dna9COBAAiWPu7uk3ItJxisVIwn2duA== caps: [mon] allow profile bootstrap-mgr client.bootstrap-osd key: AQBu4W1dxappOhAA5FanGhQhAOUlizqa5uMG3A== caps: [mon] allow profile bootstrap-osd client.bootstrap-rgw key: AQBv4W1dpwvsDhAAyp58v08XttJWzLoHWVHZow== caps: [mon] allow profile bootstrap-rgw 复制代码

3.2 创建客户端密钥

# 创建keyring [root@master ~]# ceph auth get-or-create client.kube mon 'allow r' osd 'allow rwx pool=kube' -o /etc/ceph/ceph.client.kube.keyring [root@master ~]# ceph auth list # 将密钥拷贝到node1和node2 [root@master ceph]# scp ceph.client.kube.keyring root@node01:/etc/ceph/ 复制代码

四卸载

清理机器上的ceph相关配置：停止所有进程： stop ceph-all 卸载所有ceph程序：ceph-deploy uninstall [{ceph-node}] 删除ceph相关的安装包：ceph-deploy purge {ceph-node} [{ceph-data}] 删除ceph相关的配置：ceph-deploy purgedata {ceph-node} [{ceph-data}] 删除key：ceph-deploy forgetkeys 卸载ceph-deploy管理：yum -y remove ceph-deploy 复制代码

参考链接

ceph官方文档

ceph中文开源社区

CentOS 7部署 Ceph分布式存储架构

存储

【云小课】应用平台第8课版本管理发展史之Git+——代码托管（云平台课堂）

917 2022-05-28

Ceph集群部署

【云小课】应用平台第8课版本管理发展史之Git+——代码托管（云平台课堂）

机器人操作系统ROS 1.0 和 2.0 发展规划2018-2025（Open Robotics）译

分布式文件系统如何做？终于有篇文章分布式文件上传讲清楚了

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

智能定制家居管理系统：重新定义家庭生活方式

家居定制平台是什么？

友情链接

Ceph集群部署

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接