【SparkSQL笔记】SparkSQL的Dataset操作大全(二)(spark中dataset用法)
1564
2022-05-29
GaussDB 200是一个基于开源数据库Postgres-XC开发的分布式并行关系型数据库系统。
GaussDB 200采用Share-nothing架构,由多个拥有独立且互不共享CPU、内存、存储等系统资源的节点组成。在这样的系统架构中,业务数据被分散存储在多个物理节点上,数据分析任务被推送到数据所在位置就近执行,通过控制模块的协调,并行地完成大规模的数据处理工作,实现对数据处理的快速响应。
Share-nothing又称为无共享架构,和其他架构的对比请参见下图
Share-nothing架构具备如下优点:
最易于扩展的架构
为商业智能BI(Business Intelligence)和数据分析的高并发、大数据量计算提供按需扩展的能力
自动化的并行处理机制
内部自动并行处理,无需人工分区或优化
数据加载与访问方式与一般数据库相同
数据分布在所有的并行节点上
每个节点只处理其中一部分数据
最优化的I/O处理
所有的节点同时进行并行处理
节点之间完全无共享,无I/O冲突
增加节点实现存储、查询及加载性能的线性扩展
GaussDB 200由多个MPPDBServer组成,结构具体如下图所示。
云数据库 GaussDB(for Cassandra)
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。