Google的三篇大数据思想论文

网友投稿 732 2025-04-05

大数据

1、什么是大数据

简单说就是身边的一切，你看到的是，听到的是，闻到的感觉到的触摸到的都是

2、具体一点

天猫淘宝的购物数据，你的聊天记录，医疗记录，看书或者挑东西时候的推荐物品

大数据的问题

1、生活中的种种数据数量如此之多，如何存储

2、要让数据有意义，又该怎么去处理海量的数据

Google对大数据问题的思想

1、GFS：Google File System

对数据进行分布式文件系统的存储，解决的大数据的存储问题

2、MapReduce

最初是因为Google要去爬取全球的网页然后对其进行排名(PageRank)而衍生出的问题，一种用于大数据计算的模型，核心思想是大事化小处理，最后在合并结果，先拆分再合并

3、BigTable

采用NoSQL数据库将数据存在一张大表之中，通过牺牲存储的空间来换取性能

实现思想 -> Hadoop

主要结构

1、HDFS：Hadoop Distributed File System

1. 采用主从式的结构

2. 主节点: NameNode名称节点

3. 从节点: DataNode数据节点

4. SecondaryNameNode: 第二名称节点

这里有两张网上的图可供参考

需要注意的是：NameNode 和 SecondaryNameNode 之间没有关系，前者管理和维护整个HDFS，后者用来日志的合并，两者在同一个节点上(同一个机器)，共同的组成了整个HDFS的主从式结构，硬盘需要两个(两台机器)所以HDFS环境至少需要三台机器

2、Yarn：MapReduce 的运行容器

Yarn 的结构，NodeMarager和DataNode在一个节点上，有一个DataNode就有一个NodeMarager

1. 主从式结构

2. 主节点: ResourceManager -> 资源管理器

3. 从节点: NodeManager -> 节点管理器

3、HBase: NoSQL数据库(需要单独安装)

Google的三篇大数据思想论文

1. 主从式结构

2. 主节点: HMaster

3. 从节点: RegionServer

---------------------

大数据

标签：分布式文件系统资源管理器大数据

大数据 服务上云的思考">大数据 服务上云的思考

732 2025-04-05

国美&华为，战略合作签约！

732 2025-04-05

面对 大数据Excel 如何做到数据的快速整理及Excel 的美化（面对大数据时代我们应该怎么做）">面对 大数据Excel 如何做到数据的快速整理及Excel 的美化（面对大数据时代我们应该怎么做）

732 2025-04-05

最近发表

宠物集市在深圳哪里有?时间地址最新消息
亚洲宠物展2025年展会介绍
京宠展信息指南
宠物展会2025年时间表
亚宠展、全球宠物产业风向标——亚洲宠物展览会深度解析
2025年亚洲宠物展览会、京宠展有哪些亮点
wps演示添加自定义按钮设置动作改变按顺序播放" href="https://www.huoban.com/news/post/118206.html">wps演示添加自定义按钮设置动作改变按顺序播放
WPS行中的文本调整到行中" href="https://www.huoban.com/news/post/119027.html">如何将WPS行中的文本调整到行中
系统字体问题（win10系统怎么设置密码）" href="https://www.huoban.com/news/post/62643.html">WIN10系统字体问题（win10系统怎么设置密码）
格式的应用（应用文标题的格式）" href="https://www.huoban.com/news/post/63002.html">标题格式的应用（应用文标题的格式）

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜
进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）
在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐
WPS2016怎么绘制简单的价格表?
进销存库存管理盘点">简单进销存库存管理盘点
定制订单管理系统（为特定需求定制的订单管理系统）

Google的三篇大数据思想论文

大数据 服务上云的思考">大数据 服务上云的思考

国美&华为，战略合作签约！

面对 大数据Excel 如何做到数据的快速整理及Excel 的美化（面对大数据时代我们应该怎么做）">面对 大数据Excel 如何做到数据的快速整理及Excel 的美化（面对大数据时代我们应该怎么做）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

进销存库存管理盘点">简单进销存库存管理盘点

定制订单管理系统（为特定需求定制的订单管理系统）

友情链接

Google的三篇大数据思想论文

微信扫一扫：分享

大数据服务上云的思考">大数据服务上云的思考

面对大数据Excel 如何做到数据的快速整理及Excel 的美化（面对大数据时代我们应该怎么做）">面对大数据Excel 如何做到数据的快速整理及Excel 的美化（面对大数据时代我们应该怎么做）

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

进销存库存管理盘点">简单进销存库存管理盘点

友情链接