揭秘hive常见面试题(一)-使用 Hive 进行手机流量统计-伙伴云

揭秘hive常见面试题(一)-使用 Hive 进行手机流量统计

网友投稿 694 2025-03-31

问题导读

1.hive 实现统计的查询语句是什么？

2.生产环境中为什么建议使用外部表？

3.hadoop mapreduce 创建类 DataWritable 的作用是什么？

4. 为什么创建类类 DataWritable ？

揭秘hive常见面试题(一)-使用 Hive 进行手机流量统计

5.如何实现统计手机流量？

对比 hive 与与 mapreduce 统计手机流量的区别？

很多公司在使用 hive 对数据进行处理。hive 是 hadoop 家族成员，是一种解析 like sql 语句的框架。它封装了常用 MapReduce 任务，让你像执行sql 一样操作存储在 HDFS 的表。

hive 的表分为两种，内表和外表。Hive 创建内部表时，会将数据移动到数据仓库指向的路径；若创建外部表，仅记录数据所在的路径，不对数据的位置做任何改变。在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据。这样外部表相对来说更加安全些，数据组织也更加灵活，方便共享源数据。

Hive 的内外表，还有一个 Partition 的分区的知识点，用于避免全表扫描，快速检索。后期的文章会提到。

原始数据

image.png

Hive

【云小课】EI第29课大数据时代的隐私利器-GaussDB(DWS)数据脱敏

694 2025-03-31

揭秘hive常见面试题(一)-使用 Hive 进行手机流量统计

大数据“复活”记

【云小课】EI第29课大数据时代的隐私利器-GaussDB(DWS)数据脱敏

Hive概述

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

定制家居数字化管理模式：提升品质、智能化和个性化的未

什么是在线文档？怎么发在线文档

友情链接

揭秘hive常见面试题(一)-使用 Hive 进行手机流量统计

微信扫一扫：分享

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

友情链接