MongoDB 第6章 MongoDB GridFS

网友投稿 611 2025-04-02

1、简介

GridFS是一种将大型文件存储在MongoDB数据库中的文件规范，所有官方支持的驱动均实现了GridFS规范。

1.1、为什么要用GirdFS

由于MongoDB中BSON对象大小是有限制的，所有GridFS规范提供了一种透明的机制，可以将一个大文件分割成为多个较小的文档，这样的机制允许我们有效的保存大文件对象，特别是对于那些巨大的文件，比如视频、高清图片等。

1.2、如何实现海量存储

为实现这点，该规范制定了一个将文件分块的标准，每个文件都将在文件集合对象中保存一个元数据对象，一个或者多个chunk块对象可以被组合保存在一个chunk块集合中，大多数情况下，你无需了解此规范中细节。而可将注意力放在各个语言版本的驱动中有关GridFS API的部分或是如何使用mongofiles工具上。

1.3、语言支持

GridFS对Java、Perl、PHP、Python、Ruby等程序语言均支持，且提供了良好的API接口。

1.4、简单介绍

GridFS使用两个表来存储数据：

files包含元数据对象

chunks包含其他一些相关信息的二进制块。

为了使多个GridFS命名为一个单一的数据库，文件和块都有一个前缀，默认情况下，前缀是fs，所以任何默认的GridFS存储将包括命名空间fs.files和fs.chunks。各种第三方语言的驱动有权限改变这个前缀，所以你可以尝试设置另一个GridFS命名空间用于存储照片，它的具体位置为：photos.files和photos.chunks，下面我们看一下实际例子。

1.5、命令行工具

mongofiles是从命令行操作GridFS的一种工具，比如我们/usr/local/xuz/test.html文件存到库里面，具体用法如下：

[root@localhost bin]# ./mongofiles put /usr/local/xuz/test.html

connected to: 127.0.0.1

added file: { _id: ObjectId('54a8d33846d47e7bbe9a847a'), filename: "/usr/local/xuz/test.html", chunkSize: 261120, uploadDate: new Date(1420350265089), md5: "aead353cb437d4d29d61f05bb548b191", length: 31 }

done!

下面我们查看一下库里有哪些GridFS文件，在mongofiles后加一个参数list即可。

[root@localhost bin]# ./mongofiles list

connected to: 127.0.0.1

/usr/local/xuz/test.html 31

接下来我们进库里看一下是否有新的东西

[root@localhost bin]# ./mongo

MongoDB shell version: 2.6.6

connecting to: test

> show collections

fs.chunks ----上文提到的fs.chunks

fs.files ----上文提到的fs.files

system.indexes

MongoDB 第6章 MongoDB GridFS

system.js

xuz

我们继续查看fs.files中的内容

> db.fs.files.find();

{ "_id" : ObjectId("54a8d33846d47e7bbe9a847a"), "filename" : "/usr/local/xuz/test.html", "chunkSize" : 261120, "uploadDate" : ISODate("2015-01-04T05:44:25.089Z"), "md5" : "aead353cb437d4d29d61f05bb548b191", "length" : 31 }

字段说明：

Filename:存储的文件名

chunkSize:chunks分块的大小

uploadDate:入库的时间

md5：此文件的md5码

length:文件大小，单位字节

看来fs.files中存储的是一些基础的元数据信息。

我们继续查看fs.chunks中的内容

> db.fs.chunks.find();

{ "_id" : ObjectId("54a8d339deaed25af579df57"), "files_id" : ObjectId("54a8d33846d47e7bbe9a847a"), "n" : 0, "data" : BinData(0,"c2RzZHNkCnNkc2RzZApzZHNkcwpzZHNkcwpzZHNkCg==") }

其中比较重要的字段是n,它代表的是chunks的序号，此序号从0开始，看来fs.chunks中存储的是一些实际的内容数据信息。

我们既然能将此文件存进去，我们就应该有办法将其取出来，下面我们将该文件取出来。

[root@localhost bin]# cd /usr/local/xuz

[root@localhost xuz]# ls -l

total 4

-rw-r--r--. 1 root root 31 Jan 4 13:43 test.html

[root@localhost xuz]# rm -rf test.html --删除文件

[root@localhost xuz]# ll

total 0

[root@localhost bin]# ./mongofiles get /usr/local/xuz/test.html

connected to: 127.0.0.1

done write to: /usr/local/xuz/test.html

[root@localhost bin]# md5sum /usr/local/xuz/test.html --检验md5，结果跟存进库里的相同

aead353cb437d4d29d61f05bb548b191 /usr/local/xuz/test.html

最后查看是否取出该文件。

[root@localhost bin]# cd /usr/local/xuz

[root@localhost xuz]# ll

total 4

-rw-r--r--. 1 root root 31 Jan 4 13:57 test.html --成功取出文件

1.6、索引

db.fs.chunks.ensureIndex({files_id:1,n:1}),{unique:true}

这样，一个块就可以利用它的files_id和n的值进行检索，注意，GridFS仍然可以用findOne得到第一个块，如下：

db.fs.chunks.findOne({files_id:myFileID,n:0})；

MongoDB

标签：MongoDB数据库简单介绍

RedHat6 使用CentOS yum源

611 2025-04-02

MongoDB数据库核心概念">MongoDB数据库核心概念

611 2025-04-02

[技术分享]【DLI跨源】当DLI遇见MongoDB

611 2025-04-02

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜
进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）
在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐
WPS2016怎么绘制简单的价格表?
电子表格，居家办公更轻松">用在线电子表格，居家办公更轻松
系统的功能有哪些？餐饮服务系统的构成及工作程序">连锁餐饮管理系统的功能有哪些？餐饮服务系统的构成及工

MongoDB 第6章 MongoDB GridFS

RedHat6 使用CentOS yum源

MongoDB数据库核心概念">MongoDB数据库核心概念

[技术分享]【DLI跨源】当DLI遇见MongoDB

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

电子表格，居家办公更轻松">用在线电子表格，居家办公更轻松

系统的功能有哪些？餐饮服务系统的构成及工作程序">连锁餐饮管理系统的功能有哪些？餐饮服务系统的构成及工

友情链接

MongoDB 第6章 MongoDB GridFS

微信扫一扫：分享

MongoDB数据库核心概念">MongoDB数据库核心概念

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

电子表格，居家办公更轻松">用在线电子表格，居家办公更轻松

系统的功能有哪些？餐饮服务系统的构成及工作程序">连锁餐饮管理系统的功能有哪些？餐饮服务系统的构成及工

友情链接