MongoDB 概念解析

2022-09-08 17:38 更新

不管我們學習什么數(shù)據(jù)庫都應(yīng)該學習其中的基礎(chǔ)概念,在mongodb中基本的概念是文檔、集合、數(shù)據(jù)庫,下面我們挨個介紹。

下表將幫助您更容易理解Mongo中的一些概念:

SQL術(shù)語/概念 MongoDB術(shù)語/概念 解釋/說明
database database 數(shù)據(jù)庫
table collection 數(shù)據(jù)庫表/集合
row document 數(shù)據(jù)記錄行/文檔
column field 數(shù)據(jù)字段/域
index index 索引
table joins   表連接,MongoDB不支持
primary key primary key 主鍵,MongoDB自動將_id字段設(shè)置為主鍵

通過下圖實例,我們也可以更直觀的的了解Mongo中的一些概念:


數(shù)據(jù)庫(DATABASE)

一個mongodb中可以建立多個數(shù)據(jù)庫。

MongoDB的默認數(shù)據(jù)庫為"db",該數(shù)據(jù)庫存儲在data目錄中。

MongoDB的單個實例可以容納多個獨立的數(shù)據(jù)庫,每一個都有自己的集合和權(quán)限,不同的數(shù)據(jù)庫也放置在不同的文件中。

"show dbs" 命令可以顯示所有數(shù)據(jù)的列表。

$ ./mongo
MongoDB shell version: 3.0.6
connecting to: test
> show dbs
local  0.078GB
test   0.078GB
> 

執(zhí)行 "db" 命令可以顯示當前數(shù)據(jù)庫對象或集合。

$ ./mongo
MongoDB shell version: 3.0.6
connecting to: test
> db
test
> 

運行"use"命令,可以連接到一個指定的數(shù)據(jù)庫。

> use local
switched to db local
> db
local
> 

以上實例命令中,"local" 是你要鏈接的數(shù)據(jù)庫。

數(shù)據(jù)庫也通過名字來標識。數(shù)據(jù)庫名可以是滿足以下條件的任意UTF-8字符串。

  • 不能是空字符串("")。
  • 不得含有' '(空格)、.、$、/、\和\0 (空宇符)。
  • 應(yīng)全部小寫。
  • 最多64字節(jié)。

有一些數(shù)據(jù)庫名是保留的,可以直接訪問這些有特殊作用的數(shù)據(jù)庫。

  • admin: 從權(quán)限的角度來看,這是"root"數(shù)據(jù)庫。要是將一個用戶添加到這個數(shù)據(jù)庫,這個用戶自動繼承所有數(shù)據(jù)庫的權(quán)限。一些特定的服務(wù)器端命令也只能從這個數(shù)據(jù)庫運行,比如列出所有的數(shù)據(jù)庫或者關(guān)閉服務(wù)器。
  • local: 這個數(shù)據(jù)永遠不會被復制,可以用來存儲限于本地單臺服務(wù)器的任意集合
  • config: 當Mongo用于分片設(shè)置時,config數(shù)據(jù)庫在內(nèi)部使用,用于保存分片的相關(guān)信息。

文檔(Document)

文檔是一個鍵值(key-value)對(即BSON)。MongoDB 的文檔不需要設(shè)置相同的字段,并且相同的字段不需要相同的數(shù)據(jù)類型,這與關(guān)系型數(shù)據(jù)庫有很大的區(qū)別,也是 MongoDB 非常突出的特點。

一個簡單的文檔例子如下:

{"site":"hgci.cn", "name":"W3Cschool教程"}

下表列出了 RDBMS 與 MongoDB 對應(yīng)的術(shù)語:

RDBMS MongoDB
數(shù)據(jù)庫 數(shù)據(jù)庫
表格 集合
文檔
字段
表聯(lián)合 嵌入文檔
主鍵 主鍵 (MongoDB 提供了 key 為 _id )
數(shù)據(jù)庫服務(wù)和客戶端
Mysqld/Oracle mongod
mysql/sqlplus mongo

需要注意的是:

  1. 文檔中的鍵/值對是有序的。
  2. 文檔中的值不僅可以是在雙引號里面的字符串,還可以是其他幾種數(shù)據(jù)類型(甚至可以是整個嵌入的文檔)。
  3. MongoDB區(qū)分類型和大小寫。
  4. MongoDB的文檔不能有重復的鍵。
  5. 文檔的鍵是字符串。除了少數(shù)例外情況,鍵可以使用任意UTF-8字符。

文檔鍵命名規(guī)范:

  • 鍵不能含有\(zhòng)0 (空字符)。這個字符用來表示鍵的結(jié)尾。
  • .和$有特別的意義,只有在特定環(huán)境下才能使用。
  • 以下劃線"_"開頭的鍵是保留的(不是嚴格要求的)。

集合

集合就是 MongoDB 文檔組,類似于 RDBMS (關(guān)系數(shù)據(jù)庫管理系統(tǒng):Relational Database Management System)中的表格。

集合存在于數(shù)據(jù)庫中,集合沒有固定的結(jié)構(gòu),這意味著你在對集合可以插入不同格式和類型的數(shù)據(jù),但通常情況下我們插入集合的數(shù)據(jù)都會有一定的關(guān)聯(lián)性。

比如,我們可以將以下不同數(shù)據(jù)結(jié)構(gòu)的文檔插入到集合中:

{"site":"www.baidu.com"}
{"site":"www.google.com","name":"Google"}
{"site":"hgci.cn","name":"W3Cschool教程","num":5}

當?shù)谝粋€文檔插入時,集合就會被創(chuàng)建。


合法的集合名

  • 集合名不能是空字符串""。
  • 集合名不能含有\(zhòng)0字符(空字符),這個字符表示集合名的結(jié)尾。
  • 集合名不能以"system."開頭,這是為系統(tǒng)集合保留的前綴。
  • 用戶創(chuàng)建的集合名字不能含有保留字符。有些驅(qū)動程序的確支持在集合名里面包含,這是因為某些系統(tǒng)生成的集合中包含該字符。除非你要訪問這種系統(tǒng)創(chuàng)建的集合,否則千萬不要在名字里出現(xiàn)$?!?/li>

如下實例:

db.col.findOne()

capped collections

Capped collections 就是固定大小的collection。

它有很高的性能以及隊列過期的特性(過期按照插入的順序). 有點和 "RRD" 概念類似。

Capped collections是高性能自動的維護對象的插入順序。它非常適合類似記錄日志的功能 和標準的collection不同,你必須要顯式的創(chuàng)建一個capped collection, 指定一個collection的大小,單位是字節(jié)。collection的數(shù)據(jù)存儲空間值提前分配的。

Capped collections 可以按照文檔的插入順序保存到集合中,而且這些文檔在磁盤上存放位置也是按照插入順序來保存的,所以當我們更新Capped collections 中文檔的時候,更新后的文檔不可以超過之前文檔的大小,這樣話就可以確保所有文檔在磁盤上的位置一直保持不變。

由于 Capped collection 是按照文檔的插入順序而不是使用索引確定插入位置,這樣的話可以提高增添數(shù)據(jù)的效率。MongoDB 的操作日志文件 oplog.rs 就是利用 Capped Collection 來實現(xiàn)的。

要注意的是指定的存儲大小包含了數(shù)據(jù)庫的頭信息。

db.createCollection("mycoll", {capped:true, size:100000})
  • 在capped collection中,你能添加新的對象。
  • 能進行更新,然而,對象不會增加存儲空間。如果增加,更新就會失敗 。
  • 數(shù)據(jù)庫不允許進行刪除。使用?drop()?方法刪除collection所有的行。
  • 注意: 刪除之后,你必須顯式的重新創(chuàng)建這個collection。
  • 在32bit機器中,capped collection最大存儲為1e9( 1X109)個字節(jié)。

元數(shù)據(jù)

數(shù)據(jù)庫的信息是存儲在集合中。它們使用了系統(tǒng)的命名空間:

dbname.system.*

在MongoDB數(shù)據(jù)庫中名字空間 ?<dbname>.system.* ?是包含多種系統(tǒng)信息的特殊集合(Collection),如下:

集合命名空間 描述
dbname.system.namespaces 列出所有名字空間。
dbname.system.indexes 列出所有索引。
dbname.system.profile 包含數(shù)據(jù)庫概要(profile)信息。
dbname.system.users 列出所有可訪問數(shù)據(jù)庫的用戶。
dbname.local.sources 包含復制對端(slave)的服務(wù)器信息和狀態(tài)。

對于修改系統(tǒng)集合中的對象有如下限制。

{{system.indexes}}插入數(shù)據(jù),可以創(chuàng)建索引。但除此之外該表信息是不可變的(特殊的?drop index?命令將自動更新相關(guān)信息)。

{{system.users}}是可修改的。 {{system.profile}}是可刪除的。


MongoDB 數(shù)據(jù)類型

下表為MongoDB中常用的幾種數(shù)據(jù)類型。

數(shù)據(jù)類型 描述
String 字符串。存儲數(shù)據(jù)常用的數(shù)據(jù)類型。在 MongoDB 中,UTF-8 編碼的字符串才是合法的。
Integer 整型數(shù)值。用于存儲數(shù)值。根據(jù)你所采用的服務(wù)器,可分為 32 位或 64 位。
Boolean 布爾值。用于存儲布爾值(真/假)。
Double 雙精度浮點值。用于存儲浮點值。
Min/Max keys 將一個值與 BSON(二進制的 JSON)元素的最低值和最高值相對比。
Arrays 用于將數(shù)組或列表或多個值存儲為一個鍵。
Timestamp 時間戳。記錄文檔修改或添加的具體時間。
Object 用于內(nèi)嵌文檔。
Null 用于創(chuàng)建空值。
Symbol 符號。該數(shù)據(jù)類型基本上等同于字符串類型,但不同的是,它一般用于采用特殊符號類型的語言。
Date 日期時間。用 UNIX 時間格式來存儲當前日期或時間。你可以指定自己的日期時間:創(chuàng)建 Date 對象,傳入年月日信息。
Object ID 對象 ID。用于創(chuàng)建文檔的 ID。
Binary Data 二進制數(shù)據(jù)。用于存儲二進制數(shù)據(jù)。
Code 代碼類型。用于在文檔中存儲 JavaScript 代碼。
Regular expression 正則表達式類型。用于存儲正則表達式。


以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號