Python调用MongoDB使用心得

本文是一个Python 使用MongoDB的简单教程,将使用pymongo对MongoDB进行的各种操作进行了简单的汇总,NoSQLFan进行了简单整理,使用Python的同学可以看一看。

下载相应平台的版本,解压即可。为方便使用,将bin路径添加到系统path环境变量里。其中mongod是服务器,mongo是客户shell,然后创建数据文件目录:在c盘下创建data文件夹,里面创建db文件夹。

基本使用:

安装对应语言的Driver,Python 安装 pymongo

$ easy_install pymongo

使用方法总结,摘自官方教程

创建连接

>>> import pymongo
>>> connection=pymongo.Connection("localhost",27017)

切换数据库

>>> db = connection.test_database

获取collection

>>> collection = db.test_collection

db和collection都是延时创建的,在添加Document时才真正创建

文档添加,_id自动创建

>>> import datetime
>>> post = {"author": "Mike",
... "text": "My first blog post!",
... "tags": ["mongodb", "python", "pymongo"],
... "date": datetime.datetime.utcnow()}
>>> posts = db.posts
>>> posts.insert(post)
ObjectId("...")

批量插入

>>> new_posts = [{"author": "Mike",
... "text": "Another post!",
... "tags": ["bulk", "insert"],
... "date": datetime.datetime(2009, 11, 12, 11, 14)},
... {"author": "Eliot",
... "title": "MongoDB is online casino  fun",
... "text": "and pretty easy too!",
... "date": datetime.datetime(2009, 11, 10, 10, 45)}]
>>> posts.insert(new_posts)
[ObjectId("..."), ObjectId("...")]

获取所有collection(相当于SQL的show tables)

>>> db.collection_names()
[u"posts", u"system.indexes"]

获取单个文档

>>> posts.find_one()
{u"date": datetime.datetime(...), u"text": u"My first blog post!", u"_id": ObjectId("..."), u"author": u"Mike", u"tags": [u"mongodb", u"python", u"pymongo"]}

查询多个文档

>> for post in posts.find():
... post
...
{u"date": datetime.datetime(...), u"text": u"My first blog post!", u"_id": ObjectId("..."), u"author": u"Mike", u"tags": [u"mongodb", u"python", u"pymongo"]}
{u"date": datetime.datetime(2009, 11, 12, 11, 14), u"text": u"Another post!", u"_id": ObjectId("..."), u"author": u"Mike", u"tags": [u"bulk", u"insert"]}
{u"date": datetime.datetime(2009, 11, 10, 10, 45), u"text": u"and pretty easy too!", u"_id": ObjectId("..."), u"author": u"Eliot", u"title": u"MongoDB is fun"}

加条件的查询

>>> posts.find_one({"author": "Mike"})

高级查询

>>> posts.find({"date": {"$lt": d}}).sort("author")

统计数量

>>> posts.count()
3

加索引

>>> from pymongo import ASCENDING, DESCENDING
>>> posts.create_index([("date", DESCENDING), ("author", ASCENDING)])
u"date_-1_author_1"

查看查询语句的性能

>>> posts.find({"date": {"$lt": d}}).sort("author").explain()["cursor"]
u"BtreeCursor date_-1_author_1"
>>> posts.find({"date": {"$lt": d}}).sort("author").explain()["nscanned"]
2

附自己总结的一点小心得,仅供参考

缺点

  • 不是全盘取代传统数据库(NoSQLFan:是否能取代需要看应用场景)
  • 不支持复杂事务(NoSQLFan:MongoDB只支持对单个文档的原子操作)
  • 文档中的整个树,不易搜索,4MB限制?(NoSQLFan:1.8版本已经修改为16M)

特点(NoSQLFan:作者在这里列举的很多只是一些表层的特点):

  • 文档型数据库,表结构可以内嵌
  • 没有模式,避免空字段开销(Schema Free)
  • 分布式支持
  • 查询支持正则
  • 动态扩展架构
  • 32位的版本最多只能存储2.5GB的数据(NoSQLFan:最大文件尺寸为2G,生产环境推荐64位)

名词对应

  • 一个数据项叫做 Document(NoSQLFan:对应MySQL中的单条记录)
  • 一个文档嵌入另一个文档(comment 嵌入 post)叫做 Embed
  • 储存一系列文档的地方叫做 Collections(NoSQLFan:对应MySQL中的表)
  • 表间关联,叫做 Reference

来源链接已经404了~暂无法附来源。

anyShare赠人玫瑰,手有余香,分享知识,德艺双馨!
          

无觅相关文章插件,快速提升流量

  1. 获取collection
    >>> collection = db.test_collection
    ————
    typo?
    >>> collection = db.collection

  2. 的确非常基础,不过,俺必须补充的一点是
    使用MongoDB 在Py 中,进行文件的操作也非常简单,而且是直接丢到 GridFS 进行分布的,,无比爽!
    如果配合 Nginx 模块来直接从 Mongo 中发布的话,节省N多SA 事务…