python+MongoDB使用示例

  本博客起源于博主的大三NoSQL课程设计,采用python+MongoDB结合方式,将数据从txt文件导入MongoDB之中,再将其取出以作图。主要技术是采用python与MongoDB结合存储读取方案,所以本博客截取了课设的部分内容,主要讲解python操作MongoDB方案实现,以给想要学习python+MongoDB编程开发的同学学习练手。

 

设计思路

1、Python编程语言和MongoDB有驱动包pymongo连接,使用pymongo对MongoDB进行编程开发、数据读取,以及后续的画图分析和数据可视化处理

2、使用的数据文件sample.txt.txt

 

设计内容

 1、先使用dataToMongo.py将文件清洗后导入MongoDB中。

   (1) 创建并连接到MongoDB 中的nosql数据库;

   (2) 创建并连接到nosql数据库的集合sample;

 2、对读出的数据进行可视化处理

   (1) 画图主要使用的Python包为matplotlib.plot

 

设计步骤及结果测试

1、先使用dataToMongo.py将文件清洗后导入MongoDB中。

  (1) 采用pymongo连接驱动

  (2) 采用pymongoMongoClient类连接mongod

  (3) python中使用的mongo常用语法与mongoJSON语法基本相同。

 

 MongoDB启动:

 

启动Python脚本dataToMongo.py将数据从文件中读出并存入MongoDB中:

  注意要使用以下命令 (由于前期使用python+Hadoop的方式编写,所以使用了unix输入输出流来读数据):

  # cat sample.txt.txt | ./dataToMongo.py

 数据成功存入MongoDB:

 

dataToMongo.py 

#!/usr/bin/python3
# -*- coding:utf-8 -*-
# 这个文件是用来将数据存入MongoDB中数据库nosql的
# collection为 sample (db.sample.find())
# 格式为:"line1": [data1,data2...]

from pymongo import MongoClient
import sys

# Connect to mongod, use DB: 'nosql', use COLLECTION: 'sample'
conn = MongoClient('127.0.0.1', 27017)  #连接mongod
db = conn.nosql                         #连接'nosql'数据库,没有则自动创建
sample = db.sample                      #使用sample集合,没有则自动创建

n = 1
data = list() 
for line in sys.stdin:
    data = line.strip().split()
    linenum="line"+str(n)               # linenum是line字符串+数字组成的字符串,后面插入数据集时会用到
    if n==1:
        pass                            # 第一行数据是没用的,清洗掉
    elif n==2:
        data = data[4:]                 # 实测观察数据从第四个数据开始
        data[0] = '-3.1415926536'       # 原数据是‘Real=-3.1415926536’,所以将数据修改下
        for index,item in enumerate(data):
            data[index] = float(item)   # 将原来是字符串的数据转为float类型
        sample.insert({                 # 将数据插入(insert)MongoDB中的sample集合
            "line":linenum,             # 这里我为了后续作图方便,插入了一个{line:linenum}的键值对
            "value":data                # {value: data}键值对, data是一个list变量哦
        })
    else:
        data = data[2:]                 # 和第二行的数据不一样,实测观察出的,有时候编程是要一步步观察修改的
        for index,item in enumerate(data):  # 考验自己的动手能力,怎么观察实现要自己想办法了
            data[index] = float(item)
        sample.insert({
            "line":linenum,
            "value":data
        })
    n+=1

 

2、对读出的数据进行可视化处理。

画图脚本:main.py

(1) 第一个图:

蓝色的线是在1.0*10^9频率下,phi=0

橙色的线是在1.0*10^9频率下,phi=1.5707963268

横坐标是Theta(degree),范围从-Pi ~Pi;纵坐标是电场值。

相同频率下,theta角度越大,电场值越小

 

main.py 

#!/usr/bin/python3
# -*- coding:utf-8 -*-
# file : main.py
# 这个文件是用来读取MongoDB中nosql数据库.sample集合数据
# 读出之后作图

from pymongo import MongoClient
import matplotlib.pyplot as plt

# Connect to mongod, use DB: 'nosql', use COLLECTION: 'sample'
conn = MongoClient('127.0.0.1', 27017)                             #连接mongod
db = conn.nosql                                                    #连接'nosql'数据库,没有则自动创建
sample = db.sample                                                 #使用sample集合,没有则自动创建

angle_theta_radian=sample.find_one({"line":"line2"})['value']      #使用find_one查找第2行的数据,取其名为‘value’的键值对的值
data_phi0=sample.find_one({"line":"line3"})['value']               #使用find_one查找第3行的数据,取其名为‘value’的键值对的值
data_phi90=sample.find_one({"line":"line48"})['value']             #使用find_one查找第48行的数据,取其名为‘value’的键值对的值

plt1, = plt.plot(angle_theta_radian,data_phi0)                     #作图1
plt2, = plt.plot(angle_theta_radian,data_phi90)                    #作图2
plt.legend([plt1,plt2],['Electrial Field1','Electrial Field2'],loc='upper right')  #设置图例
plt.xlabel('Theta (degree)')                                       #设置x轴标签
plt.ylabel('Electrical field (V/m)')                               #设置y轴标签
plt.show()                                                         #以上一起显示出来

 

 (2) 第二个图:

蓝色的线是,在1.0*10^9频率下,phi=0;

橙色的线是,在1.02*10^9频率下,phi=0;(第93行: line93)

横坐标是Theta(degree),范围从-Pi ~Pi;纵坐标是电场值。

 

相同theat角度下,频率越高,电场值绝对值越大。

实现:将main.py脚本文件中的

data_phi90=sample.find_one({"line":"line48"})['value']

修改为:

data_phi90=sample.find_one({"line":"line93"})['value']

即可得出。

 

 

 

数据文件说明:

1、数据文件概述:是测试的电场强度数据文件。

包括多个频率测试的电场强度,每个频率的数据是一个数据块。

在一个频率点测试的数据(每一块数据里面),又包括多行数据(每行是一个theta角度的数据)和多列数据(每一列为一个phi角度的数据)。

 

2、数据文件含义:

 

3、实验测试与数据的关系如下

 

对于文件sample.txt.txt,只有两个频率(109频率和1.2*109频率)。

 感谢李老师的数据文件说明,如果有任何侵权问题,博主可以立即删除。

 

 博客好像发不了文件,如果需要数据文件的话请留言邮箱,看到了发给你。

 

posted on 2018-05-23 00:06  FA-learning  阅读(789)  评论(0编辑  收藏  举报

导航