摘要:
# 在浏览1次的前提下, 得到的网页被浏览的总次数 fullURL_count = pd.DataFrame(real_one.groupby("fullURL")["fullURL"].count()) fullURL_count.columns = ["count"] fullURL_count 阅读全文
摘要:
import pandas as pd import matplotlib.pyplot as plt inputfile ='data5/original_data.xls' # 输入的数据文件 data = pd.read_excel(inputfile) # 读取数据 # 查看有无水流的分布 阅读全文
摘要:
#8-1 import numpy as np import pandas as pd inputfile = 'data4/GoodsOrder.csv' data = pd.read_csv(inputfile,encoding='gbk') data.info() data = data['i 阅读全文
摘要:
#代码7-1 数据探索 import pandas as pd datafile = 'data3/air_data.csv' #航空原始数据,第一行为属性标签 resultfile = 'data3/explore.csv' #数据探索结果表 data = pd.read_csv(datafile 阅读全文
摘要:
第六章部分: #代码6-1 描述性统计分析 import numpy as np import pandas as pd inputfile = "data.csv" data = pd.read_csv(inputfile) #依次计算最小值,最大值,均值,标准差 description = [d 阅读全文
摘要:
第三章 数据探索 数据探索就是通过检验数据集的数据质量、绘制图表、计算某些特征量等手段,对样本数据的结构和规律进行分析的过程。数据探索有助于选择合适的数据预处理和建模方法。数据探索包括数据质量分析和数据特征分析。 3.1 数据质量分析 数据质量分析的主要任务是检查原始数据中是否存在脏数据。脏数据一般 阅读全文
摘要:
import tensorflow as tf print(tf.__version__) a = tf.constant(2.0) print(a) #声明一个标量常量 t_1 = tf.constant(2) t_2 = tf.constant(2) #常量相加 t_add = tf.add(t 阅读全文
摘要:
import math from pandas import DataFrame def sigmoid(x):#激活函数 return 1/(1+math.exp(-x)) x1=[0.29,0.50,0.00,0.21,0.10,0.06,0.13,0.24,0.28] x2=[0.23,0.6 阅读全文
摘要:
import pymysql db = pymysql.connect(host="localhost",user = "root",password = "abc123",database= "NameList") cursor = db.cursor() cursor.execute("SELE 阅读全文