代码改变世界

大作业之中文文本分类(终稿)

2018-12-22 13:40 by PM的世代, 458 阅读, 0 推荐, 收藏, 编辑
摘要:import os import numpy as np import sys from datetime import datetime import gc path = 'H:\大三上大作业\python大作业\date' import jieba with open(r'H:\大三上大作业\python大作业\stopsCN.txt', encoding='utf-8') as f: ... 阅读全文

大作业初稿

2018-12-20 20:25 by PM的世代, 119 阅读, 0 推荐, 收藏, 编辑
摘要:#线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 from sklearn.datasets import load_boston import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression from sklearn.model_selection import train... 阅读全文

回归模型与房价预测

2018-12-20 19:58 by PM的世代, 264 阅读, 0 推荐, 收藏, 编辑
摘要:from sklearn.datasets import load_boston#导入数据集 boston=load_boston() #住宅平均房数与房价之间的关系 import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression lineR=LinearRegression() x=boston... 阅读全文

垃圾邮件分类

2018-12-06 18:10 by PM的世代, 306 阅读, 0 推荐, 收藏, 编辑
摘要:import nltk from nltk.corpus import stopwords from nltk.stem import WordNetLemmatizer #预处理 def preprocessing(text): tokens=[word for sent in nltk.sent_tokenize(text) for word in nltk.word_tok... 阅读全文

朴素贝叶斯分类应用

2018-12-02 12:04 by PM的世代, 614 阅读, 0 推荐, 收藏, 编辑
摘要:使用朴素贝叶斯模型对iris数据集进行花分类 #尝试使用3种不同类型的朴素贝叶斯: #高斯分布型,多项式型,伯努利型 复制代码 #GaussianNB from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() ... 阅读全文

朴素贝叶斯

2018-12-02 12:02 by PM的世代, 191 阅读, 0 推荐, 收藏, 编辑
摘要:1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: 复制代码 复制代码 from sklearn.datasets import load_iris iris=load_iris() from sklearn.naive_bayes import GaussianNB #高斯分布型 gnb=GaussianNB() #构造 pred=gnb.fit... 阅读全文

图片压缩

2018-11-18 15:56 by PM的世代, 149 阅读, 0 推荐, 收藏, 编辑
摘要:from sklearn.datasets import load_sample_image import matplotlib.pyplot as plt from sklearn.cluster import KMeans import numpy as np flower=load_sample_image('flower.jpg')#原始图片 plt.imshow(flower... 阅读全文

作业

2018-11-12 08:30 by PM的世代, 154 阅读, 0 推荐, 收藏, 编辑
摘要:import numpy as np x = np.random.randint(1,50,[20,1]) y = np.zeros(20) k = 3 #1) 选取数据空间中的K个对象作为初始中心,每个对象代表一个聚类中心; def initcen(x,k): return x[:k] #2) 对于样本中的数据对象,根据它们与这些聚类中心的欧氏距离,按距离最近的准则将它们分到距离它们最... 阅读全文

1025

2018-10-25 22:18 by PM的世代, 141 阅读, 0 推荐, 收藏, 编辑
摘要:def pySum(n):... #print pySum(10)) import numpy def npSum(n):... #print npSum(10)) from datetime import datetime start = datetime.now() pySum(1000000) delta = datetime.now()-start import numpy num1... 阅读全文

中英文词频

2018-10-21 11:07 by PM的世代, 147 阅读, 0 推荐, 收藏, 编辑
摘要:str2='''I will run, I will climb, I will soar I'm undefeated Jumpiing out of my skin, pull the chord Yeah I believe it The past, is everything we were don't make us who we are So I'll dream, until I ... 阅读全文