摘要:
import jieba path=r'"E:\中文数据清理\147\"' with open(r'E:\中文数据清理\stopsCN.txt',encoding='utf-8')as f: stopword=f.read().split('\n') List01=[] List02=[] def read_text(name,start,end): for f... 阅读全文
摘要:
from sklearn.datasets import load_boston boston=load_boston() boston.keys() print(boston.DESCR) data=boston.data x=data[:,5] y=boston.target import matplotlib.pyplot as plt plt.scatter(x,y) pl... 阅读全文
摘要:
import csv from sklearn.model_selection import train_test_split import nltk from nltk.corpus import stopwords from nltk.stem import WordNetLemmatizer 阅读全文
摘要:
from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() pred = gnb.fit(iris.data,iris.target) y_pred = pred.predict(iris.data) print (ir... 阅读全文
摘要:
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 分类,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个 classifier 会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通 阅读全文
摘要:
from sklearn.datasets import load_sample_image import matplotlib.pyplot as plt from sklearn.cluster import KMeans import numpy as np flower=load_sample_image('flower.jpg')#原始图片 plt.imshow(flower) plt... 阅读全文
摘要:
a=[1,2,3,4,5,6,7,8,9,10] print(a) import numpy as np m=np.arange(24) print(m) #n=m.reshape(3,8) #print(n) #m.shape=(2,3,1,4) #print(m) #m.resize(3,8) 阅读全文
摘要:
一、处理日期时间 取系统时间 from datetime import datetime datetime.now() 转换成‘2017年9月30日星期六10时28分56秒’格式字符串 print('{0:%Y}年{0:%m}月{0:%d}日星期{0:%w} {0:%H}时{0:%M}分{0:%S} 阅读全文
摘要:
def getTxt(): txt = open("zmy.txt").read() txt = txt.lower() for ch in '!"@#$%^&*()+,-./:;?@[\\]_`~{|}': txt.replace(ch," ") return txt zmy = getTxt().split() sunstrset = s... 阅读全文
摘要:
python中列表的元素不能直接相加减 python中def用来定义函数和类,return用来返回函数的值或者终止函数执行 range()函数使用非常方便,能返回一系列连续添加的整数,能生成一个列表对象 range(a,b,c)表示范围从a到b,间隔c 阅读全文