随笔分类 - 分析与开发
摘要:连接远程Anaconda3 查看 案例1 import findspark findspark.init() ############################################## from pyspark.sql import SparkSession from pyspar
阅读全文
摘要:案例1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets from sklearn.metrics import silhouette_score from sklearn.cluster
阅读全文
摘要:客户贷款风险评估 数据预处理 # 因为需要进行聚类,所以需要对数据进行初步处理,这里对数值型数据,进行标准化,对分类变量处理为有序变量。 # 选择特征 把文本类型转化为数值类型 方便计算比较 数据预处理 features = ['Age', 'Sex', 'Job', 'Housing', 'Sav
阅读全文
摘要:查看 案例1 import sklearn.cluster as sc import numpy as np import matplotlib.pyplot as mp import sklearn.metrics as sm # 读取样本 x = np.loadtxt('.\perf.txt',
阅读全文
摘要:查看 案例1 import sklearn.cluster as sc import numpy as np import matplotlib.pyplot as mp # 一维数据 划分成3类 找点 三维 四维 一样的画法。 # 分类(class)与聚类(cluster)不同(物以类聚),分类是
阅读全文
摘要:查看 案例1 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from sklearn.preprocessing import StandardScaler d
阅读全文