机器学习成绩预测

成绩预测

利用机器学习算法，实现：预测你们班同学的成绩。

要求：

1.任选一门本学期开设的必修课，作为预测对象，必须在本门课程没有考试之前完成论文

2.样本数据的获得与收集，自己提供。

3.使用学过的机器学习算法，

4.编写程序代码

5.训练模型

6.模型测试

# --------------------------转自github--------------------------

注：源代码来源于青岛农业大学理信宋彩霞老师,KNN算法；

显示数据集

成绩预测

KNN代码

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

numberOfLabels = len(datingLabels)
LabelsColors = []
for i in datingLabels:
    if i == 1:
        LabelsColors.append('black')
    if i == 2:
        LabelsColors.append('orange')
    if i == 3:
        LabelsColors.append('red')
# 画出散点图,以datingDataMat矩阵的第一(飞行常客例程)、第二列(玩游戏)数据画散点数据,散点大小为15,透明度为0.5
axs[0][0].scatter(x=datingDataMat[:, 0], y=datingDataMat[:, 1], color=LabelsColors, s=15, alpha=.99)
# 设置标题,x轴label,y轴label
axs0_title_text = axs[0][0].set_title(u'每学期学习所消耗的时间与每周娱乐所消耗平均时间比值', FontProperties=font)
axs0_xlabel_text = axs[0][0].set_xlabel(u'每学期学习所消耗的时间（小时）', FontProperties=font)
axs0_ylabel_text = axs[0][0].set_ylabel(u'每周娱乐所消耗平均时间（小时）', FontProperties=font)
plt.setp(axs0_title_text, size=9, weight='bold', color='red')
plt.setp(axs0_xlabel_text, size=7, weight='bold', color='black')
plt.setp(axs0_ylabel_text, size=7, weight='bold', color='black')
 
# 画出散点图,以datingDataMat矩阵的第一(飞行常客例程)、第三列(冰激凌)数据画散点数据,散点大小为15,透明度为0.5
axs[0][1].scatter(x=datingDataMat[:, 0], y=datingDataMat[:, 2], color=LabelsColors, s=15, alpha=.99)
# 设置标题,x轴label,y轴label
axs1_title_text = axs[0][1].set_title(u'每学期学习所消耗的时间与每天上课平均坐前排平均次数', FontProperties=font)
axs1_xlabel_text = axs[0][1].set_xlabel(u'每学期学习所消耗的时间（小时）', FontProperties=font)
axs1_ylabel_text = axs[0][1].set_ylabel(u'每天上课平均坐前排平均次数比值', FontProperties=font)
plt.setp(axs1_title_text, size=9, weight='bold', color='red')
plt.setp(axs1_xlabel_text, size=7, weight='bold', color='black')
plt.setp(axs1_ylabel_text, size=7, weight='bold', color='black')
 
# 画出散点图,以datingDataMat矩阵的第二(玩游戏)、第三列(冰激凌)数据画散点数据,散点大小为15,透明度为0.5
axs[1][0].scatter(x=datingDataMat[:, 1], y=datingDataMat[:, 2], color=LabelsColors, s=15, alpha=.99)
# 设置标题,x轴label,y轴label
axs2_title_text = axs[1][0].set_title(u'每周娱乐所消耗平均时间与每天上课平均坐前排平均次数', FontProperties=font)
axs2_xlabel_text = axs[1][0].set_xlabel(u'每周娱乐所消耗平均时间（小时）', FontProperties=font)
axs2_ylabel_text = axs[1][0].set_ylabel(u'每天上课平均坐前排平均次数比值', FontProperties=font)
plt.setp(axs2_title_text, size=9, weight='bold', color='red')
plt.setp(axs2_xlabel_text, size=7, weight='bold', color='black')
plt.setp(axs2_ylabel_text, size=7, weight='bold', color='black')
# 设置图例
didntLike = mlines.Line2D([], [], color='black', marker='.',
                          markersize=6, label='didntLike')
smallDoses = mlines.Line2D([], [], color='orange', marker='.',
                           markersize=6, label='smallDoses')
largeDoses = mlines.Line2D([], [], color='red', marker='.',
                           markersize=6, label='largeDoses')
# 添加图例
axs[0][0].legend(handles=[didntLike, smallDoses, largeDoses])
axs[0][1].legend(handles=[didntLike, smallDoses, largeDoses])
axs[1][0].legend(handles=[didntLike, smallDoses, largeDoses])
# 显示图片
plt.show()
numberOfLabels = len(datingLabels)
LabelsColors = []
for i in datingLabels:
    if i == 1:
        LabelsColors.append('black')
    if i == 2:
        LabelsColors.append('orange')
    if i == 3:
        LabelsColors.append('red')
# 画出散点图,以datingDataMat矩阵的第一(飞行常客例程)、第二列(玩游戏)数据画散点数据,散点大小为15,透明度为0.5
axs[0][0].scatter(x=datingDataMat[:, 0], y=datingDataMat[:, 1], color=LabelsColors, s=15, alpha=.99)
# 设置标题,x轴label,y轴label
axs0_title_text = axs[0][0].set_title(u'每学期学习所消耗的时间与每周娱乐所消耗平均时间比值', FontProperties=font)
axs0_xlabel_text = axs[0][0].set_xlabel(u'每学期学习所消耗的时间（小时）', FontProperties=font)
axs0_ylabel_text = axs[0][0].set_ylabel(u'每周娱乐所消耗平均时间（小时）', FontProperties=font)
plt.setp(axs0_title_text, size=9, weight='bold', color='red')
plt.setp(axs0_xlabel_text, size=7, weight='bold', color='black')
plt.setp(axs0_ylabel_text, size=7, weight='bold', color='black')
 
# 画出散点图,以datingDataMat矩阵的第一(飞行常客例程)、第三列(冰激凌)数据画散点数据,散点大小为15,透明度为0.5
axs[0][1].scatter(x=datingDataMat[:, 0], y=datingDataMat[:, 2], color=LabelsColors, s=15, alpha=.99)
# 设置标题,x轴label,y轴label
axs1_title_text = axs[0][1].set_title(u'每学期学习所消耗的时间与每天上课平均坐前排平均次数', FontProperties=font)
axs1_xlabel_text = axs[0][1].set_xlabel(u'每学期学习所消耗的时间（小时）', FontProperties=font)
axs1_ylabel_text = axs[0][1].set_ylabel(u'每天上课平均坐前排平均次数比值', FontProperties=font)
plt.setp(axs1_title_text, size=9, weight='bold', color='red')
plt.setp(axs1_xlabel_text, size=7, weight='bold', color='black')
plt.setp(axs1_ylabel_text, size=7, weight='bold', color='black')
 
# 画出散点图,以datingDataMat矩阵的第二(玩游戏)、第三列(冰激凌)数据画散点数据,散点大小为15,透明度为0.5
axs[1][0].scatter(x=datingDataMat[:, 1], y=datingDataMat[:, 2], color=LabelsColors, s=15, alpha=.99)
# 设置标题,x轴label,y轴label
axs2_title_text = axs[1][0].set_title(u'每周娱乐所消耗平均时间与每天上课平均坐前排平均次数', FontProperties=font)
axs2_xlabel_text = axs[1][0].set_xlabel(u'每周娱乐所消耗平均时间（小时）', FontProperties=font)
axs2_ylabel_text = axs[1][0].set_ylabel(u'每天上课平均坐前排平均次数比值', FontProperties=font)
plt.setp(axs2_title_text, size=9, weight='bold', color='red')
plt.setp(axs2_xlabel_text, size=7, weight='bold', color='black')
plt.setp(axs2_ylabel_text, size=7, weight='bold', color='black')
# 设置图例
didntLike = mlines.Line2D([], [], color='black', marker='.',
                          markersize=6, label='didntLike')
smallDoses = mlines.Line2D([], [], color='orange', marker='.',
                           markersize=6, label='smallDoses')
largeDoses = mlines.Line2D([], [], color='red', marker='.',
                           markersize=6, label='largeDoses')
# 添加图例
axs[0][0].legend(handles=[didntLike, smallDoses, largeDoses])
axs[0][1].legend(handles=[didntLike, smallDoses, largeDoses])
axs[1][0].legend(handles=[didntLike, smallDoses, largeDoses])
# 显示图片
plt.show()
# 获得normMat的行数
m = normMat.shape[0]
# 百分之十的测试数据的个数
numTestVecs = int(m * hoRatio)
# 分类错误计数
errorCount = 0.0
 
for i in range(numTestVecs):
    # 前numTestVecs个数据作为测试集,后m-numTestVecs个数据作为训练集
    classifierResult = classify0(normMat[i, :], normMat[numTestVecs:m, :],
                                 datingLabels[numTestVecs:m], 4)
    print("分类结果:%d\t真实类别:%d" % (classifierResult, datingLabels[i]))
    if classifierResult != datingLabels[i]:
        errorCount += 1.0
print("错误率:%f%%" % (errorCount / float(numTestVecs) * 100))
# 生成NumPy数组,测试集
inArr = np.array([precentTats, ffMiles, iceCream])
# 测试集归一化
norminArr = (inArr - minVals) / ranges
# 返回分类结果
classifierResult = classify0(norminArr, normMat, datingLabels, 3)
#print（classifierResult）
# 打印结果
print("这名同学可能%s" % (resultList[classifierResult-1]))
# 1、测试代码
filename = "datingTestSet.txt"
# 打开并处理数据
datingDataMat, datingLabels = file2matrix(filename)
showdatas(datingDataMat, datingLabels)
 
#2、测试代码
datingClassTest()
 
# 正式代码
classifyPerson()

数据

8.215452    0.52524 smallDoses
68.216555   0.36525 didntLike
46.215475   0.00215 didntLike
26.21545    0.65154 smallDoses
27.02155    0.71525 smallDoses
1500    3.21525 0.91242 largeDoses
1400    4.74522 0.95321 largeDoses
1342    3.21455 0.24565 largeDoses
1440    5.33456 0.81454 largeDoses
65.52452    0.35456 didntLike
63.34556    0.26443 didntLike
70.45221    0.31245 didntLike
20.35455    0.76354 smallDoses
36.34556    0.24536 smallDoses
1356    6.15322 0.12354 largeDoses
1452    2.15433 0.98724 largeDoses
33.15442    0.54675 smallDoses
25.64652    0.68443 smallDoses
86.21156    0.00054 didntLike
86.21156    0.00354 didntLike

佳俊提醒你：别搜了，同学，200多人都抄重了

posted @ 2022-05-04 19:35 益生李佳菌阅读(1507) 评论(1) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 机器学习预测2022年考研成绩、考研分数线

· 国科大数据库新技术2023真题

· 机器学习实战1-kNN最近邻算法

· 关于机器学习课程的内容整理

· 从matlab官网入门机器学习（记录一些重要的讲义）

历史上的今天：
2020-05-04 《C程序设计语言》练习1-22

公告

昵称：益生李佳菌
园龄： 4年10个月
粉丝： 28
关注： 5

+加关注

2025年3月

日

一

二

三

四

五

六

随笔档案

文章档案

2022年5月(1)

骑码的佳俊

机器学习成绩预测

成绩预测

注：源代码来源于青岛农业大学理信宋彩霞老师,KNN算法；

显示数据集

成绩预测

KNN代码

数据

佳俊提醒你：别搜了，同学，200多人都抄重了

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔档案

文章档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

骑码的佳俊

机器学习 成绩预测

成绩预测

注：源代码来源于青岛农业大学理信宋彩霞老师,KNN算法；

显示数据集

成绩预测

KNN代码

数据

佳俊提醒你：别搜了，同学，200多人都抄重了

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔档案

文章档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

机器学习成绩预测