08 2020 档案

摘要:病人分类的例子 让我从一个例子开始讲起,你会看到贝叶斯分类器很好懂,一点都不难。 某个医院早上收了六个门诊病人,如下表。 症状 职业 疾病 打喷嚏 护士 感冒 打喷嚏 农夫 过敏 头痛 建筑工人 脑震荡 头痛 建筑工人 感冒 打喷嚏 教师 感冒 头痛 教师 脑震荡 现在又来了第七个病人,是一个打喷嚏 阅读全文
posted @ 2020-08-30 16:31 理工—王栋轩 阅读(959) 评论(0) 推荐(0) 编辑
摘要:import pandas as pd data = pd.read_table('val.txt',names=['category','theme','URL','content']) #读取数据,转成DataFrame格式。因为前期数据已经是处理好的,所以可以这样写。这里的read_table 阅读全文
posted @ 2020-08-23 20:23 理工—王栋轩 阅读(793) 评论(0) 推荐(0) 编辑
摘要:在实际应用中,经常需要把统计一段字符中,每个词出现的次数,也就是词频。统计次数有一个现成的方法就是DataFrame.value_counts(),问题是如何保存结果为我们所用。思路就是把value_counts的两列先分别转成列表,再讲两个列表转成字典。 import pandas as pd d 阅读全文
posted @ 2020-08-23 18:58 理工—王栋轩 阅读(5252) 评论(0) 推荐(1) 编辑
摘要:import pandas as pd data = pd.read_csv("train.csv") #确定每一列,或者叫每一个series下,是否有空数据 columns_name = data.columns.tolist() columns_name_true_false={} print( 阅读全文
posted @ 2020-08-15 15:07 理工—王栋轩 阅读(237) 评论(0) 推荐(0) 编辑
摘要:背景:有人利用信用卡欺诈,数据给出了28W多个样本,每一个样本有20多个因素数据和最终是否欺诈的结论。 1 import numpy as np 2 import pandas as pd 3 import matplotlib.pyplot as plt 4 #导入相关库文件 5 6 data = 阅读全文
posted @ 2020-08-04 11:41 理工—王栋轩 阅读(486) 评论(0) 推荐(0) 编辑
摘要:1. Series 情况下: pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序。 import pandas as pd df = pd.DataFrame({'区域' : ['西安', '太原', '西安', '太原', '郑州', '太原'], 阅读全文
posted @ 2020-08-03 09:32 理工—王栋轩 阅读(1437) 评论(0) 推荐(0) 编辑
摘要:逻辑回归是分类最简单的算法。 题目是有一个学校招生,考2门专业课。给出了100个样本,每一个样本包含2门课的成绩以及是否被录取。也就是LogiReg_data.csv数据。原始是txt格式,为了方便,人为的加上了表头。 1 import numpy as np 2 import pandas as 阅读全文
posted @ 2020-08-02 11:51 理工—王栋轩 阅读(199) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示