随笔分类 - C---数据挖掘笔记
摘要:基础概念:https://zhuanlan.zhihu.com/p/344754828 import sys import pandas as pd import numpy as np import math # all_list = [] # df = pd.DataFrame(columns
阅读全文
摘要:import numpy as np date = ['20210912', '20210922', '20211009', '20211102'] new_date = [] for i in range(100): new_date.extend(date) new_data = [] for
阅读全文
摘要:自动重新加载更改的模块 命令参数如下所示: %autoreload: 自动重载%aimport排除的模块之外的所有模块。 %autoreload 0: 禁用自动重载 %autoreload 1: 自动重载%aimport指定的模块。 %autoreload 2: 自动重载%aimport排除的模块之
阅读全文
摘要:其他设置图像细节方法:https://douzujun.github.io/page/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E7%AC%94%E8%AE%B0/3-%E5%8F%AF%E8%A7%86%E5%8C%96%E5%BA%93matpltlib/plt_
阅读全文
摘要:# Print accuracy predictions = predict(parameters, X) # (np.dot(Y, predictions.T) + np.dot(1 - Y, 1 - predictions.T)) / Y.size print ("Accuracy: {} %".format(100 - np.mean(abs(predictions - Y)) * 10...
阅读全文
摘要:1. 线性代数中矩阵乘法: np.dot() 1. 线性代数中矩阵乘法: np.dot() 1. 线性代数中矩阵乘法: np.dot() import numpy as np # 2 x 3 matrix1 = np.array([[1, 2, 3], [4, 5, 6]]) # 3 x 2
阅读全文
摘要:rates = [0.01, 0.001, 0.0001] models = {} costs = np.array([[0.7, 0.9, 0.4, 0.6, 0.4, 0.3, 0.2, 0.1], [0.7, 0.65, 0.64, 0.63, 0.62, 0.61, 0.60, 0.59], [0.7, 0.6,...
阅读全文
摘要:以下均为自己看视频做的笔记,自用,侵删! 还参考了:http://www.ai-start.com/ml2014/ In [8]: %matplotlib inline import pandas as pd import matplotlib.pylab as plt iris_data = pd
阅读全文
摘要:随机:数据采样随机,特征选择随机 (数据采样,有放回)
阅读全文
摘要:以下均为自己看视频做的笔记,自用,侵删! 还参考了:http://www.ai-start.com/ml2014/ 决策树的训练与测试 如何切分特征(选择节点) 衡量标准-熵 信息增益 决策树构造实例 信息增益:表示特征X使得类Y的不确定性减小的程度。(分类后的专一性,希望分类后的结果是同类在一起)
阅读全文
摘要:逻辑回归(Logistic regression) 以下均为自己看视频做的笔记,自用,侵删! 还参考了:http://www.ai-start.com/ml2014/ 用梯度下降求解逻辑回归 Logistic Regression The data The data The data The dat
阅读全文
摘要:回归算法 以下均为自己看视频做的笔记,自用,侵删! 一、线性回归 θ是bias(偏置项) 线性回归算法代码实现 (442, 1) first: (422, 1) second: (422, 2) Mean Squared Error: 2548.07239873 (442, 1) first: (4
阅读全文
摘要:seaborn是基于matplotlib的更高级的做图工具,下面主要针对以下几个部分进行整理: 第一部分:https://douzujun.github.io/page/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E7%AC%94%E8%AE%B0/4-%E5%8F%A
阅读全文
摘要:matplotlib主要从下面几个方面进行整理: 折线图绘制:https://douzujun.github.io/page/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E7%AC%94%E8%AE%B0/3-%E5%8F%AF%E8%A7%86%E5%8C%96%E5
阅读全文
摘要:用jupyter写好,直接放到GitHub上面了→_→ 博客链接:https://douzujun.github.io/page/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E7%AC%94%E8%AE%B0/2-%E6%95%B0%E6%8D%AE%E5%88%86%
阅读全文
摘要:记笔记用jupyter实在太方便了,懒得再重新写到博客园上,直接放个链接吧→_→ numpy(一):https://douzujun.github.io/page/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E7%AC%94%E8%AE%B0/1-%E7%A7%91%E
阅读全文
摘要:写在jupyter里面比较漂亮: https://douzujun.github.io/page/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/%E7%B1%BB%E4%B8%8D%E5%B9%B3%E8%A1%A1%E9%97%AE%
阅读全文
摘要:# coding: utf-8 # In[142]: import pandas as pd import numpy as np import matplotlib.pyplot as plt # In[143]: # 导入数据 titanic = pd.read_csv('train.csv') titanic.head(5) # print(titanic.describe())...
阅读全文
摘要:Conda的环境管理 Conda的环境管理功能允许我们同时安装若干不同版本的Python,并能自由切换。假设我们需要安装Python 3.6,此时,我们需要做的操作如下: 用户安装的不同python环境都会被放在目录/anaconda/envs下,可以在命令中运行conda info -e查看已安装
阅读全文
摘要:安装seaborn,可以使用 pip: pip install seaborn pip install seaborn 也可以使用 conda: conda install seaborn conda install seaborn 一个简单的箱线图:
阅读全文