摘要:
XGBoost是近年来很受追捧的机器学习算法,由华盛顿大学的陈天奇提出,在国内外的很多大赛中取得很不错的名次,要具体了解该模型,可以移步GitHub,本文介绍其在Widows系统下基于Git的python版本的安装方法。 需要用到三个软件: python软件(本文基于Anaconda,因为自带很多库 阅读全文
摘要:
比较常用的字符串匹配算法 1. 首先,字符串"BBC ABCDAB ABCDABCDABDE"的第一个字符与搜索词"ABCDABD"的第一个字符,进行比较。因为B与A不匹配,所以搜索词后移一位。 2. 因为B与A不匹配,搜索词再往后移。 3. 就这样,直到字符串有一个字符,与搜索词的第一个字符相同为 阅读全文
摘要:
常用于大规模稀疏机器学习问题上 1.优点: 高效 简单 2.可以选择损失函数 loss=”hinge”: (soft-margin)线性SVM. loss=”modified_huber”: 带平滑的hinge loss. loss=”log”: logistic回归 3.通过penalty参数,可 阅读全文
摘要:
推荐系统主要有两种算法: 1.基于内容的推荐,主要是根据推荐项的具体内容进行推荐 2.基于协同过滤的推荐。主要是用户之间或者项之间的相似性 协同过滤分为两类: 1.item-based基于项的协同过滤 2.user-based基于用户的协同过滤 一、相似度的度量方法: 1.欧氏距离 就是平方和开根号 阅读全文
摘要:
1.Bagging Bagging又叫自助聚集,是一种根据均匀概率分布从数据中重复抽样(有放回)的算法 每个抽样生成的自助样本集上,训练一个基分类器;对训练过的分类器进行投票,将测试样本指派到得票最高的类中。 对于分类和回归问题可采用如下的两种方法: 分类问题:采用投票的方法,得票最多的类别为最终的 阅读全文
摘要:
假设有abcde5个物品,重量为w1...,价值为v1...,背包的承重量为c,怎么放的价值更高 一、0/1背包问题 5中物品只有一件,动态规划的子问题是前i个物品放在承重量为j的背包中,状态变量:dp[i][j] 遍历时i在外层,j在内层,也就是每次循环先求出前i-1个物品在不同载重量的情况下的自 阅读全文
摘要:
集成开发环境:Pycharm python版本:2.7(anaconda库) 用到的库:科学计算库numpy,数据分析包pandas,画图包matplotlib,机器学习库sklearn 大体步骤分为三步: 1.数据分析 2.交叉验证 3.预测并输出结果 导入库函数 import numpy as 阅读全文
摘要:
给出了旧金山以往犯罪活动的相关信息,预测特定条件下的犯罪情况 分析数据集和测试集信息: 训练集给出的信息有: 1.Dates:时间日期和时间,这里考虑时间对犯罪活动有影响,日期和下边的周几有相似处,取周几作为特征,因为节日是少数情况 2.category:犯罪分类,就是实例的标签 3.descrip 阅读全文
摘要:
直接上代码 import java.util.Stack; public class BinaryTree { //定义一棵二叉树,包括左子树、右子树、该节点的值和构造器 public BinaryTree lchild; public BinaryTree rchild; public char 阅读全文