06 2018 档案
Kaggle:Home Credit Default Risk 特征工程构建及可视化(2)
摘要:博主在之前的博客 Kaggle:Home Credit Default Risk 数据探索及可视化(1) 中介绍了 Home Credit Default Risk 竞赛中一个优秀 kernel 关于数据的探索及可视化的工作,本篇博客将围绕如何构建特征工程展开...
阅读全文
python 实现图的深度优先和广度优先搜索
摘要:在介绍 python 实现图的深度优先和广度优先搜索前,我们先来了解下什么是“图”。1 一些定义顶点 顶点(也称为“节点”)是图的基本部分。它可以有一个名称,我们将称为“键”。边 边(也称为“弧”)是图的另一个基本部分。边连接两个顶点,以表明它们之...
阅读全文
Kaggle:Home Credit Default Risk 数据探索及可视化(1)
摘要:最近博主在做个 kaggle 竞赛,有个 Kernel 的数据探索分析非常值得借鉴,博主也学习了一波操作,搬运过来借鉴,原链接如下:https://www.kaggle.com/willkoehrsen/start-here-a-gentle-introdu...
阅读全文
TAF /tars必修课(一):整体架构理解
摘要:来自零点智能社区一、前言TAF,一个后台逻辑层的高性能RPC框架,目前支持C++,Java, node 三种语言, 往后可能会考虑提供更多主流语言的支持如 go等,自定义协议JCE,同时也支持HTTP。 它集可扩展协议编解码、高性能RPC通信框架、名字路由与发现、发布...
阅读全文
lintcode 刷题 by python 部分链表题总结(2)
摘要:本篇博客对最近做的链表的算法题做个简单的小结,主要描述题目和提供解题思路,具体代码见我的 github:https://github.com/MUSK1881/lintcode-by-python 36. 翻转链表 II(中等)描述翻转链表中第...
阅读全文
基于CART的回归和分类任务
摘要:CART 是 classification and regression tree 的缩写,即分类与回归树。 博主之前学习的时候有用过决策树来做预测的小例子:机器学习之决策树预测——泰坦尼克号乘客数据实例,不过在那篇博客中并没有详细阐述算法的原理...
阅读全文
机器学习: K-means 聚类
摘要:今天介绍机器学习里常见的一种无监督聚类算法,K-means。我们先来考虑在一个高维空间的一组数据集,S={x1,x2,...,xN}" role="presentation" style="position: relative;">S={x1,x2,...,xN}S=...
阅读全文
python 中的堆 (heapq 模块)应用:Merge K Sorted Lists
摘要:堆是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树的数组对象。在队列中,调度程序反复提取队列中第一个作业并运行,因为实际情况中某些时间较短的任务将等待很长时间才能结束,或者某些不短小,但具有重要性的作业,同样应当具有优先权。堆即为解...
阅读全文
名人、皇家谱系
摘要:1. 铁木真与忽必烈蒙古帝国历任大汗: 成吉思汗:窝阔台汗贵由汗蒙哥:第四任大汗;忽必烈:第五任大汗;铁木真(成吉思汗),主要有四子 术赤,孛儿帖所生,察合台,孛儿帖所生,窝阔台,孛儿帖所生, 长子:贵由拖雷,孛儿帖所生, 长子蒙哥四子忽必烈
阅读全文
python实现数组和链表的归并排序
摘要:归并排序是一种稳定的排序,采用分而治之策略,可以用于顺序储存结构,也易于在链表上实现。其原理如下图: 算法时间复杂度为 O(nlogn),空间复杂度为 O(n)。1 在数组上实现def mergesort(seq): if len(seq)<...
阅读全文
Python 正则 —— 捕获与分组
摘要:\n:表示第 n 个捕获:>> s = "what the fuck!">> p = r"(.+)" # \2 对应第二个捕获,也即 h1,则 为: # \1 对应第一个捕获,也即 html,则 为:>> re.matc...
阅读全文
ArcGIS中的数据连接问题——数据类型不统一
摘要:博主在研究空间数据分布的时候经常会用到 ArcGIS 进行空间数据可视化。但是有时候会由于数据类型不统一而无法将 csv 中的数据连接到底图上。比如在底图中的数据是字符串格式,而 csv 中是数字格式,出现这种情况,我们要么改变 csv 中的数据类型(似乎把 ...
阅读全文
Spring boot 搭建
摘要:1. pom 文件的依赖 org.springframework.boot spring-boot-starter-parent 2.0.2.RELEASE org.springframework.boot ...
阅读全文
诗词文中的地名(名人生卒地、生卒年、名人籍贯)
摘要:0. 生卒地铁木真(成吉思汗):成吉思汗二十二年七月十二日(1227年8月25日),成吉思汗在六盘山下清水县(今属甘肃)病逝,年66岁。1. 生卒年1799 年,乾隆去世; 41 年后即是中国近代史的开端,鸦片战争;2. 籍贯山东: 丘处机:道号长春子,登州栖霞(今属...
阅读全文
推理 —— 猜帽子颜色
摘要:推理有正推,也有反推,就像证明有反证法;1. 2黑2白 已知条件:C 能看到 BD 能看到 B、CA 与 B/C/D 互相看不到如果此时有人说他猜到了自己头顶帽子的颜色,请问是哪位;如果 B、C 帽子同色,D 就能猜到自己头顶的颜色,则 B 与 C 帽子颜色不同,又...
阅读全文
Java 容器的使用及数组、List、Set 的相互转换
摘要:0. Utils字符串数组的排序:Set set = new TreeSet();Collections.addAll(set, args); // args 为 String[] 类型数组复制:system.arraycopy:必须明确自行建立一个数组对象,int...
阅读全文
构建工具 —— Groovy 与 Gradle
摘要:1. GradleGradle 是一个基于 Groovy 的构建工具,使用 Groovy 来编写构建脚本,类似 maven,支持依赖管理和多项目创建。相比 maven,更轻量;windows cmd 命令行命令:>> gradle -version ...
阅读全文
效率生产力工具 —— idea 插件
摘要:maven helper: 打开该pom文件的Dependency Analyzer视图(在文件打开之后,文件下面会多出这样一个tab),进入Dependency Analyzer视图之后有三个查看选项,分别是 Conflicts(冲突)、All Dependenci...
阅读全文
测试之法 —— mock object
摘要:mock object 与真实对象相比,用来构造测试场景。1. 一个实例一个闹钟根据时间来进行提醒服务,如果过了下午5点钟就播放音频文件提醒大家下班了,如果我们要利用真实的对象来测试的话就只能苦苦等到下午五点,然后把耳朵放在音箱旁,我们应该利用mock对象 来进行测...
阅读全文
Java 面试题 —— java 源码
摘要:1. 静态工厂方法静态工厂方法不必在每次调用它们的时候都创建一个新的对象;Boolean.valueOf(boolean):public final class Boolean { public static final Boolean TRUE = new B...
阅读全文
Spring 配置文件
摘要::自动扫描以创建 bean 实例;1. 数据库配置数据库配置文件(jdbc.properties)在类路径(classpath,src/main/resources/)下;
阅读全文
python发送HTTP POST请求
摘要:1. 127.0.0.1和0.0.0.0127.0.0.1是一个回送地址,指本地机,一般用来本机测试使用,使用127.0.0.1启的服务只能在本地机器上访问,使用0.0.0.0启的服务可以在其他机器上通过网络访问。2. VMware 虚拟机向主机做端口映射虚拟机的网络...
阅读全文
【证明】【一题多解】 —— 等比数列
摘要:0. 数学归纳法(1+x)⋅(1−x)=(1+x)−(1+x)x=1+(x−x)−x2=1−x2" role="presentation">(1+x)⋅(1−x)=(1+x)−(1+x...
阅读全文
杜牧诗
摘要:1. 风物《秋夕》银烛秋光冷画屏,轻罗小扇扑流萤。 天阶夜色凉如水,坐看牵牛织女星。 2. 人生《留诲曹师等诗》万物有丑好,各一姿状分。唯人即不尔,学与不学论。 学非探其花,要自拔其根。孝友与诚实,而不忘尔言。 根本既深实,柯叶自滋繁。念尔无忽此,期以庆吾门。杜晦辞(...
阅读全文
高级数据结构及应用 —— 使用 bitmap 进行字符串去重
摘要:bitmap 即为由单个元素为 boolean(0/1, 0 表示未出现,1 表示已经出现过)的数组。如果C/C++ 没有原生的 boolean 类型,可以用 int 或 char 来作为 bitmap 使用,如果我们要判断某字符(char)是否出现过,使用 int ...
阅读全文
机器学习:Kullback-Leibler Divergence (KL 散度)
摘要:今天,我们介绍机器学习里非常常用的一个概念,KL 散度,这是一个用来衡量两个概率分布的相似性的一个度量指标。我们知道,现实世界里的任何观察都可以看成表示成信息和数据,一般来说,我们无法获取数据的总体,我们只能拿到数据的部分样本,根据数据的部分样本,我们会对数据的整体做...
阅读全文
机器学习: 共轭梯度算法(PCG)
摘要:今天介绍数值计算和优化方法中非常有效的一种数值解法,共轭梯度法。我们知道,在解大型线性方程组的时候,很少会有一步到位的精确解析解,一般都需要通过迭代来进行逼近,而 PCG 就是这样一种迭代逼近算法。我们先从一种特殊的线性方程组的定义开始,比如我们需要解如下的线性方程组...
阅读全文
二进制比特位运算
摘要:1. 基本运算截断保留后 k 位,比如 83 == 0x0101 0011 保留后 5 位,即为 0x0001 0011 == 19 x & (pow(2, k)-1)x & 0x1f截断保留前 k 位,则为: 对于 8 位数据,保留前 5 位:x & 0xf8或者:...
阅读全文
C 语言经典面试题 —— 宏
摘要:1. 运算符优先级与括号#define Cube(a) a*a*a无法解决 Cube(1+1) ⇒ 1+1*1+1*1+1 ⇒ 4,期待的应当是 8,故将其改造为 #define Cube(a) (a)*(a)*(a)如此,自身运算的优先级是能解决了,和其他表达式结合...
阅读全文
python base64 编解码,转换成Opencv,PIL.Image图片格式
摘要:二进制打开图片文件,base64编解码,转成Opencv格式:# coding: utf-8import base64import numpy as npimport cv2img_file = open(r'00.JPG','rb') # 二进制打开图片文件im...
阅读全文
Kaggle:House Prices: Advanced Regression Techniques 数据预处理
摘要:本博客是博主在学习了两篇关于 “House Prices: Advanced Regression Techniques” 的教程 (House Prices EDA 和 Comprehensive data exploration with Python )...
阅读全文
浙公网安备 33010602011771号