摘要:
featuretools入门尝试 简介 特征工程中最重要的一步,是对baseline提升最大的一个步骤,对数据的EDA以及构建特征,是不可缺少一部分。python的特征工程常用agg与groupby的进行聚合统计。 首先,我们得先了解一下featuretools的3个基本组成 实体集(EntityS 阅读全文
摘要:
Hadoop 入门总结 搜索了好几个博客,把hadoop基础总结了一下,感觉收货还挺多。 一.hadoop简介 Hadoop是一个开源框架,允许使用简单的编程模型在跨计算机集群的分布式环境中存储 和处理大数据。它的设计是从单个服务器扩展到数千个机器,每个都提供本地计算和存储。 二.hadoop的基本 阅读全文
摘要:
Java内存管理机制 java由于在虚拟机的自动管理机制下,可以不需要管理内存,提升了程序员跟多时间在业务逻辑中,但是对内存管理的封装,也导致了当出现内存泄露等问题时,修正问题是一个艰难的工作。 java运行时的数据区域 java所管理的内存将会按照以下几个区域进行划分: 程序计数器 程序计数器是一 阅读全文
摘要:
常见的查找主要有: 1:顺序查找 2:二分查找 3:分块查找 4:哈希查找 5:斐波那契查找 6:树表查找 7:插值查找 主要介绍一下在牛客网做题常碰见的四种查找方法。 1.顺序查找: 顺序查找:顺序查找适合于存储结构为顺序存储或链接存储的线性表 复杂度分析: 平均查找长度为(n+1)/2 最好1 阅读全文