摘要:
如题,本文的宗旨既是透过对象的生命周期,来梳理JVM内存结构及GC相关知识,并辅以AOP及双亲委派机制原理,学习不仅仅是海绵式的吸收学习,还需要自己去分析why,加深对技术的理解和认知,祝大家早日走上自己的“成金之路”。 Java对象的创建 本部分,从攻城狮编写.java文件入手,详解了编译、载入、 阅读全文
摘要:
本文浅显的分析了MySQL索引的原理及针对主程面试的一些问题,对各种资料进行了分析总结,分享给大家,希望祝大家早上走上属于自己的"成金之路"。 学习知识最好的方式是带着问题去研究所获取的资料,分析所获取资料的优点和不足,然后归纳汇总资料,结合使用场景形成整体的知识脉络体系,本文行文依据各类问题展开, 阅读全文
摘要:
本文从冒泡排序撩起,对选择、插入、希尔、归并、快排6种经典的数组排序进行了深入分析,并详解其间的关联,让你深刻理解其中的关键点;同时对经典的数据结构Vector、Stack、Queue、树、Map、Set做了归纳总结,对其底层的实现做了解析,分享给大家,作为每一个中高级程序员应该懂得的算法与排序,祝 阅读全文
摘要:
秉承着"不懂操作系统原理的程序员不是合格的程序员"的至理名言,鄙人又是买陈莉君老师的“Linux教学视频”,又是研读其力作《深入分析Linux内核源代码》,先将总结笔记放送给大家,希望对大家研习Linux源码提供更多的帮助,分章总结,从硬件起源开始->CPU中断->进程调度->内存管理->进程通信- 阅读全文
摘要:
互联网行业是大势所趋,从招聘工资水平即可看出,那么如何提升自我技能,满足互联网行业技能要求?需要以目标为导向,进行技能提升,本文主要针对高并发分布式系统设计、架构(数据一致性)做了分析,祝各位早日走上属于自己的"成金之路"。 目录:问题分析概念解读Most Simple原理解读eBey、去哪儿、蘑菇 阅读全文
摘要:
本文来源于caoz梦呓公众号高并发专辑,以图形化、松耦合的方式,对互联网高并发问题做了详细解读与分析,“技术在短期内被高估,而在长期中又被低估”,而不同的场景和人员成本又导致了巨头的方案可能并不适合创业公司,那么如何保证高并发问题不成为创业路上的拦路虎,是每一个全栈工程师、资深系统工程师、有理想的程 阅读全文
摘要:
作者简介:曹政——俞军的关门弟子,CNZZ统计工具的缔造者,前百度商业产品部boss,4399CTO,微信公众号"caoz的梦呓"(yi),文后附上二维码,经常发布各种互联网干货,建议大家订阅。 读万卷书不如行万里路,行万里路不如重复成功人的脚步,虽然成功人的经验有时效性与机遇性,但是如何把握和分析 阅读全文
摘要:
本文与编程无关,但是与每个程序员密切相关的学习有关,还请《博客园首页》网开一面,让本文多多传播,让更多人获益,在此感激不尽。 最近一直苦于如何扩展思维深度的问题,故搜寻到《深入学习的艺术》,由表及里,采用大量实验证明,阐述了如何深入学习;读完此书,运用书中观点,整理为此篇blog。书地址为http: 阅读全文
摘要:
本文不涉及复杂的底层数据结构,通过explain解释SQL,并根据可能出现的情况,来做具体的优化,使百万级、千万级数据表关联查询第一页结果能在2秒内完成(真实业务告警系统优化结果)。希望读者能够理解SQL的执行过程,并根据过程优化,走上自己的"成金之路" 需要优化的查询:使用explain 出现了U 阅读全文
摘要:
阅读全文
摘要:
详情请参考https://zhuanlan.zhihu.com/p/19763358 看完觉得这才是真正的数学打开方式。 知乎的动态图支持不好,动态图全文参考http://blog.jobbole.com/70549/ 以下是摘要 作 者:韩 昊 知 乎:Heinrich 微 博:@花生油工人 知乎 阅读全文
摘要:
参考视频为可汗学院的统计学:http://open.163.com/special/Khan/khstatistics.html 以生活及统计应该做什么的角度,讲述了统计学,对应国内的《概率论》,整体总结如下: 更加详细的课程总结如下 阅读全文
摘要:
文章顺序排在《地图和本地搜索的最基本技术》之后 1.特征向量的提取 i.思想: 想让计算机来对新闻进行分类,先要将新闻变为一组可计算的数字 ii.实现: a.去掉新闻中的助词(的、地、得),以及虚词(之乎者也) b.然后将剩下的词的IF-IDF,依据词汇表的顺序,组成一个特征向量;向量中的每一个维度 阅读全文
摘要:
1.原理: a.解决的问题: 判断一个元素是否在一个集合中 b.Hash表的特点: i.快速准确,但是耗费存储空间 ii.先将url或者email转为8个字节的信息指纹,在考虑Hash50%的存储效率,1亿url或者email需要16亿字节,即1.6GB空间 c.布隆过滤器: i.能用1/8到1/4 阅读全文
摘要:
1.输入法与编码: a.对汉字的编码分为两个部分: i.对拼音的编码 ii.对消除歧义的编码 b.拼音输入法的优势: i.不需要专门的学习 ii.输入自然,不会中断思维,即找每个键的时间短 iii.编码长,有信息冗余,容错性好 2.输入一个汉字需要敲多少个键——香农第一定理 a.香农第一定理: 对于 阅读全文
摘要:
1.相关性的演进: i.单文本词频TF(Term Frequency) 用关键词的出现的次数除以文章的总次数,做归一化处理得到TF,来屏蔽文章长度对用关键词出现次数来衡量相关性时的影响 ii.搜索关键词权重的度量IDF: ii.搜索关键词权重的度量IDF: 需要给每个此赋以权重,来区分查询中词的重要 阅读全文
摘要:
本文分为概述、历史、el7.2代码架构图解三部分。 解决的问题: a.Kernel调度发展过程; b.以架构图的方式,详解el7.2具体调度实现、内核线程模型、调度时间片计算,以及探究整个Kernel实际运行过程。 1.概述 现代操作系统,通过虚拟化CPU及内存,来达到最大化硬件能力的目的 a.内存 阅读全文
摘要:
1.获取安装界面代码 挂载image/install.img:mount image/install.img /mnt/5 -o loop 复制挂载后的代码至self_intall:cp -r /mnt/5 self_install 2.自定义glade图形界面 具体的开发见python下的GTK开 阅读全文
摘要:
1.条件准备: 按照需求,最小化安装Centos原生系统 在安装后的系统中找到/root/install.log与/root/anaconda-ks.cfg文件 前者用来找rpm包,后来用来做定制安装的ks.cfg 2.寻找安装包: 从原生的centos镜像中扣出install.log中安装的所有r 阅读全文
摘要:
总结:此聚类的模型相对简单, 模型: 集合{ itemN:{col1:n1,col2:n2,col3:n3,...,coln:n} } 二维表形式:column1 column2 column3 ... columnN item 关键在于数据准备阶段,比如,对博客进行聚类的时候,按照"每个单词在出现 阅读全文
摘要:
总结: 模型: { good:{ word1:count1,word2:count2,word3:count3,...,wordN:countN } } 二维表good word1 word2 ... wordN 数据的处理:过滤掉stop词,选取长度在3-20间的,不能选取10%-50%间的热门词 阅读全文
摘要:
模型:从二维数据中挖掘出新的特征,必须进行分解,从分解的矩阵中得出结论 A=[ word1,word2,word3,...,wordN docu1: docu2: ... docuN: ] 非负矩阵因式分解(NMF)算法思想: 1.找到特征矩阵和权重矩阵,使其乘积和原矩阵近似 特征矩阵:每个特征对应 阅读全文
摘要:
总结:构建基于人的协同过滤模型,以自己的评价或者购买过的商品构建输入向量,计算与模型中其他人的的相似度,然后sum(相似度*评分)/sum(所有评价过此商品的人的相似度)来计算物品推荐值。 对于大规模的物品时,不可能对实时的为每个人计算相似度,然后进行物品的推荐,此时的做法是构建基于物品的协同过滤模 阅读全文
摘要:
44岁中信建投首席周金涛离世,“一代宗师”20个预言待验证今天,媒体报道,中信建投首席经济学家周金涛因胰腺癌去世,享年44岁。朋友圈都在刷屏纪念这位“大师”。公开资料显示,周金涛,1972年7月出生于天津,2016年新财富最佳策略分析师第五名,2008-2012年连续5年新财富策略研究最佳分析师。今 阅读全文
摘要:
无锁操作集锦:1.适用场景: 多个线程同时抢占同一个资源,并对其进行写(修改)操作 2.几个基本的概念: 寄存器:是中央处理器内的组成部分。寄存器是有限存贮容量的高速存贮部件,它们可用来暂存指令、数据和位址。在中央处理器的控制部件中,包含的寄存器有指令寄存器(IR)和程序计数器(PC)。在中央处理器 阅读全文
摘要:
之前一直在寻找好的编写clojure的环境,经过一翻努力,终于搭建了一个lein1.5+clojure+slime的环境,但是想达到一边编译一边调试的功能始终没有成功,遂放弃此前摸索的结果,基于nrepl+lein2.x+emcas成功搭建学习环境;步骤如下: 1.安装emacs-24.x版本,点击 阅读全文
摘要:
本文结合Hive paper的中文版,以及google的一些资料,对Hive的基本组成进行了总结: 1、组件: 元存储(Metastore )-存储“系统目录以及关于表、列、分区等的元数据”的组件。 驱动(Driver )- 控制 HiveQL 生命周期的组件,当 HiveQL 查询穿过 Hive时 阅读全文
摘要:
本文对Hive+mysql的安装做一个总结,后期会把Hive的一些资料放上来: 1.安装目标: Hive搭配远程Mysql 2.要点总结: 1).Mysql的配置: 假如Hive以hive用户连接Mysql,以root用户登录Mysql: drop user hive@'%'; grant all 阅读全文
摘要:
今天早上帮一新人远程搭建Hadoop集群(1.x或者0.22以下版本),感触颇深,在此写下最简单的Apache Hadoop搭建方法,给新人提供帮助,我尽量说得详尽点;点击查看Avatorhadoop搭建步骤。1.环境准备: 1).机器准备:安装目标机器要能相互ping通,所以对于不同机器上的虚拟机要采取"桥连接"的方式进行网络配置(如果是宿主方式,要先关闭宿主机防火墙;上网方式的具体配置方法请google vmvair上网配置、Kvm桥连接上网、Xen在安装的时候就能够手动配置局域网IP,实在不行,请留言);关闭机器的防火墙:/etc/init.d/iptables st 阅读全文
摘要:
应网友要求,介绍下zookeeper的应用场景,本文是在公司平台研发中对zookeeper(以下简称zk)的使用中得出的经验,分享给大家;如有更好的场景请添加评论,共同分享。1.ZK命令行使用、四种节点的介绍 1)。搭建好zk环境后,运行其bin目录下的zkCli.sh,即可进入zk的人机交互界面,可以随意键入字母(quit是退出命令,注意哦)并回车,查看帮助文档; 2)。节点分类: PERSISTENT:持久化目录节点,这个目录节点存储的数据不会丢失; PERSISTENT_SEQUENTIAL:顺序自动编号的目录节点,这种目录节点会根据当前已近存在的节点数自动加 1,然... 阅读全文