摘要:
作为一种极其简单的编程语言,Python目前成为了最炙手可热的几种语言之一。它不仅简单易学,而且它还为用户提供了各种各样的模块,功能强大,无所不能。有利必有弊,学习Python同样有困扰,其中之一就是Python的各种模块的各种内置函数太为繁杂,不好记忆。俗话说的好“好记性不如烂笔头”,既然不好... 阅读全文
摘要:
Bit-map是一种很巧妙的数据存储结构。所谓的Bit-map就是用一个bit位来标记某个元素对应的Value,而Key即是该元素。由于采用了Bit为单位来存储数据,可以大大节省存储空间。Bit-map在实际中也有着广泛的应用,比如快速排序,元素去重以及空间缩减等等。本文通过Bit-map的几个应用实例对Bit-map以及其扩展结构Bloom Filter进行介绍。 阅读全文
摘要:
谈完数据结构中的树(详情见参照之前博文《数据结构中各种树》),我们来谈一谈机器学习算法中的各种树形算法,包括ID3、C4.5、CART以及基于集成思想的树模型Random Forest和GBDT。本文对各类树形算法的基本思想进行了简单的介绍,重点谈一谈被称为是算法中的“战斗机”,机器学习中的“屠... 阅读全文
摘要:
数据结构中有很多树的结构,其中包括二叉树、二叉搜索树、2-3树、红黑树等等。本文中对数据结构中常见的几种树的概念和用途进行了汇总,不求严格精准,但求简单易懂。 阅读全文
摘要:
哈希表(Hash Table)是一种特殊的数据结构,它最大的特点就是可以快速实现查找、插入和删除。因为它独有的特点,Hash表经常被用来解决大数据问题,也因此被广大的程序员所青睐。本文介绍了哈希表的基本思想、哈希表的创建、解决冲突和查找的方法以及对哈希表性能的讨论,并附有C++实现源码,希望对初学者有所帮助。 阅读全文
摘要:
和排序算法一样,查找算法也是一种最为基本的算法。高效地查找可以使我们对数据进行更加高效地操作,熟练掌握各种查找算法也是一项基本的算法技能。 阅读全文
摘要:
排序算法是一种最为基础的算法,可以说无处不在,比如我们的搜索引擎中搜索排序。本文详细介绍了常见的八种排序算法,并附有C++源码实现。最后,针对各种排序算法的性能,进行了比较和分析。 阅读全文
摘要:
本文介绍了Python的几个特殊的函数,包括列表方法的三驾马车filter、map和reduce函数。此外,本文还介绍了Python中装饰器和匿名函数的用法。 阅读全文
摘要:
SVN是Subversion的简称,是一个开放源代码的版本控制系统,相较于RCS、CVS,它采用了分支管理系统,它的设计目标就是取代CVS。本文介绍了SVN的工作机制,并对常见的SVN命令进行了汇总。 阅读全文
摘要:
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的分类。 阅读全文
摘要:
总结Linux下Mysql的简单操作,万事熟能生巧,多学多用就能轻松驾驭Mysql语句。 阅读全文
摘要:
生活中很多场合需要用到分类,比如新闻分类、病人分类等等。 本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法。一、病人分类的例子 让我从一个例子开始讲起,你会看到贝叶斯分类器很好懂,一点都不难。 某个医院早上收了六个门诊病人,如下表。 ... 阅读全文
摘要:
使用机器学习方法解决问题时,有较多模型可供选择。 一般的思路是先根据数据的特点,快速尝试某种模型,选定某种模型后, 再进行模型参数的选择(当然时间允许的话,可以对模型和参数进行双向选择) 因为不同的模型具有不同的特点, 所以有时也会将多个模型进行组合,以发挥"三个臭皮匠顶一个诸葛亮的作用", ... 阅读全文
摘要:
推荐系统中最常用的算法叫做协同过滤(Collaborative Filtering),协同过滤属于社会计算的一种。协同过滤常常被用于分辨某位特定顾客可能感兴趣的东西,这些结论来自于对其他相似顾客对哪些产品感兴趣的分析。协同过滤以其出色的速度和健壮性,在全球互联网领域炙手可热。本文详细地剖析了协同过滤算法,并利用MATLAB进行了仿真,希望对初学者有帮助。 阅读全文
摘要:
1 字符串匹配 字符串匹配是计算机的基本任务之一。 字符串匹配是什么?举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"? 许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一... 阅读全文
摘要:
本文主要介绍了如何利用Python Django来进行简单的Web开发。本文通过两个简单的实例Hello World和current time来展示,如何在Django环境下进行简单web页面的编写。 阅读全文
摘要:
在没有接触互联网这个行业的时候,我就一直很好奇网站是怎么构建的。现在虽然从事互联网相关的工作,但是也一直没有接触过Web开发之类的东西,但是兴趣终归还是要有的,而且是需要自己动手去实践的。Web开发的途径有好多种,比如传统的.Net,还有很火爆的Java。Python作为一种灵活好学的脚本语言,已经越来越受程序员的欢迎和热捧,甚至成为程序员的必备技能。Django是Python的Web开放框架,好多人说学习Python就是在学Django,从这也可以看出Django的强大。博主也是刚刚接触Django,纯属个人兴趣爱好,望与广大博友共同学习和讨论。 阅读全文
摘要:
本文介绍了数据库查询语言SQL以及它的一些基本操作,其中包括选择操作、插入操作、删除操作、更新操作等。本文配有大量实例,通俗易懂,适合于SQL入门的同学阅读。 阅读全文
摘要:
本文用几个实例讲述了在Python中如何进行MySQL的安装和使用,其中包括数据库的连接、表的创建、插入、查询以及更新等操作。最后还简单介绍了数据库的事务机制,并对Python中的MySQL模块的常用函数进行了汇总。 阅读全文
摘要:
本文详细地介绍了Hadoop的基本内容和框架,包括Hadoop是什么,Hadoop能做什么以及Hadoop的两个核心模块——HDFS和MapReduce。本文比较适合初学Hadoop的同学阅读。 阅读全文