摘要: Logistic回归算法优缺点:1.计算代价不高,易于理解和实现2.容易欠拟合,分类精度可能不高3.适用数据类型:数值型和标称型算法思想:其实就我的理解来说,logistic回归实际上就是加了个sigmoid函数的线性回归,这个sigmoid函数的好处就在于,将结果归到了0到1这个区间里面了,并且s... 阅读全文
posted @ 2014-11-24 00:30 mrbean 阅读(15533) 评论(2) 推荐(1) 编辑
摘要: Evaluate Reverse Polish Notation题目描述:Evaluate the value of an arithmetic expression in Reverse Polish Notation.Valid operators are +, -,, /. Each oper... 阅读全文
posted @ 2014-11-23 13:34 mrbean 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 一、题目来源: 这个题目的由来是周围有人讨论到去面试(某8)的时候遇到了这个问题。另外正好HIT有个视频也有这个内容,故记录一下:二、题目描述: 该人面试的时候问的是:如何从二进制文件中等概率取整数? 这个题目说的有点不清楚实际上是:一个二进制文件中有好多好多整数,你要随机取出一个。三、题目分析 这... 阅读全文
posted @ 2014-11-21 16:40 mrbean 阅读(5434) 评论(3) 推荐(1) 编辑
摘要: 题目概述:Suppose a sorted array is rotated at some pivot unknown to you beforehand.(i.e., 0 1 2 4 5 6 7 might become 4 5 6 7 0 1 2).Find the minimum eleme... 阅读全文
posted @ 2014-11-20 11:46 mrbean 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 贝叶斯的应用过滤垃圾邮件贝叶斯分类器的著名的应用就是垃圾邮件过滤了,这方面推荐想详细了解的可以去看看《黑客与画家》或是《数学之美》中对应的章节,贝叶斯的基础实现看这里数据集两个文件夹,分别是正常邮件和垃圾邮件,其中各有25封邮件测试方法从50封邮件中随机选取10封做为测试数据实现细节1.首先我们需要... 阅读全文
posted @ 2014-11-19 00:06 mrbean 阅读(5031) 评论(1) 推荐(3) 编辑
摘要: 题目描述:Design a stack that supports push, pop, top, and retrieving the minimum element in constant time.push(x) -- Push element x onto stack.pop() -- Re... 阅读全文
posted @ 2014-11-18 16:28 mrbean 阅读(1359) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯算法优缺点优点:在数据较少的情况下依然有效,可以处理多类别问题缺点:对输入数据的准备方式敏感适用数据类型:标称型数据算法思想:朴素贝叶斯比如我们想判断一个邮件是不是垃圾邮件,那么我们知道的是这个邮件中的词的分布,那么我们还要知道:垃圾邮件中某些词的出现是多少,就可以利用贝叶斯定理得到。朴素... 阅读全文
posted @ 2014-11-17 00:28 mrbean 阅读(7857) 评论(2) 推荐(3) 编辑
摘要: 决策树算法优缺点:优点:计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关的特征数据缺点:可能会产生过度匹配的问题适用数据类型:数值型和标称型算法思想:1.决策树构造的整体思想:决策树说白了就好像是if-else结构一样,它的结果就是你要生成这个一个可以从根开始不断判断选择到叶子节... 阅读全文
posted @ 2014-11-15 15:45 mrbean 阅读(30656) 评论(1) 推荐(3) 编辑
摘要: kNN算法算法优缺点:优点:精度高、对异常值不敏感、无输入数据假定缺点:时间复杂度和空间复杂度都很高适用数据范围:数值型和标称型算法的思路:KNN算法(全称K最近邻算法),算法的思想很简单,简单的说就是物以类聚,也就是说我们从一堆已知的训练集中找出k个与目标最靠近的,然后看他们中最多的分类是哪个,就... 阅读全文
posted @ 2014-11-14 19:28 mrbean 阅读(7163) 评论(0) 推荐(0) 编辑
摘要: 函数名: fscanf简述:C语言中基本的文件操作功 能: 从一个流中执行格式化输入,fscanf遇到空格和换行时结束,注意空格时也结束。这与fgets有区别,fgets遇到空格不结束。简单的说就是从文件中读取输入,而不是控制台,也是返回成功读取数。文件 t.txt(空格分隔也行)1 dad2 43... 阅读全文
posted @ 2014-09-02 16:07 mrbean 阅读(405) 评论(0) 推荐(0) 编辑
摘要: 题目描述:一个N*M的矩阵,找出这个矩阵中所有元素的和不小于K的面积最小的子矩阵(矩阵中元素个数为矩阵面积)输入:每个案例第一行三个正整数N,M 5 #include 6 #include 7 using namespace std; 8 int main() 9 {10 //freopen... 阅读全文
posted @ 2014-06-29 14:34 mrbean 阅读(2306) 评论(0) 推荐(1) 编辑
摘要: 题目描述:给定n,a求最大的k,使n!可以被a^k整除但不能被a^(k+1)整除。输入:两个整数n(2 2 #include 3 #include 4 using namespace std; 5 int su[168] = {2,3,5,7,11,13,17,19,23,29,31,37,41,4... 阅读全文
posted @ 2014-06-27 21:02 mrbean 阅读(2513) 评论(0) 推荐(0) 编辑
摘要: python调用Shell脚本,有两种方法:os.system(cmd)或os.popen(cmd),前者返回值是脚本的退出状态码,后者的返回值是脚本执行过程中的输出内容。所以说一般我们认为popen更加强大os.system(cmd):该方法在调用完shell脚本后,返回一个16位的二进制 数,低... 阅读全文
posted @ 2014-06-26 23:52 mrbean 阅读(19118) 评论(4) 推荐(1) 编辑
摘要: 1. Python是一门解释型语言?我初学Python时,听到的关于Python的第一句话就是,Python是一门解释性语言,我就这样一直相信下去,直到发现了*.pyc文件的存在。如果是解释型语言,那么生成的*.pyc文件是什么呢?c应该是compiled的缩写才对啊!为了防止其他学习Python的... 阅读全文
posted @ 2014-05-30 01:22 mrbean 阅读(462) 评论(0) 推荐(0) 编辑
摘要: 关于ends是C++中比较基础的一个东西,但是可能不是每个人都能够清楚的理解这是个什么东西,我就经历了这么一个过程,写出来让大家看看,有什么理解的不对的地方欢迎拍砖。今天以前我对ends的理解是:输出空格的工具,或者说这就是一个逼格比较高的“ ”。(这貌似是拜老师所赐,特地翻出课件发现就是这么写的,... 阅读全文
posted @ 2014-05-26 00:29 mrbean 阅读(5361) 评论(8) 推荐(5) 编辑
摘要: 首先你需要安装上mysql和MySQLdb模块(当然还有其他模块可以用),这里我就略过了,如果遇到问题自行百度(或者评论在下面我可以帮忙看看)这里简单记录一下自己使用的学习过程:一、连接数据库 MySQLdb提供了connect函数,使用如下 cxn=MySQLdb.Connect(host='... 阅读全文
posted @ 2014-05-24 00:12 mrbean 阅读(2361) 评论(0) 推荐(1) 编辑
摘要: 写这篇的主要目的是记录一点mysql的基本使用方法,当然sql查询语句本来就有不少东西,这里就不一一介绍,这个网址有详细的教程(http://www.sdau.edu.cn/support/mysq_doc/manual_Tutorial.html)1、登陆mysql -h 主机名 -u 用户名 -... 阅读全文
posted @ 2014-05-20 16:29 mrbean 阅读(287) 评论(0) 推荐(0) 编辑
摘要: 今天实现二叉搜索树的时候因为指针的问题卡了一上午(实在不应该。。。),一直segmentation fault,个人感觉还是需要记录一下的。首先贴一下做的题的意思:输入一系列整数,建立二叉排序数,并进行前序,中序,后序遍历。(jobdu 1201)题目很简单,就是基本的二叉树的建立,最后代码如下 ... 阅读全文
posted @ 2014-05-19 15:31 mrbean 阅读(469) 评论(0) 推荐(0) 编辑
摘要: 由于用ubuntu的时候装了几个ubuntukylin的软件(像搜狗拼音for linux),于是最近总是蹦出一个红色的三角提示,说无法更新,虽说不影响使用但是还是很不爽。解决方法记录如下:进入系统设置-软件更新-其他软件,找到ubuntukylin的项目,点击编辑,把precise改成trusty... 阅读全文
posted @ 2014-05-19 11:06 mrbean 阅读(2040) 评论(0) 推荐(0) 编辑
摘要: 既然能够用python解析rss,那么也顺带研究下生成rss。其实很简单,只是生成一个比较特殊点的xml文档而已。这里我使用了PyRss2Gen,用法很简单,看代码就知道了,如下: 1 import datetime 2 import PyRSS2Gen 3 4 rss = PyRSS... 阅读全文
posted @ 2014-05-16 16:00 mrbean 阅读(3395) 评论(0) 推荐(1) 编辑
摘要: 虽然说当今的博客已经不像前几年那么火了,但是RSS还是一项很有创造性和实用性的东西。RSS 是用于分发 Web 站点上的内容的摘要的一种简单的 XML 格式。它能够用于共享各种各样的信息。关于RSS的详细信息在(http://www.rssboard.org/rss-profile),这里面详细的讲... 阅读全文
posted @ 2014-05-15 23:59 mrbean 阅读(11103) 评论(1) 推荐(3) 编辑
摘要: 我好读书,读的很繁杂,从计算机技术到历史到国学和哲 学,系统方法论等都是我爱好读的。 但平时工作忙,尽管每天都坚持挤出一到两个小时的读书时间(牺牲睡眠时间),但读书时间与要读书的意愿上一直存在着矛盾,这意味着我需要高效率地读书。而 我想,我的阅读能力可能得益于《如何阅读一本书》,一本讲“元阅读”的书... 阅读全文
posted @ 2014-05-14 23:14 mrbean 阅读(303) 评论(0) 推荐(0) 编辑
摘要: 摘要这篇文章从如何阅读书籍出发,简单讨论了如何选择书籍、是否阅读原版和阅读数量这几个常见问题,然后自己的阅读问题进行了分析和总结。注意“如何阅读”指“What to read”而非“How to read”,Mortimer J. Adler的怎样阅读一本书对How to read有着精彩的描述。“... 阅读全文
posted @ 2014-05-14 23:13 mrbean 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 最近需要从多个excel表里面用各种方式整理一些数据,虽然说原来用过java做这类事情,但是由于最近在学python,所以当然就决定用python尝试一下了。发现python果然简洁很多。这里简单记录一下。(由于是用到什么学什么,所以不算太深入,高手勿喷,欢迎指导)一、读excel表读excel要用... 阅读全文
posted @ 2014-05-09 00:25 mrbean 阅读(161853) 评论(9) 推荐(20) 编辑
摘要: 最近学习python,想要找点练习,在看《python核心编程》(真是一本好书,非常详细,觉得看这一本书就够了,余下可以翻翻文档)。觉得cf之类的虽然能用python提交但是重点不是在学习python上 。终于找到了两个不错的网站checkio和pythonchallenge。今天先看看了看chec... 阅读全文
posted @ 2014-05-07 00:51 mrbean 阅读(937) 评论(0) 推荐(1) 编辑
摘要: 一、创建命令 1、克隆一个git仓库 git clone 地址 2、建立一个新的本地git仓库 git init二、本地修改命令 1、查看仓库当前状态 git status 2、查看文件与上一个版本的差异 git diff 3、将修改加入暂存区 git add... 阅读全文
posted @ 2014-05-02 11:25 mrbean 阅读(364) 评论(0) 推荐(0) 编辑
摘要: 题目描述: Implement int sqrt(int x). Compute and return the square root of x. 实现开根号,并且返回整数值(这个很重要,不是整数的话就有一种方法用不了了) 方法一:二分法,另外由于我们知道开根号的结果肯定小于等于这个数的二分之一,所 阅读全文
posted @ 2014-04-22 00:42 mrbean 阅读(412) 评论(0) 推荐(0) 编辑
摘要: 问题描述:Given a non-negative number represented as an array of digits, plus one to the number.The digits are stored such that the most significant digit ... 阅读全文
posted @ 2014-04-21 23:54 mrbean 阅读(355) 评论(0) 推荐(0) 编辑
摘要: 题目描述:Single NumberGiven an array of integers, every element appears twice except for one. Find that single one.Note: Your algorithm should have a line... 阅读全文
posted @ 2014-04-20 00:14 mrbean 阅读(756) 评论(0) 推荐(0) 编辑
摘要: 题目描述:Given an integer, convert it to a roman numeral.Input is guaranteed to be within the range from 1 to 3999.这道题的意思是将数字换算成罗马数字的表示形式,当然首先我们要理解罗马数字的编码... 阅读全文
posted @ 2014-04-19 00:27 mrbean 阅读(245) 评论(0) 推荐(0) 编辑
摘要: 题目描述:There areNchildren standing in a line. Each child is assigned a rating value.You are giving candies to these children subjected to the following ... 阅读全文
posted @ 2014-04-18 00:24 mrbean 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 题目描述:Reverse digits of an integer.Example1:x = 123, return 321Example2:x = -123, return -321很简单的题目其实用个数组就能解决了,不过用了一下queue,注意负数的情况。 1 class Solution { ... 阅读全文
posted @ 2014-04-15 10:36 mrbean 阅读(205) 评论(0) 推荐(0) 编辑
摘要: 题目描述:Given a sorted array, remove the duplicates in place such that each element appear onlyonceand return the new length.Do not allocate extra space ... 阅读全文
posted @ 2014-04-14 21:11 mrbean 阅读(283) 评论(0) 推荐(0) 编辑
摘要: 今天第一次在leetcode上提交了一个题目,据说这个网站基本上都是名企面试笔试题,今天无意一进去就看到第一题居然就是昨天的腾讯实习生笔试题,赶紧注册了个账号做题。题目描述:Given an input string, reverse the string word by word.For exam... 阅读全文
posted @ 2014-04-14 00:31 mrbean 阅读(1253) 评论(0) 推荐(0) 编辑
摘要: 想起来用笔记本连接一个windows server时只需要在远程桌面连接里面输入一下ip地址然后账号密码就可以了,十分简单。于是乎既然装了个Ubuntu当服务器使那么我就业来远程连接一下,由于windows和linux使用的远程连接方式不一样,windows的是基于xrdp的,但是linux默认不是,于是我们要先安装xrdp、sudo apt-get install xrdp这个时候就可以连接了,打开windows的远程桌面连接会出现一个输入账号密码的界面,但是登进去之后我们发现除了壁纸基本没什么,当然这并不是不支持连接,只是有些设置还没设置好。我们重新回到服务器,打开终端,输入sudo ap 阅读全文
posted @ 2014-04-11 23:20 mrbean 阅读(730) 评论(0) 推荐(0) 编辑
摘要: 1.无论做研究还是做工程,不要期待导师给你太多的指导,这点全世界都一样,不要抱怨,独立解决问题的能力就是这样锻炼出来的。好的导师能够在大方向上给一些意见,但具体的工作是需要自己去做的。2.别人没有义务来帮助你,不管是师兄或同学,最可靠的人永远是自己。别人帮助你,要表示感谢,并努力帮助别人。别人不帮助你,也不要抱怨。3.不要抱怨课程无聊,老师讲的不好。读到研究生,自学能力没有的话不如退学。4.研究生毕业不见得能找到好工作,好工作是给能力强的人,不是给学历高的人,见到nb的本科生,也要虚心学习。研究生期间应该做的事情:1.养成锻炼身体的习惯,30以前你找病,30以后病找你。2.如果你学的专业,中国 阅读全文
posted @ 2014-04-11 21:35 mrbean 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 今天蛋疼了一下,在Ubuntu下装了一下php的环境,也就是装了一下MySQL、PHP、Apache。话说还真是简单。。。不禁让我想起原来在windows下开发的时候撑死就是装不上,而且一个就是几个G。。。最后还是用了easyPHP(但是真心好用啊,强烈推荐)Ubuntu强大的包管理工具让我们通过几条命令就能安装好环境 1 #安装mysql 2 3 sudo apt-get install mysql-server 4 5 #这个完成后会有一个要求输入root用户密码的部分 6 7 sudo apt-get install mysql-client 8 9 #安装apache10 11... 阅读全文
posted @ 2014-04-11 21:20 mrbean 阅读(3843) 评论(0) 推荐(0) 编辑
摘要: 题目描述:给定一个数字N,打印从1到最大的N位数。看起来像是很简单的问题(虽然实际也不是很难。。。)我们很容易写出这样的代码: 1 #include 2 #include 3 4 int a[]={9,99,999,9999,99999}; 5 using namespace std; 6 int main() 7 { 8 int N; 9 cin>>N;10 for(int i=1;i 2 #include 3 #include 4 long long a[]={9,99,999,9999,99999,999999,9999999}; 5 char c[100];... 阅读全文
posted @ 2014-04-11 12:59 mrbean 阅读(575) 评论(0) 推荐(0) 编辑
摘要: 现今存在的开源协议很多,而经过Open Source Initiative组织通过批准的开源协议目前有58种(http://www.opensource.org/licenses/alphabetical)。我们在常见的开源协议如BSD, GPL, LGPL,MIT等都是OSI批准的协议。如果要开源... 阅读全文
posted @ 2014-04-11 09:10 mrbean 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 一、用途 矩阵的一个重要的用途是进行递归是的计算,最明显的就是快速求数列的某一项的值。本文也是主要讲解这种算法的。二、样例 这方面最简单的就是斐波那契问题了,这个相信是每一位程序员都熟知的,这里就不介绍了。三、快速幂 既然是快速计算那肯定是不能去一步一步慢慢求,这里我们要用到二分的思想。求快速... 阅读全文
posted @ 2014-04-11 00:57 mrbean 阅读(6760) 评论(1) 推荐(3) 编辑