上一页 1 2 3 4 5 6 7 ··· 10 下一页

2015年3月10日

摘要: 统计建模和工程开发很相似。在工程开发中,人们有多种方法搭建一套键-值存储系统,每种设计针对使用模式有一套不同的假设。在统计建模中,也有很多算法来构造一个分类器,每种算法对数据也有各自的假设集合。当处理少量数据时,因为实验成本很低,我们尽可能多的尝试各种算法,从而选出效果最优的算法。但提到“大数据”,... 阅读全文
posted @ 2015-03-10 15:08 KK4SBB 阅读(311) 评论(0) 推荐(0) 编辑

2015年3月1日

摘要: stackoverflow上看到的一个回答,概念性介绍为主,总结的不错。主要就是两种,礼貌的做法是在robots.txt文件中设置允许爬虫爬取的内容;粗暴的做法又分为两种,一种是过滤user agent,另一种是布设一个陷阱,一旦该链接被请求,就认为这是爬虫的行为。原答案在这里,暂时先把原文搬过来,... 阅读全文
posted @ 2015-03-01 14:22 KK4SBB 阅读(834) 评论(0) 推荐(0) 编辑
 
摘要: 主要就是用了两个库,urllib和BeautifulSoup.作用是从HTML中解析出解梦的查询词和具体的解释。 1 # -*- coding: utf-8 -*- 2 import urllib, urllib2 3 import time, random 4 from BeautifulSoup... 阅读全文
posted @ 2015-03-01 13:46 KK4SBB 阅读(276) 评论(0) 推荐(0) 编辑
 
摘要: 1 # list元素求和2 sum = reduce(lambda x,y: x+y, mylist)1 # 比较两个 lists 的元素是否完全一致2 if all(x==y for x, y in zip(X, Y))3 do something1 # 按照 key 排列字典的元素,以... 阅读全文
posted @ 2015-03-01 13:37 KK4SBB 阅读(546) 评论(0) 推荐(0) 编辑

2015年1月11日

摘要: 很久以前写的一段代码。医学院某个实验室有一系列电子显微镜拍摄的细胞照片,他们需要人工统计每张图片里细胞的数目,对比前后照片来分析药物对组织产生的影响。人工计数的工作量太庞大了,于是他们找我们实验室合作。这个问题本质上就是一个图像分割的问题,把照片中的每个细胞分割开,然后求一下连通域的个数就好。% i... 阅读全文
posted @ 2015-01-11 17:09 KK4SBB 阅读(2897) 评论(3) 推荐(0) 编辑

2014年3月4日

摘要: 背景介绍 图像拼接是一项应用广泛的图像处理技术。根据特征点的相互匹配,可以将多张小视角的图像拼接成为一张大视角的图像,在广角照片合成、卫星照片处理、医学图像处理等领域都有应用。早期的图像拼接主要是运用像素值匹配的方法。后来,人们分别在两幅图像中寻找拐点、边缘等稳定的特征,用特征匹配的方法拼接图像。本 阅读全文
posted @ 2014-03-04 01:36 KK4SBB 阅读(13175) 评论(9) 推荐(6) 编辑
 
摘要: 螃蟹的分类这个例子的目的是根据螃蟹的品种、背壳的长宽等等属性来判断螃蟹的性别,雄性还是雌性。训练数据一共有六个属性: species, frontallip, rearwidth, length, width and depth.这里每个属性所对应的是螃蟹哪一部分的真实性状并不是关键。我们关心的只是已知样本是6维的向量,输出是0/1值,求分类效果最好的网络模型。首先载入样本数据[x,t] = crab_dataset;% size(x) = [6, 200];% size(t) = [2, 200];然后初始化神经网络例子里使用含有一层隐含层的模型,隐含层有10个神经元。调用Matlab的p. 阅读全文
posted @ 2014-03-04 01:20 KK4SBB 阅读(10839) 评论(0) 推荐(2) 编辑

2014年2月28日

摘要: 前两天想写一段自动提取微博状态的代码。据我所知,实现这个功能即可以用PHP写,也可以用Java写。我认为用Java写调试方便一点,PHP的脚本还要上传到服务器什么的。代码很简单的,新建一个java.net包的URL类的对象,以这个url做为写入源,内容保存在字符串中。然后新建一个文件,把字符串写出即可。不过要注意,不同网站使用不同的编码字。现在大多数的网站使用utf-8字符编码,基于wordpress搭建的网站都是使用这种编码字符的。但是,很多中文网站,包括网易等门户网站,还是使用gb2312编码。一方面gb2312的历史比utf-8要久一些,早期的中文网站以gb2312搭建,现在再修改工作量 阅读全文
posted @ 2014-02-28 10:39 KK4SBB 阅读(678) 评论(0) 推荐(0) 编辑
 
摘要: 用eclipse写代码。编译之前,先右键点击项目,选择Build Path->library->add external library, 到MySQL网站下载MySQL的Jdbc驱动,把它添加到项目里,否则会报错“error. java.lang.ClassNotFoundException: com.mysql.jdbc.Driver”。具体的代码如下:Driver.forClass(com.mysql.jdbc.Driver);Connection conn = DriverManager. getConnection(“jdbc:mysql://www.localhost. 阅读全文
posted @ 2014-02-28 10:38 KK4SBB 阅读(312) 评论(0) 推荐(0) 编辑
 
摘要: 1、神经网络设计的流程2、神经网络设计四个层次3、神经网络模型4、神经网络结构5、创建神经网络对象6、配置神经网络的输入输出7、理解神经网络工具箱的数据结构8、神经网络训练1、神经网络设计的流程 神经网络设计可以分为七个步骤: a. 采集数据 b. 创建网络 c. 配置网络参数 d. 初始化权重和偏置 e. 训练神经网络 f. 验证网络 g. 使用网络2、神经网络设计四个层次 这里的层次主要只Matlab的神经网络工具箱和相关命令 a. 第一层是“Getting Started with Neural Network Toolbox”里面提到... 阅读全文
posted @ 2014-02-28 10:32 KK4SBB 阅读(2781) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 10 下一页