MLK
摘要: 写了个图片蜘蛛人玩玩,抓了几个网页试试,感觉不不错。核心的代码可能20行也不到,简洁明了 阅读全文
posted @ 2012-02-22 14:35 emy_yu 阅读(756) 评论(1) 推荐(0) 编辑
摘要: 最近想用中文维基百科的一些文章进行文本分析,于是想爬一些有用的网页下来。起初找了个叫teleport pro的软件,但几经周折还是没找到方法下载指定层的文本(图片可以),而且下下来很多没用的插件,甚是复杂(网上有人说可以实现,但至今未研究明白,还请高手指点!)。于是用python写了段代码获取指定url的网页。这也是第一次接触urllib等库的使用。 阅读全文
posted @ 2012-02-22 11:09 emy_yu 阅读(5800) 评论(1) 推荐(2) 编辑
摘要: 其中的图像旋转是一种常用的数字图像处理技术。由于旋转后图像像素点坐标不再是整数,所以旋转后必须对新的像素点灰度值进行插值运算。目前常用的方法有最近邻插值法、线性插值法和样条插值法。文献介绍,最近邻法速度快,方法简单,但生成图像效果较差;样条插值法计算精度高,效果好,但计算复杂,速度较慢;线性插值法(E.g. 双线性插值法)效果较好,运行时间较短。另外,实现赋值的方法分为正向映射法和反向映射法:正向映射法是指,从原始图像坐标出发,计算出在旋转图像上坐标,然后将原始图像该坐标的灰度值赋给对应旋转图像该坐标点;反向映射法则反之。 本文将分别采用基于最近邻取值的正向映射法、基于最近邻取值的反向映射法、基于双线性插值的反向映射法实现图像旋转,并对比三种方法的效果。 阅读全文
posted @ 2012-02-02 22:16 emy_yu 阅读(22401) 评论(4) 推荐(1) 编辑
摘要: 今年寒假前完成了读研以来的第二篇paper,导师看过后评价:实验结果和图表都不错,but the writing and English have a big big room to improve. 可见自己的英文论文写作功底还欠缺的很,于是今天参考了一篇“How to write a paper” (原文见http://essaystar.com/paper/download/How.To.Write.A.Paper.pdf),总结一下如何开始写英文科技论文。 阅读全文
posted @ 2012-01-29 19:14 emy_yu 阅读(3433) 评论(4) 推荐(5) 编辑
摘要: 最近学习遇到瓶颈,主要是编程水平和专业知识跟不上,发现学习图像处理、模式识别,一开始真不能死钻在一个点上不放,还是要尽可能拓展知识面,包括扎实的数学基础,数学分析,概率论,线性代数,常微分方程,运筹学,控制论,复变函数与积分变换这些学科还是得好好学一下,泛函分析,时间序列,小波分析,抽象代数,分形理论也得有一定了解,对基本的数值分析方法和现代优化算法需要熟练掌握,还有常用的机器学习算法。。。顿时又倍感鸭梨_ 阅读全文
posted @ 2011-04-14 18:38 emy_yu 阅读(13225) 评论(3) 推荐(2) 编辑
摘要: 在图像处理中,首先要对原始图像进行预处理,即将效果较差的图像处理为尽量符合后续工作的有效图像。这一步主要用到了图像增强技术(Image Enhancement)和图像复原技术(Image Restoration)。图像增强是主观的(subjective),没有特定标准需要增强到什么程度,只要满足用户的需求即可;而图像复原是客观的(objective),需要尽可能恢复为原始图像。今天我主要针对图像复原方法做了实验。 阅读全文
posted @ 2011-02-13 00:23 emy_yu 阅读(33676) 评论(6) 推荐(5) 编辑
摘要: 编辑器加载中... int cvWaitKey( int delay=0 ) 参数:delay—延时的毫秒数。 delay0时,延迟"delay"ms,返回值为被按键的值,如果超过指定时间则返回-1。在显示视频时这个函数是有用的,用于设置在显示完一帧图像后程序等待"delay"ms再显示下一帧视频... 阅读全文
posted @ 2011-02-10 21:34 emy_yu 阅读(3881) 评论(0) 推荐(1) 编辑
摘要: C++引入了ostringstream、istringstream、stringstream这三个类,要使用他们创建对象就必须包含sstream.h头文件。   istringstream类用于执行C++风格的串流的输入操作。   ostringstream类用于执行C++风格的串流的输出操作。   strstream类同时可以支持C++风格的串流的输入输出操作。 阅读全文
posted @ 2014-09-16 14:26 emy_yu 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 最近在学习图数据计算方面技术,在寻找现实应用时发现美国Palantir公司已将所谓的多源异构数据融合分析技术运用的炉火纯青。Palantir创立于2004年,最早是因PayPal公司为保障支付安全而逐步建立起来的,当前CIA和FBI都已成为它最忠实的客户。Palantir的技术优势在于能够整合不... 阅读全文
posted @ 2014-08-07 17:11 emy_yu 阅读(1515) 评论(0) 推荐(0) 编辑
摘要: 发现AWK要比Python便捷很多,今天找了篇不错的文章入门学习一下,处理文本的基本方法。 原文来自: 酷 壳 – CoolShell.cn 陈皓博客,http://coolshell.cn/articles/9070.html 阅读全文
posted @ 2014-08-07 12:51 emy_yu 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 很多国内的期刊杂志都只能使用word模板,导致插入参考文献成了件麻烦事,这时特别怀念Latex的便捷。于是找到一篇介绍word2007里插入参考文献的好方法,就是利用尾注的方法使文章的参考文献标号可以随插入位置变化而自动调整,这使我对word模板稍有安慰。 阅读全文
posted @ 2014-08-05 15:06 emy_yu 阅读(4069) 评论(0) 推荐(0) 编辑
摘要: 大规模图数据计算引起了许多知名公司的关注,微软提出了用于图数据匹配的Horton - Querying Large Distributed Graphs(Link:http://research.microsoft.com/en-us/projects/ldg/),Google提出了适合复杂机器学习的分布式图数据计算Pregel框架,但不开源,CMU提出了GraphLab开源分布式计算系统。最近在研究图数据计算问题,找到一篇不错的文章比较Pregel和GraphLab。 阅读全文
posted @ 2014-08-04 17:47 emy_yu 阅读(4462) 评论(0) 推荐(0) 编辑
摘要: AC算法是经典的多模式串精确匹配算法,可以保证对于给定的长度为n的文本,和模式集合P{p1,p2,...pm},在O(n)时间复杂度内,找到文本中的所有目标模式,而与模式集合的规模m无关。本文主要介绍了AC算法的基本过程。 阅读全文
posted @ 2014-06-23 17:24 emy_yu 阅读(594) 评论(0) 推荐(0) 编辑
摘要: Boost Graph library(BGL)是C++提供的应用于图数据处理的函数库,可提供图数据存储、访问、查询及其他高级的挖掘算法。 阅读全文
posted @ 2014-05-27 09:49 emy_yu 阅读(3624) 评论(0) 推荐(0) 编辑
摘要: Boost Graph library(BGL)是C++提供的应用于图数据处理的函数库,可提供图数据存储、访问、查询及其他高级的挖掘算法。本文提供了基本操作的使用范例。 阅读全文
posted @ 2014-05-27 09:48 emy_yu 阅读(2353) 评论(0) 推荐(0) 编辑
摘要: 在vs2010下配置opencv是件痛苦的事情,一点点错误可能就会导致莫名其妙的报错,各种error让人郁闷不已,这里提供给大家一篇vs2010下配置opencv2.4.4的方法,我是64位的win7系统,亲测成功,当然也遇到了一堆的问题,不过在查完各种资料之后都完美解决了,现在奉献给大家。本文的最后附给大家在配置的时候遇到的一些常见问题的解决方法,不保证可以完全解决您遇到的问题,不过大部分都附在下面了。 阅读全文
posted @ 2014-05-21 11:10 emy_yu 阅读(10202) 评论(0) 推荐(0) 编辑
摘要: tesseract ocr挺不好配置的,找到一篇不错的文章,分享如下:http://hi.baidu.com/ever8936/blog/item/6998e1196b1d0161dab4bd8f.html tesseract依赖leptonica,弄一个捣鼓捣鼓,除了官网也没个中文的参考啥的 虽然安装配置过程官网里写的挺清楚,自己还是记一下吧 阅读全文
posted @ 2014-05-21 10:40 emy_yu 阅读(1034) 评论(0) 推荐(0) 编辑