12 2010 档案

摘要:在看我这篇文章之前,先看看关于KDJ的相关资料和背景。下面的链接可以参考。http://www.shenmeshi.com/Business/Business_20070523005553.html简单的说,KDJ 有四个要计算的东西。RSV ,K, D, JRSV: 中文翻译过来就是 未成熟值,这个值实际上也不神秘。它其实就是著名的威廉指数。计算公式如下:设:周期为 PeriodRSV[i] = (close[i] - low[i, Period]) / (high[i, Period] - low[i, Period])这个计算也是这个指标的核心部分,K D J 这三个参数都依赖与 RSV 阅读全文
posted @ 2010-12-27 21:48 暮夏 阅读(2492) 评论(0) 推荐(0) 编辑
摘要:很多时候,一个字符串,你很难检测它的编码。是理论上就不行,比如一个字符串,你把他当作一个utf8的编码是一个汉字串,把他当成gb2312 还是一个汉字出串,而且在字库里面都存在。所以,我们检查也只能是说,大部分能检测出来。 我遇到的问题是这样的,百度搜索引擎的中关键字的问题。http://www.baidu.com/s?tn=159sifu_pg&wd=%E8%83%8E%E6%95%99%E9%9F%B3%E4%B9%90%E6%AC%A3%E8%B5%8F 在大多数情况下,百度默认编码是gb2312的,如果是utf8会加一个ie字段。但是比如在好hao123里面搜索的,或者其他地方搜索然后 阅读全文
posted @ 2010-12-20 18:46 暮夏 阅读(8793) 评论(0) 推荐(1) 编辑
摘要:编码问题的确非常的棘手。很多时候,你一不小心,在某个阶段没有正确的转码,结果造成存储下来的文件 或者 保存进入数据库的字段是乱码。如果这个字段是非常重要的信息,你可能认为,你已经无法恢复这些信息了,其实,在大多数情况下面这个是能够恢复的,你要分析你转码的每个过程,确定出差错的位置,然后进行这个编码的逆转。这里我只举一个我实际中遇到的一个例子。这个例子的情况是这样的,我在cookie里面保存了一个username字段,写cookie是通过PHP程序写的,这个PHP程序的编码是gbk的。另外一个统计系统,这个统计系统,通过Javascript 读取cookie信息,然后通过url编码这些信息,发送 阅读全文
posted @ 2010-12-17 19:15 暮夏 阅读(1365) 评论(0) 推荐(0) 编辑
摘要:钻研PHP很多年,想总结一下自己,但是不知从何说起,那就先谈一些我知道的PHP的用法,这些用法很多有多年的工作经验的人可能都不知道。实际中可能用不到,但是用到了,就是体现你实力的时候。现在问题是这样的,一个用户,用的是windows 的虚拟服务器,然后呢,当打开一个页面的时候,要并行的抓取大概10个网站的标题显示出来。这样的用法很少见,但是,有需求,就得解决。串行是一个解决方案,但是要等待的时间过长。于是我想到用curl 去并行抓取。不知道的可以参考这篇文章PHP多线程(四) 内部多线程 但是,最后发现,那个虚拟服务器上没有curl,这真是让人纠结。于是,我决定改变思路,用单个线程也实现多个线 阅读全文
posted @ 2010-12-15 14:03 暮夏 阅读(3734) 评论(1) 推荐(1) 编辑
摘要:周末的时候看到腾讯的空间里面写日志的时候能自动提取关键字,感觉这个功能非常的好,于是我自己准备也写一个。因为,提取关键字,肯定要涉及分词,现在的分词算法,最好的估计是统计算法,但是实现稍微复杂一点,用PHP的话,性能往往也不够。于是,我一切从简,争取星期天一天能写完这个工具。 我翻了一下最简单的分词,好像就是向前最大匹配。而且如果字典好的话,据说准确率还挺高的。当然,我没有什么好字典,从中科院的分词软件里面,拿了一本字典。大概有10万的词汇量。当然,你可以用其他的字典,但是一定要有词频。 当然,只是简单的分词,算法没有什么好说的,我就说说我写的时候遇到的问题。1. 字典管理。本来我想把字典先读 阅读全文
posted @ 2010-12-06 14:36 暮夏 阅读(13345) 评论(11) 推荐(1) 编辑

点击右上角即可分享
微信分享提示