[转]数据分析与挖掘_写代码,最难的还是数据结构的规划

原帖地址:http://my.oschina.net/luckystar/blog/65423 你说函数吧,好写。测都好测。连手写DSP优化汇编都是体力活。 你说架构吧,也好规划。琢磨琢磨数据流向的分析,规划规划模块之间的距离和耦合情况。 你说数学原理吧,推得出来也就出来,数学难题,前人证不出来的,我也不指望能仰天长思, 掐指一轮,用中国版的云计算折腾出来。 现在难就难在数据结构的规划。 代码,我的感觉,60%的逻辑都是围绕着数据存储结构来服务的。而不是算法本身的逻辑。 算法是忒抽象,“总存在一个最大值,当这个最大值。。。。”但落到工程,不同的存储结构, 有不同的最大值的优化实现方案。更别说为了这些预期的优化方案而折腾的辅助数据空间的结构化。数据结构规划不好,无法足够统一,要么后面的设计算法实现,有得改,有得调。要么额外多处一堆数据关联性逻辑。 暂时还不知道,理论在实际工程化中,多出来的这些思考问题的存在原因是什么?? 所以我暂时还找不到一个合理科学的方法能快速有效的论证基于具体工程环境下,理论算法的实现规划方案。 搞理论的不CARE工程。搞工程的,不CARE理论。。。。。。。 大学,研究所真应该开一个课题,理论和工程化的联系方法论的研究。。讨论一下,抽象理论,在实际工程化过程中,会遇到的问题,解决的方式,可处理问题的边界范围。
posted @ 2012-08-12 17:32  Blackfin537  阅读(165)  评论(0编辑  收藏  举报