代码改变世界

最新研究表明人类的智力正在退化

2012-11-14 17:37 by vlnk, 322 阅读, 0 推荐, 收藏, 编辑
摘要:[导读]最新研究称,自从数千年前我们开始了愚钝的农垦生活之后就失去了变得更聪明的进化压力,人类的智力或许正在逐渐的出现退化。 腾讯科学讯(过客/编译)发表于11月12日《遗传学趋势》杂志上的这项研究辩论称自从数千年前我们开始了愚钝的农垦生活之后就失去了变得更聪明的进化压力。斯坦福大学的一位研究人员也是这项研究的合著者杰拉德-克拉布特里在一份声明中说道:“我们的智力发展和数千种智力基因的最佳化或许... 阅读全文

数据、信息与知识、思想之间的关联

2012-11-14 17:17 by vlnk, 641 阅读, 0 推荐, 收藏, 编辑
摘要:信息,抽象的说,就是可信的数据。那么这里和数据最大的区别就在于,一个是客观,一个是主观。例如你用尺子量桌子长宽。那么的出的值是数据。这是客观存在的,无论你的尺子是英制还是公制。但对于你而言,你实际上,不会 关心实际的长度。通常你会说,我需要个更长的桌子,或者这个桌子,家里放不下,太大了,得买个小的。你不会说,小二,来两尺的桌子。这种主观对客观数据的接受和再描述,就是信息。信息是主观的,数据是客观的抽象表征符号。信息时是数据内涵的意义,数据是对客观对象的表示。数据泛指对客观事物的数量、属性、位置及其相互关系的抽象表示。数据要通过人们约定俗成的字符和定义表现出来。不同国家的人对于关键词的约定必然会 阅读全文

大数据分析师

2012-11-14 17:16 by vlnk, 376 阅读, 0 推荐, 收藏, 编辑
摘要:在整个数据行业里面,ParAccel是久负名气的。他们通过了一些渠道获得不少犯罪数据,并对15000个有犯罪前科的人进行跟踪,从而向执法机构提供了参考性较高的犯罪预测。 ParAccel颠覆了Hadoop的神话。ParAccel的CEO Chuck Berger指出,太多创业公司陷入了“大数据=非结构化数据的大数据=Hadoop”的逻辑。除了非结构化数据和半结构化数据以外,结构化数据也在快速增长... 阅读全文

建模分析

2012-11-14 17:13 by vlnk, 458 阅读, 0 推荐, 收藏, 编辑
摘要:因素之间存在着相互依赖又相互制约的关系,通常是复杂的非线性关系。 为了分析其相互作用机制,揭示内部规律,可根据理论推导,或对观测数据的分析,或依据实践经验,设计一种模型来代表所研究的对象。 模型分析 数据分析和模型 Codd根据处理数据的范围、用户-分析人员的交互需要、多维分析需求及现有工具的支持等因素,将数据分析模型分为四种模型: 1.绝对模型(categorical model); ... 阅读全文

信息检索和网络数据挖掘领域中常用模型和基础技术

2012-11-14 17:00 by vlnk, 277 阅读, 0 推荐, 收藏, 编辑
摘要:来源: ChinaKDD 引子: 对于这个领域的博士生来说,看懂论文是入行了解大家在做什么的研究基础,通常我们会去看一本书。看一本书固然是好,但是有一个很大的缺点:一本书本身自成体系,所以包含太多东西,很多内容看了,但是实际上却用不到。这虽然不能说是一种浪费,但是却没有把有限力气花在刀口上。 我所处的领域是关于网络数据的处理(国际会议WWW, SIGIR, CIKM, WSDM, ACL, ... 阅读全文

数据挖掘七步走

2012-11-14 16:58 by vlnk, 372 阅读, 0 推荐, 收藏, 编辑
摘要:来源:网易博客 写写我对数据挖掘过程的体会吧! Step1.商业理解 就是商业问题的理解了,那么如何更好的理解“老大”提出的商业问题困惑呢?我觉得思维导图倒是个不错的选择,当然自己要想更好的理解“老大”的意思还需要进一步的沟通,商业问题的理解关系到这个挖掘项目的价值,甚至成败,所以在这块大家要显得“外向”一些,多交流、多沟通、多了解这个商业问题背后的东东; step2.字段提取... 阅读全文

常规商业问题分析的角度

2012-11-14 16:57 by vlnk, 244 阅读, 0 推荐, 收藏, 编辑
摘要:来源:一休论坛 统计分析给您以先机,分析报告给您后见之明,数据挖掘给您以洞察,数据挖掘--市场调研--统计分析构成企业日常商业分析的完美循环。 1、多维度分析:从多个不同的角度及其组合去分析数据; 2、趋势分析:从时间序列分析随时间的变化趋势,找出其规律,如移动平均、同比、环比等; 3、意外分析:从大量历史数据中找出太高、太低、变化幅度过大等异常情况数据,支持预警显示、... 阅读全文

大数据三两事之大数据不是只有Hadoop

2012-11-14 16:55 by vlnk, 580 阅读, 0 推荐, 收藏, 编辑
摘要:来源:商业价值 这里主要讲大数据应用场景以及和传统方案的区别等,希望能够帮大家理清些大数据的概念性问题。 上图中,精确数据是指每条数据都有着准确的含义和确定的价值,表达很明确的信息。比如,制造业的一条生产记录。传统关系型数据库以处理这类数据。并基于此类数据通过复杂逻辑分析推演出业务价值为强项。 大数据时代数据的特点是大量模糊数据。单条数据没有确定的价值和明确的含义。比如,一个网页... 阅读全文

Teradata分析架构服务整合所有类型的数据

2012-11-14 16:54 by vlnk, 335 阅读, 0 推荐, 收藏, 编辑
摘要:源自:IT专家网 导语: Teradata咨询服务部副总裁Dave Klumb表示:“当业务数据分析与业务优先级一致时,企业就可以凭借明确的信息做出决策。如果二者不一致,那么企业就会不可避免地基于不完整的信息做出决策,或者基于对所发生的事及其原因的错误理解做出决策。”为了能够统一客户看待业务、信息、应用和系统的视图,Teradata新推出的分析架构服务,试图通过提供一套新的、基于特定行业的解决... 阅读全文

行业跟踪画布和竞品分析画布

2012-11-14 16:52 by vlnk, 5230 阅读, 0 推荐, 收藏, 编辑
摘要:如果决定做一款产品,那么分析一下这个产品所处的行业及发展状况是非常有必要的。我们需要知道这个行业的具体情况,从而定位我们的产品,产品所处的行业在很大程度上决定了产品最终的发展状况。 做行业分析,我们要重点分析下面几个问题:行业是朝阳行业还是夕阳行业?市场是红海还是蓝海?这个行业经历了几次发展,有哪些重要的转折点?是否有技术变革的趋势?有哪些新趋势能够带来行业变化? 行业跟踪画布 行业分析的最... 阅读全文