2015年10月30日

集算器如何处理类文本数据计算

摘要: jsonJava有足够多的类库用于解析和生成json,但缺乏后续计算能力。集算器支持多层结构数据,可以不丧失信息地将json解析成可计算的内存数据表进一步处理。设有如下格式的json数据: { “order”:[ { “client”:”北京润乾软件”, “date”:”2015-6-23”, “... 阅读全文

posted @ 2015-10-30 10:02 hivehooker 阅读(314) 评论(0) 推荐(0) 编辑

2015年10月27日

集算器如何处理文本计算——结构化运算

摘要: 读入控制从逗号分隔的有标题结构化文本D.csv中读入4列:name,sex,age,phone;其中phone是全数字但必须读成字符串类型。A1=file(“D.csv”).import@t(name,sex,age,phone:string;”,”)import函数有丰富的参数和选项控制是否有标题... 阅读全文

posted @ 2015-10-27 08:50 hivehooker 阅读(373) 评论(0) 推荐(0) 编辑

2015年10月23日

集算器如何处理文本计算——无结构运算

摘要: 文本可以说是除了数据库外几乎最常见的数据存储形式,针对文本的计算非常重要。然而文本本身没有计算能力,不象数据库有SQL语法,这样对文本的计算就需要借助程序设计语言编码,而大多数用于文本处理的程序语言都没有集合化的,编写批量运算时很繁琐。比如用Java写个很简单地求和运算就要很多行,如果涉及到过滤分组这种运算就需要几百行代码。近年来新出来的perl,python,R等脚本语言在这些方面有所改善,但对批量结构化计算的支持仍然不足,而且集成性也较差。 阅读全文

posted @ 2015-10-23 14:32 hivehooker 阅读(369) 评论(0) 推荐(0) 编辑

2015年10月22日

集算器是什么?

摘要: 集算器是一种程序设计语言,专注于(半)结构化数据计算与处理,提供了丰富的此类运算的类库。集算器不是面向对象的程序设计语言,没有复杂的继承和重载概念,引入对象概念仅仅是为了更方便地描述与对象相关的方法,有BASIC这类初级程序设计水平的程序员都能很快掌握。集算器是基于Java解释执行的动态语言,可以在... 阅读全文

posted @ 2015-10-22 11:11 hivehooker 阅读(1670) 评论(0) 推荐(0) 编辑

2015年7月1日

关系代数的问题与尝试(5)云数据组织

摘要: 摘要: 本文来自北京润乾软件技术有限公司董事长蒋步星在清华大数据产业联合会的讲座。最后再简单说一下云计算的数据组织问题。云数据有这样几个特征:第一,多样性。云计算要解决多租户的问题,显然不同用户的数据结构经常是不一样的,即使同一个用户、同一块业务,数据结构在不同地域、不同时期都会不一样。象我们这样一... 阅读全文

posted @ 2015-07-01 16:21 hivehooker 阅读(340) 评论(0) 推荐(0) 编辑

2015年6月25日

关系代数的问题与尝试(4)层次数据与交互

摘要: 摘要: 本文来自北京润乾软件技术有限公司董事长蒋步星在清华大数据产业联合会的讲座。说到交互运算,我们先复习一下OLAP这个概念。这个词字面的意思是在线分析,但在线分析实际上是在做什么事呢?用户对发生的现象做出猜测基于历史数据计算以验证或证伪猜测根据计算结果修正猜测,重复此过程直到得出有益结论业务用户... 阅读全文

posted @ 2015-06-25 08:17 hivehooker 阅读(771) 评论(0) 推荐(0) 编辑

2015年6月17日

关系代数的问题与尝试(3)序运算与离散化

摘要: 本文来自北京润乾软件技术有限公司董事长蒋步星在清华大数据产业联合会的讲座。下面说序运算和离散化的问题。人对有序计算是天然关心的。因为人最关心变化的东西,如果一个东西老不变,他不关心。这个东西变了,比昨天怎么样,比去年怎么样,他就会很关心,这个时候序运算就很重要了。但是关系代数沿用了数学上的无序集合的... 阅读全文

posted @ 2015-06-17 08:21 hivehooker 阅读(828) 评论(0) 推荐(0) 编辑

2015年6月11日

关系代数的问题与尝试(2)关联运算及描述

摘要: 本文来自北京润乾软件技术有限公司董事长蒋步星在清华大数据产业联合会的讲座。下面我们来讲关系代数中的具体的问题,先谈关联运算的描述。使用SQL对于单表进行查询并不是很难理解和实施,一般也就是选取字段、过滤、排序等,只有分组汇总稍复杂些,也不是多难懂。但是,有意义的查询经常是多表的,比如查一下从北京到上... 阅读全文

posted @ 2015-06-11 21:09 hivehooker 阅读(1034) 评论(1) 推荐(0) 编辑

2015年6月8日

关系代数的问题与尝试(1)数据处理与代数

摘要: 本文来自北京润乾软件技术有限公司董事长蒋步星在清华大数据产业联合会的讲座。整个内容分五个部分:(1)数据处理与代数;(2)关联运算及描述;(3)序运算与离散化;(4)层次数据与交互;(5)云数据组织本文介绍基本概念和背景;中间三部分都是数据分析的内容,是重点;最后一块研究得还不够深,但也涉及到关系代... 阅读全文

posted @ 2015-06-08 09:59 hivehooker 阅读(513) 评论(0) 推荐(0) 编辑

导航