摘要:
http://snarc.ia.ac.cn/ren/html/y2010/189.html http://baike.baidu.com/view/117790.htm http://zh.wikipedia.org/wiki/%E9%80%92%E5%BD%92%E9%9B%86 一、 在可计算性理论中,一个自然数的子集被称为递归的、可计算的或具可判定性,如果我们可... 阅读全文
随笔档案-2012年12月
【CT】【转】图灵机杂思
2012-12-29 20:36 by Loull, 417 阅读, 收藏, 编辑
摘要:
http://blog.csdn.net/pongba/article/details/621723 图灵机是图灵为了研究可计算问题而构思的一个理论装置,你只要想一想有限状态机就可以大概知道图灵机是个什么概念了,只不过图灵机的内存(纸带)是潜无穷的(也就是可以任意长啦,“潜无穷”是古稀蜡人的说辞)。图灵机的定义形象的说来就像老式的电传机:一个读写头,一根纸带(可能任意长),读写头不断读取纸... 阅读全文
【CT】四、Turing Machine(1)
2012-12-29 00:41 by Loull, 229 阅读, 收藏, 编辑
摘要:
一、Handicapped machines 二、 Compubility 三、Turing Machines 控制器在每步完成两种功能: 1、让控制器进入新状态 2、(a)若不是←、→符号,即一般的符号,则在当前少秒的带方格里写一个符号替换哪里的符号 (b)若是←、向左或→符号,则把读写头移动一格 a代表写a机,即在读写头当前位置写入a L和... 阅读全文
【CT】三、上下文无关文法,CFG,PDA
2012-12-28 15:53 by Loull, 968 阅读, 收藏, 编辑
摘要:
一、CFGV:字符集Σ:终结符集V-Σ:非终结符集S:起始符R:规则集合(V-Σ)x V*推导derivation:二、Parse Tree分析树三、PDA pushdown automata四、PDA & CFL五、上下文无关语言和非上下文无关语言在交和补运算下不是封闭的泵定理:六、上下文无关文法的算法右边为两个字母 阅读全文
【CT】二、有穷自动机Finite Automata
2012-12-27 22:58 by Loull, 238 阅读, 收藏, 编辑
摘要:
一、Deterministic Finite Automata二、Nondeterministic Finite Automata三、四、Regular Language五、正则语言和非正则语言 阅读全文
【sql】sql语句大全
2012-12-21 22:16 by Loull, 266 阅读, 收藏, 编辑
摘要:
mysql创建支持UTF-8编码的数据库GBK: CREATE DATABASE `test1` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci;UTF-8: CREATE DATABASE `test2` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;http://bbs.csdn.net/topics/360210527--语 句 功 能 --数据操作 SELECT --从数据库表中检索数据行和列 INSERT --向数据库表添加新数据行 DELETE --从数... 阅读全文
【sql】
2012-12-21 22:08 by Loull, 232 阅读, 收藏, 编辑
摘要:
http://www.cnblogs.com/yubinfeng/archive/2010/11/02/1867386.html经典SQL语句大全 一、基础1、说明:创建数据库 CREATE DATABASE database-name 2、说明:删除数据库 drop database dbname 4、说明:创建新表 create table tabname(col1 type1 [not null] [primary key],col2 type2 [not null],..)根据已有的表创建新表: A:create table tab_new like... 阅读全文
【hibernate】HibernateUtil和Hibernate的DAO
2012-12-21 21:49 by Loull, 572 阅读, 收藏, 编辑
摘要:
HibernateUtilimport org.hibernate.HibernateException;import org.hibernate.Session;import org.hibernate.SessionFactory;import org.hibernate.cfg.Configu... 阅读全文
【hibernate】hibernate对象生成表,web项目和普通项目的hibernate.cfg.xml
2012-12-21 21:42 by Loull, 423 阅读, 收藏, 编辑
摘要:
注意一、configure()总能找到配置文件,基本不需要自己给它制定路径Configuration config = new Configuration();//配置对象config.addFile("src\\main\\resources\\hibernate.cfg.xml");//加载配置... 阅读全文
【ml】机器学习,python几个站点
2012-12-21 21:30 by Loull, 263 阅读, 收藏, 编辑
摘要:
8、http://deeplearning.net/ Welcome to Deep Learning 7、http://blog.csdn.net/zshtang/article/category/870505 SVD和LSI教程 6、http://blog.csdn.net/shikai1030/article/details/7182312 高斯分布 5、http://guide... 阅读全文
【sparse coding】【转】sparse coding稀疏表达论文列表
2012-12-21 21:18 by Loull, 991 阅读, 收藏, 编辑
摘要:
http://www.sigvc.org/bbs/thread-57-1-1.html 1 What is the Goal of Sensory Coding: 介绍了两种sensory coding 的方式 PCA 和 Sparse coding,并比较了他们的优缺点,指出对于大 多数生物信息处理来说多采用sparse coding的方式。 2 Sparse coding ... 阅读全文
【统计学习】【转】统计学习那些事情
2012-12-21 12:48 by Loull, 478 阅读, 收藏, 编辑
摘要:
http://cos.name/2011/12/stories-about-statistical-learning/ 在港科大拿到PhD,做的是Bioinformatics方面的东西。Bioinformatics这个领域很乱,从业者水平参差不齐,但随着相关技术(比如Microarray, Genotyping)的进步,这个领域一直风风光光。因为我本科是学计算机电子技术方面的,对这些技术本身并没... 阅读全文
【统计学习方法】统计学习方法概论(2)
2012-12-19 22:34 by Loull, 334 阅读, 收藏, 编辑
摘要:
一、模型评估和模型选择1、训练误差与测试误差2、过拟合和模型选择经验风险最小化会出现过拟合问题。二、正则化与交叉验证1、正则化模型选择的典型方法是正则化。正则化是结构风险最小化策略的实现,是在经验风险上加一个正则化项。正则化符合奥卡姆剃刀原理。2、交叉验证另一种常用的模型选择方法是交叉验证cross validation随机将数据集切分成三部分:训练集,验证集,测试集。验证集用于多模型的选择。交叉验证的基本想法是重复地使用数据,吧给定的数据切分,将切分的数据集合为训练集与测试集,反复训练,测试,模型选择。(1)简单交叉验证(2)S折交叉验证(3)留一交叉验证三、泛化能力四、生成模型与判别模型1 阅读全文
【事务管理】两段封锁协议和冲突可串行化
2012-12-19 20:56 by Loull, 5349 阅读, 收藏, 编辑
摘要:
如何证明遵循两段锁协议的事务调度处理的结果是可串行化的 怎么证明遵循两段锁协议的事务调度处理的结果是可串行化的? 如题 ------解决方案-------------------------------------------------------- 9.4. 可串行化隔离级别 可串行化(Serializable) 提供最高级别的事务隔离。 这个级别模拟串行的事务执行, ... 阅读全文
【统计学习方法】统计学习方法概论(1)
2012-12-17 22:51 by Loull, 455 阅读, 收藏, 编辑
摘要:
一、统计学习,统计机器学习statistical machine learning1、统计学习方法:给定训练数据training data,在假设空间hypothesis spase(假设要学习的模型属于某个函数的集合),应用某个评价准则evaluation criterion,从假设空间中选取一个最优的模型。最优模型的选取由算法实现。2、统计学习方法的三要素:模型的假设空间model,策略strategy(模型选择的准则),模型学习的算法algorithm。3、步骤:(1)得到training data(2)确定所有可能的模型的假设空间,即学习模型的集合(3)确定模型选择的准则,即学习的策略 阅读全文
【stanford】二、supervised learning:Linear Regression
2012-12-13 23:28 by Loull, 525 阅读, 收藏, 编辑
摘要:
supervised learning learn a function h : X → Y h is called a hypothesis. 一、Linear Regression 例子中,x是二维向量,x1代表living area,x2代表bedrooms functions/hypotheses h 设x0 = 1,变换得 Now, given ... 阅读全文
【stanford】梯度、梯度下降,随机梯度下降
2012-12-13 22:35 by Loull, 6981 阅读, 收藏, 编辑
摘要:
一、梯度gradient http://zh.wikipedia.org/wiki/%E6%A2%AF%E5%BA%A6 在标量场f中的一点处存在一个矢量G,该矢量方向为f在该点处变化率最大的方向,其模也等于这个最大变化率的数值,则矢量G称为标量场f的梯度。 在向量微积分中,标量场的梯度是一个向量场。 标量场中某一点上的梯度指向标量场增长最快的方向,梯度的长度是这个最大的变化率。 更严格... 阅读全文
【top-k】Answering Topk Queries with MultiDimensional Selections: The Ranking Cube Approach
2012-12-13 15:21 by Loull, 301 阅读, 收藏, 编辑
摘要:
一、读的是一篇文献,06年的 Answering Top-k Queries with MultiDimensional Selections: The Ranking Cube Approach 在一个top-k查询中,两个度量反应了性能:a selection condition & a ranking function. selection condition维度可能很高,rankin... 阅读全文
【数据立方】数据立方体的有效计算、物化materialization,索引OLAP数据
2012-12-13 00:31 by Loull, 1305 阅读, 收藏, 编辑
摘要:
一、数据立方体的有效计算多维数据分析的核心是有效计算多个维度合上的聚集。按SQL术语,这些聚集称为group-by。对于n维的立方体,包括基本立方体总共有(2的n次幂)个方体。(假设每个维没有分层)curse of dimensionality 如果数据立方体中所有的方体都预先计算,所需的存储空间可能爆炸。二、物化materialization部分物化冰山立方体:是一个数据立方体,它只存放其聚集值(如计数)大于某个最小支持度阈值的立方体单元。一旦选定的方体已经物化,重要的是在查询处理时利用它们。三、索引OLAP数据大部分数据仓库系统支持索引结构和物化视图(使用方体)。位图索引,连接索引,位图连 阅读全文
【数据立方】由表和电子数据表到数据立方体,cuboid方体
2012-12-13 00:16 by Loull, 656 阅读, 收藏, 编辑
摘要:
一、数据立方体由维和事实定义。维是关于一个组织想要保存记录的透视图或实体。维对应模式中的一个或一组属性,这个模式应该就是事实表(中心表)。每个维都有一个表与之相关联,称为维表。它进一步表示维。维表可以由用户或专家设定,或者根据数据分布自动产生和调整。多维数据模型围绕中心主题组织。主题用事实表表示。事实是用数值度量的。事实表包括事实的名称或度量,以及每个相关维表的码。二、最流行的数据仓库数据模型是多维模型,可以是星形模型,雪花模型,事实星座模型。三、方体cuboid给定维的集合,可以对给定维的每个可能的子集产生一个方体给定n维,可以产生(2的n次幂)个方体(包括了all,即0-D cuboid) 阅读全文
【datamining】OLTP,OLAP,维度数据库,事实表,维度表、星形和雪花模式、数据立方体、概念分层
2012-12-12 19:59 by Loull, 3319 阅读, 收藏, 编辑
摘要:
一、联机事务处理(OLTP)OLTP系统是设计用来允许高并发性的,这样很多用户就能够访问同一个数据源并进行所需的处理。OLTP系统是面向在数据库上进行事务处理的理念的。而事务则进一步蕴含着发生在表中数据上的受控的变更,这些变更包括在商务运作过程中发生的插入、更新和删除操作。通常,一个OLTP系统将会有大量的客户端应用程序通过各种各样的方式(插入、更新、删除--实际上可以是任何操作)访问数据库以查询一小块信息。OLTP系统的实例包括数据输入程序,如银行处理、订票、联机销售和库存管理系统。二、联机分析处理(OLAP)联机分析处理(或OLAP)是一种广义上的决策支持系统(DSS),或者最近越来越流行 阅读全文
【数据立方cube】数据立方
2012-12-12 19:11 by Loull, 4755 阅读, 收藏, 编辑
摘要:
一、数据立方体的基本概念 数据立方体是多维数据库的基本结构,并作为在多维数据库上定义的所有操作符的输入输出基本单位。将它定义为一个四元组<D,M,A,f>,这四个组件分别表示数据立方体的特征: 1. n 个维的集合D={d1 ,d2,。。。 ,dn },其中每个di 为从维域中抽取的维名。 2. K 个度量的集合M={ m1 ,m2,。。。 ,mn },其中每个mi 为从度量域中抽取的... 阅读全文
【MachineLeaning】stanford lesson one
2012-12-10 16:39 by Loull, 282 阅读, 收藏, 编辑
摘要:
http://hi.baidu.com/group609/item/00e99d1597f986e49d778a69 1.什么是机器学习? 从一些经验(E)中学习,来完成某种任务(T),通过某种评价方式(P)判断,发现perform得更好了,就算是学习了。因此对于机器学习,需要三方面的内容,一些经验+一个任务+一个评价方式。它能够教会计算机去做一些事情,但是!但是!这些事情却不是 hard c... 阅读全文
【computer theory】一、集合、关系和语言
2012-12-06 21:53 by Loull, 371 阅读, 收藏, 编辑
摘要:
1.1集合 1.2关系和函数 1.2.1数学研究关于对象以及它们之间的关系和陈述。 关系本身看作集合。属于关系的对象在本质上是是的关系成立的个体的组合。 因而小于关系式第一个数小于第二个数的所有数对组合的集合。 1.2.2有序对、笛卡尔积,有序组 函数,满射,单射,双射 1.3特设类型的二元关系 有向图,边,顶点 自反、对称、反对称、传递 把自反、对称和传递的关系叫做等价关系。... 阅读全文