摘要:
1. 背景 在各行各业的发展中,无论来源、记录方式如何,人们必然会积累各种各样的数据,并且倾向于通过统计数据分析现实情况,以此作为指导行动方向的依据。因此,统计学中一直围绕着数据进行建模与问题分析,给出对数据背后反映问题的判断。 由于计算机的发展,承载数据统计和分析的实体自然而然地变成了各式各样的计 阅读全文
摘要:
【原】隐马尔可夫模型及其典型应用 by stackupdown 目录 前言 3 正文 3 一、随机过程 3 二、隐马尔科夫模型的假设 4 三、隐马尔科夫模型的三个基本问题: 5 1.解码问题 5 2.评估问题 6 3.学习问题 7 四、隐马尔科夫模型应用举例 8 1.自然语言处理 8 2.蛋白质序列 阅读全文
摘要:
2024.2.24 概念: 1-3 各空间的定义(概览) 1.度量空间,满足以下性质的非空集 2.赋范空间: 定义了范数;非负性;齐次性:||ax|| = |a|·||x||; 满足三角不等式 3.巴拿赫空间: 定义了范数,增加了完备性; 4.内积空间: 是赋范空间,且定义了内积(2-范数) 满足交 阅读全文
摘要:
这是一篇发表在 ICLR 2024 会议上的学术论文的阅读笔记,题为“Neural Field Classifiers via Target Encoding and Classification Loss”,作者来自北京交通大学和百度研究院。 为什么会找到这篇文章,因为文章的一个作者是HKUST一 阅读全文
摘要:
1.论文背景 本论文是一篇ACL 2023的论文《Cognitive Reframing of Negative Thoughts through Human-Language Model Interaction》,主要讲的是一个人类-语言模型交互的工具。 本文(这篇笔记)的组织形式是顺读文章,从头 阅读全文
摘要:
本文介绍一篇关于软件定义网络(SDN)集成的研究论文,标题为《Software-Defined Network Assimilation: Bridging the Last Mile Towards Centralized Network Configuration Management with 阅读全文
摘要:
一、实验内容 P4要求完成事务间的并发控制,包括支持三种隔离事务的加解锁,以及一个死锁检测线程;适配之前实现的执行器,并且修改之前实现的算子实现对并发的支持。 Task #1 - Lock Manager Task #2 - Deadlock Detection Task #3 - Concurre 阅读全文
摘要:
一、 实验内容 查询优化器是一个沟通语句SQL到具体执行逻辑的桥梁。 从query到具体执行,代码要经过如下的过程: query parsing:从文本query得到一棵语法树,语法树等上下文被绑定(保存)到执行计划中 query optimization:从语法树生成优化的执行计划 query e 阅读全文
摘要:
完成了Project-2的checkpoint1之后,就可以开始搞并发控制了。在checkpoint1中虽然能过测例,但不一定是没问题的,checkpoint-2必须解决考虑不完全的并发问题。 一、实验内容 实现的接口 Task #2c – Index Iterator Task #2d – Con 阅读全文
摘要:
project-2相比project-1难度提升了不少。 project2的工作量较大,因此分成两个checkpoint。checkpoint2是支持并发安全,而checkpoint1其实是数据结构的问题,这篇文章先写project-1的checkpoint1。 实验前提 可以看project-2的 阅读全文
摘要:
cmu 15445 是一门面向本科生的数据库开发课程。得益于前几年TiDB这样的开源先驱,以及国内对各种数据库没有止境的稳定性和性能要求,数据库内核开发成为很多程序员追求的开发方向,cmu 15445及MIT 6.824等项目成为了所谓的"标配。但是从dashboard的提交可以看出来,实际上很多人 阅读全文
摘要:
判别式模型与生成式模型 已知的机器学习模型中,分成了生成式模型和判别式模型两大类型。朴素贝叶斯、贝叶斯网络、pLSA、LDA等模型都是先对联合概率分布进行建模,然后再通过计算边缘分布得到对变量的预测,所以它们都属于生成式模型。 其他的还有HMM模型。 相比生成式模型,判别式模型家族更加庞大一些,包括 阅读全文
摘要:
很久没做leetcode了,这是一个动态规划的Hard题目 在算法导论里看到了下动态规划,跟很久以前初次看到的时候感受已经有很大的不同,已经很深刻地看到动态规划的结构了。于是顺利地把它做了出来。 题目 A die simulator generates a random number from 1 阅读全文
摘要:
感知机 感知机(perceptron)是一种线性分类模型。1957年, 由计算科学家Rosenblatt提出。 从仿生学的角度,一个感知机就是一个神经元。如图所示: 其中a1~an为一个样本的属性值。 在执行线性分类的任务中,它可以对样本输出对应的特征向量。一旦将数据转换为特征向量,那么分类问题即变 阅读全文
摘要:
历史 CRDT (Conflict-free Replicated Data Type),即“无冲突复制数据类型”,它主要被应用在分布式系统中,保证分布式应用的数据一致性。文档协同编辑可以理解为分布式应用的一种。CRDT的本质是数据结构,通过数据结构的设计保证并发操作数据的最终一致性。 CRDT 于 阅读全文