新工具DPR的一些想法
2019年06月25日 - 卷土重来未可知
从最开始的MBSIT,到之前的DPR,到现在新的DPR,感觉想法已经更加成熟,应用场景也更加明确,可以真正开始搞了。
待做事项:
1. DPR的logo;
2. 借鉴SC3的方法和综合方法来寻找单细胞里的核心hub;
3. 根据KNN来连接hub,直至把所有hub包含进去,构建一个无环的tree;
4. 把每个cell映射到backbone上;
5. 距离度量,判断分化的距离;
6. 整个多个数据,多个分化的数据,这是现在的难点;
一个专门讲聚类的网页课程 - Alexander Strehl 2002-05-03
值得借鉴的一个工具:SC3: consensus clustering of single-cell RNA-seq data
1. 如何在一个模型里整合多种距离度量;
2. 方法的数学化;
可行性分析
假设
连续性 - 与clustering的假设正好相反
分支事件
特征的选择;距离的度量;
限定KNN的必要性;
MST构建;
主支的构建和简化;省略中间点;最短路径;
迭代处理所有分支;统计
投射所有细胞;使用longest branch
root the tree;
相对主线的深度的拓展
简化的ggtree;nodes center
下游分析
分支的显著性排列,节点数、深度;
branching driving factor
聚类比较
pseudotime比较
技术细节:
特征选择
drop out处理
outlier处理
拓展:
大规模测序应用,减少算法复杂度;
留好各种接口,便于个性化分析;
方便使用,提高引用率;
敏感性和特异性的平衡;
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
2018-06-25 Type I and type II errors | 第一类错误和第二类错误
2018-06-25 Probability和Likelihood的区别
2018-06-25 pseudotime专题
2018-06-25 WGCNA | weighted correlation network analysis