摘要:
NLP基础实现 数据预处理 清洗和规范化数据 详解: 去除无关信息: 删除HTML标签、特殊字符、非文本内容等,确保文本的纯净性(如(掌声)等拟声词)。 统一格式: 转换所有文本为小写,确保一致性;标准化日期、数字等格式。 分句和分段 将长文本分割成句子或段落,便于处理和训练。 代码示例: '''分 阅读全文
摘要:
metavision预处理函数 三种预处理函数 histo 双通道 参数 xypt: event结构化数组(一般会分段读取,分段为delta_t) output_array: 输出保存数组(reset参数可以直接重置归0) 一般output_array为(tbins, 2, height, widt 阅读全文
摘要:
datawhale 机器学习分子AI数据挖掘比赛笔记 task3 未完成版 ''' 导入库 catboost 处理分类和回归任务的机器学习库 sklearn 传统机器学习库 rdkit warnings 处理忽略错误 ''' import numpy as np import pandas as p 阅读全文
摘要:
动手学图深度学习 图表示学习 研究在嵌入空间(Embedding Space,指在高维数据被映射到低维空间的数学结构)表示图的方法,在图上表示学习核嵌入指的是同一件事,“嵌入”是指将网络中的每个节点映射到低维空间(需要深入了解节点的相似性和网络结构),旨在捕捉图结构中的拓扑信息、节点内容信息以及边的 阅读全文
摘要:
missingno模块讲解 missingno安装 conda install missingno 或者 pip install missingno。 missingno常用API讲解 import missingno as msno 密度图:matrix msno.matrix(df, label 阅读全文
摘要:
动手学图深度学习 声明:本文是在笔者的Pytorch tutorial及深度学习入门(鱼书)笔记的基础上继续学习记录,故有些内容略过。 第三章:深度学习基础 神经网络及其基本组成的补充 欠拟合: 训练误差和验证误差都很严重,而且他们间仅有一点差距,如果模型不能降低训练误差,这可能是因为模型过于简单( 阅读全文
摘要:
动手学图深度学习task2 第二章:图理论基础 图的背景 图论中著名问题:柯尼斯堡七桥问题 问题: 当时东普鲁士柯尼斯堡,市区跨普列戈利亚河两岸,河中心有两个小岛。小岛与河的两岸有七条桥连接。在所有桥都只能走一遍的前提下,如何才能把这个地方所有的桥都走遍? 解决思路: 将问题简化为平面上点与线的组合 阅读全文
摘要:
动手学图深度学习task1 第一章:介绍 充满图的世界 图包括人类社会、化学相互作用、知识图谱等,可以分为自然定义的和人造的两种,图有时也称为网络,例如社交网络、经济网络等(这些情况下的网络指的不是深度神经网络)。 图的现实世界应用 社交网络: 有个著名结论是6度分离(两个人之间可以通过6个人相互连 阅读全文
摘要:
这是一篇pytorch的入门教程。 阅读全文