摘要: 挣扎了一下这么没有营养的东西是不是应该放OneNote里存着…… 但是!放笔记本里百度搜不到啊qwq 又想起了那天照例不过脑子直接搜索教程 结果搜到了自己的博客的无语………… 往好处想,虽然我不过脑子,但我动笔(键盘)了啊! import numpy as np import matplotlib. 阅读全文
posted @ 2021-01-30 22:55 一卷 阅读(1076) 评论(0) 推荐(0) 编辑
摘要: 大三的时候初识python,也不理解虚拟环境啊安装包啊解释器啊IDE啊服务器啊到底是些什么东西,当然现在也没有很理解哈…… 重新整理了一下自己乱七八糟的虚拟环境和各种安装包: 首先删掉了自己安装的python:从官网上单单下载一个python.exe是没有别的安装包的,numpy、pandas、ma 阅读全文
posted @ 2021-01-22 16:54 一卷 阅读(624) 评论(0) 推荐(0) 编辑
摘要: 一. Spark介绍 Spark是一个分布式计算平台。运算速度远超于HDFS,并且能与python、java更好地交互。 我的疑问:在数据处理/模型训练的过程中,Spark这个平台是需要我手动写一些代码,例如读取数据啥的,还是我只要在带有pyspark的kernal的平台上运行就可以?kernal是 阅读全文
posted @ 2020-08-13 10:09 一卷 阅读(290) 评论(0) 推荐(0) 编辑
摘要: 整理今天的代码…… 采用的是150条鸢尾花的数据集fishiris.csv # 读入数据,把Name列取出来作为标签(groundtruth) import pandas as pd data = pd.read_csv('fishiris.csv') print(data.head(5)) X = 阅读全文
posted @ 2020-07-20 23:27 一卷 阅读(9631) 评论(0) 推荐(0) 编辑
摘要: 在试图实现自己的想法里处处碰壁…… 盲目尝试sklearn里的PCA等降维和聚类方法虽然乍一看上去会了,但是其实是没有办法深刻理解应该在什么时候、怎么使用这些方法的。 明白这两点才能进一步去思考应该怎么样让结果变得更好,进行调参等优化? 聚类 首先没有明确的数据集……然后想说就先对用户进行聚类吧,利 阅读全文
posted @ 2020-05-21 23:56 一卷 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 使用sklearn库初次尝试PCA和T-SNE,原理还不太理解,写错了请一定指出,或者等我自己发现hhhh 1. PCA 首先读入sklearn里自带的鸢尾花数据库,并调用相关的包,再查看一下这些数据都是些啥: import matplotlib.pyplot as plt from sklearn 阅读全文
posted @ 2020-05-19 17:05 一卷 阅读(4306) 评论(1) 推荐(0) 编辑
摘要: 采用subfigure包 1. 插入上下并排的子图 使用\usepackage{subfigure},代码如下 \begin{figure} \caption{Differences Before and Aftrt Applying PAA} \label{PAAbefore} \centerin 阅读全文
posted @ 2020-05-19 14:40 一卷 阅读(26064) 评论(0) 推荐(0) 编辑
摘要: 通常报错先检查一下环境有没有左右匹配,括号用对了吗,符号用对了吗 ! Text line contains an invalid character.【xxx报错位置】 参考了一下别人的博客,发现是因为我从pdf复制文字进来的时候产生了一些不知名的转义字符,例如这种,导致生成pdf的时候.aux等中 阅读全文
posted @ 2020-05-19 14:15 一卷 阅读(2660) 评论(0) 推荐(1) 编辑
摘要: 目前没有严肃归类,遇到一个记录一个…… 表格 1. 表格内容过长时自动换行 设置表格每列的宽度 我个人觉得挺麻烦的。。好像要加上包\usepackage使用p{3cm}表示列宽超过3cm则自动换行,写在{tabula}这个{cccc}位置处。。也就是直接设置列的参数,取代原先的cccc,而不是在外面 阅读全文
posted @ 2020-05-19 13:53 一卷 阅读(3544) 评论(4) 推荐(1) 编辑
摘要: 主要是列表list在Python里深浅拷贝的问题 阅读全文
posted @ 2020-05-14 18:14 一卷 阅读(2230) 评论(0) 推荐(0) 编辑