04 2021 档案
摘要:有人说一个人就可以快速成长为一名全栈工程师,这让我想起街头卖艺的单人乐队(One-man-band), 他们什么都会一些,可以很快地演奏一些曲子。 我大概听过两类企业,有一类是每个工程师就是一个螺丝钉,在自己的某个技术上发挥极致的能力,有一类是每个工程师类似一个"大杂烩"(这个比喻不知道恰当与否,就
阅读全文
摘要:一 nltk的安装 nltk的安装个人推荐使用pip安装 直接在pycharm的Termial中安装即可 其中 安装语句为 pip3 install nltk (如有python版本不同 可尝试pip install nltk) 此处我的已经安装过所以显示的是安装位置 在安装时如果很慢 可以使用其他
阅读全文
摘要:今天完成了机器学习中的KNN算法建模 其中首先是数据集的获取 本次的数据集是一个网上的一个新闻文本的一个数据集 他是一个EXCEL文件的形式 其中有ID 标题 分类 内容 其中有多个sheet表 进行了分类 其中首先是对数据的获取 数据的转化 由excel文件转化成一个txt文件 txt文件包含一则
阅读全文
摘要:import pandas as pdimport osdef creatcatesdir(data, target): # 获取去重后的分类列表 cates = list(data['channelName'].unique()) # 打印类别 print(cates) # 建立类别文件夹 for
阅读全文
摘要:用户体验设计的一个重要目的就是要降低用户的认知阻力(Cog-nitive Friction),即用户对于软件界面的认知(想象某事应该怎么做,想象某操作应该产生什么结果)和实际结果的差异。我们来看一个具体的例子,如果用户(一个生活在中国二线城市,有高中文化水平,有基本计算机基础的成年人)要在一个文稿中
阅读全文
摘要:在sql语句中模糊查询是通过4种符号进行字符的匹配来实现 1,%:表示任意0个或多个字符。可匹配任意类型和长度的字符,有些情况下若是中文,请使用两个百分号(%%)表示。比如 SELECT * FROM [user] WHERE u_name LIKE '%三%'将会把u_name为“张三”,“张猫三
阅读全文
摘要:转自:https://blog.csdn.net/QimaoRyan/article/details/76022038#23编辑模式快捷键 注:在Jupyter Notebook的主界面上Help > Keyboard Shortcut 即可看到所有快捷键,并且进行编辑 Jupyter Notebo
阅读全文
摘要:1. 安装 ① 安装前提 安装Jupyter Notebook的前提是需要安装了Python(3.3版本及以上,或2.7版本)。 使用pip命令安装 如果你是有经验的Python玩家,想要尝试用pip命令来安装Jupyter Notebook,那么请看以下步骤吧!接下来的命令都输入在终端当中的噢!
阅读全文
摘要:1. 简介 Jupyter Notebook是基于网页的用于交互计算的应用程序。其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。——Jupyter Notebook官方介绍 简而言之,Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结
阅读全文
摘要:例子实战之训练模型 在处理好数据之后我们就可以训练模型了,以多元逻辑回归为例 from sklearn.linear_model import LogisticRegression from sklearn.model_selection import ShuffleSplit from sklea
阅读全文
摘要:特征选择 当特征特别多的时候,且有冗余的情况下,对特征进行选择不仅能使训练速度加快,还可以排除一些负面特征的干扰。sklearn 的feature_seletion提供了它许多特征选取函数,目前包括单变量选择方法和递归特征消除算法。它们均为转化器,故在此不举例说明如何使用。 除了使用feature_
阅读全文
摘要:我们上面已经初步得出模型,并且效果看起来还不错,所以我们现在应该下想办法进一步优化这一个模型了。 我们在调参的时候需要将数据集分为三部分,分别是:训练集、验证集以及测试集。训练集用于模型的训练,然后我们根据验证集的结果去调整出泛化能力较强的模型,最后通过测试集得出模型的泛化能力。如果只把数据分为训练
阅读全文
摘要:数据划分 我们可以使用交叉验证或其他划分数据集的方法对数据集多次划分,以得出模型平均的性能而不是偶然结果。sklearn 有很多划分数据集的方法,它们都在model_selection 里面,常用的有 K折交叉验证: KFold 普通K折交叉验证 StratifiedKFold(保证每一类的比例相等
阅读全文
摘要:例子实战之导入数据及数据预处理 sklearn的datasets中提供一些训练数据,我们可以使用这些数据来进行分类或者回归等等,以此熟悉sklearn的使用。 如下面代码所示我们读取了鸢尾属植物的分类数据集。load_iris()返回的是一个类似字典的对象通过关键字则可以获取对应的数据。 from
阅读全文
摘要:简介 今天为大家介绍的是scikit-learn。sklearn是一个Python第三方提供的非常强力的机器学习库,它包含了从数据预处理到训练模型的各个方面。在实战使用scikit-learn中可以极大的节省我们编写代码的时间以及减少我们的代码量,使我们有更多的精力去分析数据分布,调整模型和修改超参
阅读全文
摘要:发现 别人很会说话,那么人自然要去追求这个属性 而代表人会说话的那些句子自然就是研究方向,人会寻找那些话的来源和什么有关 然后就能自己创造出 巧妙语言,这里是从分析到创造的过程。 找到存在然后寻找原因 这样人就具有了产生各类信息的能力 分析也需要先找到变化和不同处,找到关联处,没有关联时人可以创造关
阅读全文