摘要: 题目描述大家都知道斐波那契数列,现在要求输入一个整数n,请你输出斐波那契数列的第n项(从0开始,第0项为0)。n0: k = j j += i i = k n -= 1 ... 阅读全文
posted @ 2018-10-11 18:38 yucen 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 题目描述输入一个链表,按链表值从尾到头的顺序返回一个ArrayList。时间限制:1秒;空间限制:32768K;本题知识点: 链表解题思路思路一头插法,得到链表的倒序list,正序输出结果。Python代码:# -*- coding:utf-8 -*-# class ... 阅读全文
posted @ 2018-10-11 15:48 yucen 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 题目描述请实现一个函数,将一个字符串中的每个空格替换成“%20”。例如,当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。时间限制:1秒;空间限制:32768K;本题知识点: 字符串解题思路先通过‘ ‘将字符串str切分成l... 阅读全文
posted @ 2018-10-11 15:27 yucen 阅读(88) 评论(0) 推荐(0) 编辑
摘要: 题目描述在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。时间限制:1秒;空间限制:32768K;本题知识点: 查找解题思路先... 阅读全文
posted @ 2018-10-11 15:10 yucen 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 特征构建是指通过研究原始数据样本,结合机器学习实战经验和相关领域的专业知识,思考问题的潜在形式和数据结构,人工创造出新的特征,而这些特征对于模型训练又是有益的并且具有一定的工程意义。特征构建的方式主要有单列操作、多列操作、 分组/聚合操作这三种。1. 单列操作在pan... 阅读全文
posted @ 2018-09-26 18:58 yucen 阅读(1100) 评论(0) 推荐(0) 编辑
摘要: 机器学习实战的特征工程主要包含数据预处理、特征构建、特征选择三步,首先来介绍数据预处理。我选择python作为工具,并将主要用到pandas、numpy等数据工具库。加载库:import pandas as pdimport numpy as np1. 观察数据(1)... 阅读全文
posted @ 2018-09-26 11:00 yucen 阅读(323) 评论(0) 推荐(0) 编辑
摘要: 一、什么是F1-scoreF1分数(F1-score)是分类问题的一个衡量指标。一些多分类问题的机器学习竞赛,常常将F1-score作为最终测评的方法。它是精确率和召回率的调和平均数,最大为1,最小为0。此外还有F2分数和F0.5分数。F1分数认为召回率和精确率同等重... 阅读全文
posted @ 2018-09-13 11:38 yucen 阅读(10279) 评论(0) 推荐(0) 编辑
摘要: 什么是语料库?文本语料库是一个大型结构化文本的集合。NLTK包含了许多语料库:(1)古滕堡语料库 (2)网络和聊天文本(3)布朗语料库(4)路透社语料库(5)就职演讲语料库(6)标注文本语料库 词汇列表语料库(1)词汇列表:nltk.corpus.words.wor... 阅读全文
posted @ 2018-07-19 21:56 yucen 阅读(1698) 评论(0) 推荐(0) 编辑
摘要: WordNet是一种面向语义的英语词典,由Princeton大学的心理学家、语言学家和计算机工程师联合设计。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。NLTK库中包含了英语WordNet,里面共有155287个词以及117659个同义词集... 阅读全文
posted @ 2018-07-19 21:34 yucen 阅读(853) 评论(0) 推荐(0) 编辑
摘要: 一. 列表&字符串1. 列表 list [ ]列表是python中使用最频繁的数据类型。列表中元素的类型可以不相同,它支持数字,字符串甚至可以包含列表。 方法 描述 list.append(x) 把一个元素添加到列表的... 阅读全文
posted @ 2018-07-18 21:15 yucen 阅读(551) 评论(0) 推荐(0) 编辑