04 2018 档案
摘要:1. scikit-learn cheat sheet 官方链接如下:http://scikit-learn.org/stable/tutorial/machine_learning_map/ Often the hardest part of solving a machine learning
阅读全文
摘要:转:http://www.cnblogs.com/cobbliu/archive/2012/08/24/2654368.html 第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章:十一、从头到尾彻底解析Hash表算法里头有所提到,当
阅读全文
摘要:pandas: powerful Python data analysis toolkit 官方文档: http://pandas.pydata.org/pandas-docs/stable/ 1. 导入包pandas 2. 获取文件夹下文件名称 3. 读前几行文件(.csv文件) 4. 读取文件和
阅读全文
摘要:1、从单个文件中搜索指定的字符串: $ grep "literal-string" filename 该命令会输出字符串在文件中所在行的内容,如果字符串没有空格,则可以不加双引号。filename 可以是多个文件,每个文件用空格隔开。 加 -i 参数可以忽略大小写。 加 -u 参数搜索一个单词而不是
阅读全文
摘要:1. 生成随机的二维数据: 2.生成聚类标签: 3.显示聚类效果: 参考: https://blog.csdn.net/qq_34264472/article/details/53217748 (此为python2代码)
阅读全文
摘要:《A Byte of Python》中文版《 简明 python 教程》,非常简洁,有助于具有一定编程基础的人,快速了解和掌握python。 这里的示例代码以python2为标准。 “ 对于很多编程语言来说,程序都必须要有一个入口,比如 C,C++,以及完全面向对象的编程语言 Java,C# 等。如
阅读全文
摘要:在许多实际问题中,经常要对给出的数据进行可视化,便于观察。 今天专门针对Python中的数据可视化模块--matplotlib这块内容系统的整理,方便查找使用。 本文来自于对《利用python进行数据分析》以及网上一些博客的总结。 1 matplotlib简介 matplotlib是Pythom可视
阅读全文
摘要:根据结构分数的增益情况计算出来选择哪个特征的哪个分割点,某个特征的重要性,就是它在所有树中出现的次数之和。 参考:https://blog.csdn.net/q383700092/article/details/53698760 另外:使用xgboost,遇到一个问题 看到网上有一个办法: 重新新建
阅读全文
摘要:阿里面试一面,应该是简历面试。了解与岗位的匹配程度。 感谢阿里,每次面试都会预先约时间,而不会突击。 1. 首先是自我介绍,要求在介绍过程中,如果有什么项目可以详细介绍。 一开始没反应过来,在讲到项目时,没有详细展开。另外,对于自己最为熟悉的项目并没有问,还是应该主动,引导交流,突出自己的优势。 面
阅读全文
摘要:作为学习记录,将所做PPT摘录如下:
阅读全文
摘要:作为学习记录,将所做PPT摘录如下: 网络结构: 网络结构描述: 网络工作流程: 损失函数计算: 亚洲人脸数据集: 参考代码:
阅读全文
摘要:结合之前的博客: http://www.cnblogs.com/Allen-rg/p/5834551.html#3949333 用caffemodel去测试单通道的图像(mnist数据集)时,出现了问题,例如:维度不匹配、单通道图像和三通道图像不能强制转换等问题。 因为链接中的代码适用于对RGB三通
阅读全文