11 2018 档案
摘要:结果: 原文:https://blog.csdn.net/luoganttcc/article/details/80618336 PySpark 分类模型训练 参考: https://blog.csdn.net/u013719780/article/details/51792097
阅读全文
摘要:VGG Image Annotator (VIA)是一款开源的图像标注工具,由Visual Geometry Group开发。 可以在线和离线使用,可标注矩形、圆、椭圆、多边形、点和线。标注完成后,可以导出为csv和json文件格式。 地址:http://www.robots.ox.ac.uk/~v
阅读全文
摘要:前言 with 语句适用于对资源进行访问的场合,确保不管使用过程中是否发生异常都会执行必要的“清理”操作,释放资源, 比如文件使用后自动关闭/线程中锁的自动获取和释放等。 问题引出 如下代码: 上面代码存在2个问题: (1)文件读取发生异常,但没有进行任何处理; (2)可能忘记关闭文件句柄; 改进
阅读全文
摘要:报错: SyntaxError: Non-ASCII character 概意思是,默认文件是ASCII格式,需要更改文件编码,操作是在文件首行加上 报错 :TypeError: unicode argument expected, got 'str' if your environment is
阅读全文
摘要:YOLO核心思想:从R-CNN到Fast R-CNN一直采用的思路是proposal+分类 (proposal 提供位置信息, 分类提供类别信息)精度已经很高,但是速度还不行。 YOLO提供了另一种更为直接的思路: 直接在输出层回归bounding box的位置和bounding box所属的类别(
阅读全文
摘要:转载请注明:宁哥的小站 » Spark与Pandas中DataFrame对比(详细)
阅读全文
摘要:wget是Linux上一个非常不错的下载指令,也算是Linux工作者常用的指令之一 wget是Linux上一个非常不错的下载指令,也算是Linux工作者常用的指令之一 而这个指令我想在各大系统都预设有提供,包括了Ubuntu、Fedora等,而一般来说,要使用wget下载档案,只需要打以下的指令:w
阅读全文
摘要:hive>show databases;hive>use databasename;hive>show create table tablename; --查看table的存储路径hive>desc tablename; --查看table的表结构hive>show functions; --查看所
阅读全文
摘要:区别 :http://www.voidcn.com/article/p-wsqbotem-boa.html 获取列名的列表: DataFrame.columns.values.tolist()
阅读全文
摘要:第一种: sql = sql.format(dt=dt) 第二种: item_third_cate_cd_list = " 发发发 " ...... """ + item_third_cate_cd_list + """ .......
阅读全文
摘要:Ubuntu下设置环境变量有三种方法,一种用于当前终端,一种用于当前用户,一种用于所有用户: 一:用于当前终端: 在当前终端中输入:export PATH=$PATH:<你的要加入的路径> 不过上面的方法只适用于当前终端,一旦当前终端关闭或在另一个终端中,则无效。 二:用于当前用户: 在用户主目录下
阅读全文
摘要:知乎:一文读懂CRNN+CTC文本行识别 (详解 CTC loss) 来自: https://zhuanlan.zhihu.com/p/43534801 代码:https://github.com/bai-shang/OCR_TF_CRNN_CTC 文字检测主要解决的问题是哪里有文字,文字的范围有多
阅读全文
摘要:pandas主要的两个数据结构是:series(相当于一行或一列数据结构和DataFrame(相当于多行多列的一个表格数据机构)。 原文:https://www.cnblogs.com/gangandimami/p/8983323.html DataFrame.drop(labels=None, a
阅读全文
摘要:5种常用的相关分析方法 转载:http://bluewhale.cc/2016-06-30/analysis-of-correlation.html 相关分析(Analysis of Correlation)是网站分析中经常使用的分析方法之一。通过对不同特征或数据间的关系进行分析,发现业务运营中的关
阅读全文
摘要:1.问题原因::安装包的来源问题,也可以理解为包版本兼容问题,有的包使用官方出版,有的包使用whl文件安装解决方案:将所有包都统一来源,要么全部使用官方出版的包,要么全部使用whl里面的包,问题就解决了numpy+scipy+scikit-learn组件,使用whl文件安装下载:http://pan
阅读全文
摘要:在数值数据上构建任意监督学习模型的一个重要方面是理解特征。查看模型的部分依赖图可帮助理解任意特征对模型输出的影响。 图源:http://scikit-learn.org/stable/auto_examples/ensemble/plot_partial_dependence.html 但是,部分依
阅读全文
摘要:云从科技提出了一种端到端的深度学习文本检测框架Pixel-Anchor,通过特征共享的方式高效的把像素级别的图像语义分割和锚检测回归放入一个网络之中, 把像素分割结果转换为锚检测回归过程中的一种注意力机制,使得锚检测回归的方法在获得高检出率的同时,也获得高精确度。此外,对于如中文这样文本长 度跨度很
阅读全文
摘要:特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: 在数据挖掘工作中,通常处理的是一个包含大量特征且含义未知的数据集,并基于该数据集挖掘到有用的特征。那么
阅读全文
摘要:pandas 中df 对象自带相关性计算方法corr() , 可以用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数、Kendall Tau相关系数和spearman秩相关)。 >>> import numpy as np>>> import pandas as pd
阅读全文
摘要:https://www.cnblogs.com/guxh/p/9451532.html https://blog.csdn.net/zutsoft/article/details/51498026 写得比较完整。 注意concat 合并dataframe 时的细节: 如果两个表的index都没有实际
阅读全文
摘要:Win10新增快捷键,使用Windows Ink工作区 Win+W 唤出屏幕右侧工作区,选择屏幕草图 优点:可裁剪,可编辑,可保存,可复制 缺点:需要二级操作,不能添加文字 Win10新增快捷键,使用Windows Ink工作区 Win+W 唤出屏幕右侧工作区,选择屏幕草图 优点:可裁剪,可编辑,可
阅读全文
摘要:sys.argv是获取运行python文件的时候命令行参数 下面的代码文件是a.py,当我不用IDE工具,只用命令行窗口运行的时候,进入文件所在目录,输入:python a.py 输出结果如下 还是上面的代码,当我运行时候输入:python a.py zhang 输出如下 继续运行时候输入:pyth
阅读全文
摘要:源码地址:https://github.com/eragonruan/text-detection-ctpn 该地址提供了 CTPN 的 tf 版本的实现,代码文档写得很详细,issue 里面也帮助解决了不少问题。 下面简单记录在复现训练的时候遇到的一些问题: 1、首先,必要的环境配置 2、可以尝试
阅读全文
摘要:Alter Table 语句 它是在Hive中用来修改的表。 语法 声明接受任意属性,我们希望在一个表中修改以下语法。
阅读全文
摘要:简介 论文题目:PixelLink: Detecting Scene Text via Instance Segmentation 论文地址:https://arxiv.org/abs/1801.01315 代码实现:https://github.com/ZJULearning/pixel_link
阅读全文
摘要:参考:https://blog.csdn.net/wangguohe/article/details/79386917 https://blog.csdn.net/dreamingfish2011/article/details/51250641
阅读全文
摘要:TextBoxes 论文关键idea 本文和SegLink一样,也是在SSD的基础上进行改进的.相比SSD做了以下的改进: 修改了default box的apect ratio,分别为[1 2 3 5 7 10],目的是适应文本行长度比较长,宽度比较短的特性,也就是说现在的default box是长
阅读全文
摘要:sklearn中的交叉验证(Cross-Validation) sklearn是利用python进行机器学习中一个非常全面和好用的第三方库,用过的都说好。今天主要记录一下sklearn中关于交叉验证的各种用法,主要是对sklearn官方文档 Cross-validation: evaluating
阅读全文