上一页 1 2 3 4 5 6 7 8 ··· 17 下一页

2021年4月2日

windows系统下pyspark安装

摘要: 1. spark环境搭建 Win7 系统下用IDEA创建Spark工程,由于版本之间相互依赖,下载时要看清楚版本。 jdk-8u281-windows-x64.exe spark-3.1.1-bin-hadoop2.7.tgz spark是基于scala开发,具体可从 spark与scala版本对应 阅读全文

posted @ 2021-04-02 14:16 iUpoint 阅读(1275) 评论(0) 推荐(0) 编辑

2021年3月31日

sqluldr用法

摘要: --参考链接:http://blog.itpub.net/10951282/viewspace-757712/ --ctl中默认记录间的分割符是回车换行符,当记录中含回车换行符时,可运用str属性指定记录分隔符:infile test.dat "str '|\r\n" --设置字符集:UTF8、AL 阅读全文

posted @ 2021-03-31 10:27 iUpoint 阅读(1115) 评论(0) 推荐(0) 编辑

2021年3月30日

对于特征离散化,特征交叉,连续特征离散化非常经典的解释

摘要: 转自: 对于特征离散化,特征交叉,连续特征离散化非常经典的解释 一.互联网广告特征工程 博文《互联网广告综述之点击率系统》论述了互联网广告的点击率系统,可以看到,其中的logistic regression模型是比较简单而且实用的,其训练方法虽然有多种,但目标是一致的,训练结果对效果的影响是比较大, 阅读全文

posted @ 2021-03-30 07:58 iUpoint 阅读(277) 评论(0) 推荐(0) 编辑

2021年3月26日

multi-class、multi-label、multi-output的区别与联系

摘要: 一直很纠结Multi-class, Multi-label 以及 Multi-task 各自的区别和联系,最近找到了以下的说明资料: Multiclass classification means a classification task with more than two classes; e 阅读全文

posted @ 2021-03-26 07:45 iUpoint 阅读(795) 评论(0) 推荐(0) 编辑

2021年3月25日

多标签分类

摘要: 转自: 解决多标签分类问题(包括案例研究) 加载和生成多标签分类数据集 安装工具包 pip install arff pip install scikit-multilearn 加载多标签分类数据集 from skmultilearn.dataset import available_data_se 阅读全文

posted @ 2021-03-25 23:37 iUpoint 阅读(354) 评论(0) 推荐(0) 编辑

多分类与多标签分类评价指标

摘要: 单标签评价指标 import matplotlib.pyplot as plt import numpy as np def F1(P,R): return 2*P*R/(P+R) def ROC(pos,neg): TPR = [] FPR = [] for i in np.arange(0.05 阅读全文

posted @ 2021-03-25 22:05 iUpoint 阅读(417) 评论(0) 推荐(0) 编辑

tensorflow笔记

摘要: tensoflow笔记 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Input, Dense, Activation, Model #方法一: layers = [Dense(3 阅读全文

posted @ 2021-03-25 22:00 iUpoint 阅读(23) 评论(0) 推荐(0) 编辑

2021年3月17日

解决可ping通但无法访问github网站的问题

摘要: 本文转自: 解决GitHub打不开的终极办法! 一、确定ip进入网址https://github.com.ipaddress.com 查看GitHub的ip地址。 140.82.112.3 github.com 二、确定域名ip进入网址https://fastly.net.ipaddress.com 阅读全文

posted @ 2021-03-17 23:55 iUpoint 阅读(19774) 评论(2) 推荐(4) 编辑

行政区划代码

摘要: 行政区划代码 来源:中华人民共和国民政部 - 行政区划代码 处理: import pandas as pd aa = pd.read_clipboard() aa.head() aa.columns = ['code', 'name'] aa['id'] = aa['code'].map(lambd 阅读全文

posted @ 2021-03-17 13:47 iUpoint 阅读(178) 评论(0) 推荐(0) 编辑

2021年3月6日

tesseract安装

摘要: linux系统安装tesseract笔记 lsb_release -a 手动配置yum源 http://mirrors.163.com/.help/centos.html mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Bas 阅读全文

posted @ 2021-03-06 23:35 iUpoint 阅读(285) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 ··· 17 下一页

导航