摘要: 一、安装xls2dta命令 clear all ssc install xls2dta,replace 2.1单个excel的单个表单转换为dta文件。 这是最基本的用法,通过以下一行命令就可以实现。(不指定sheet的范围时,xls2dta默认处理第一张表单。) xls2dta: import e 阅读全文
posted @ 2021-04-12 16:00 celine227 阅读(4385) 评论(0) 推荐(0) 编辑
摘要: import os import shutil path_main = r"C:\Users\e2164\Desktop\待处理文件夹"#待处理文件夹路径 filelist_main = os.listdir(path_main) #将“待处理文件夹“下的文件名以列表的形式列出来 path_rece 阅读全文
posted @ 2021-04-07 20:08 celine227 阅读(68) 评论(0) 推荐(0) 编辑
摘要: 豆瓣爬虫 import requests from bs4 import BeautifulSoup import pandas as pd from sklearn.linear_model import LinearRegression import seaborn as sns import 阅读全文
posted @ 2021-03-03 10:58 celine227 阅读(95) 评论(0) 推荐(0) 编辑
摘要: import cv2 import numpy as np from tkinter import * from tkinter import ttk import tkinter as tk import tkinter.filedialog import os root = Tk() root. 阅读全文
posted @ 2021-02-27 21:45 celine227 阅读(576) 评论(0) 推荐(0) 编辑
摘要: 1. os.walk() 这个函数需要传入一个路径作为top参数,函数的作用是在以top为根节点的目录树中游走,对树中的每个目录生成一个由(dirpath, dirnames, filenames)三项组成的三元组。 其中,dirpath是一个指示这个目录路径的字符串,dirnames是一个dirp 阅读全文
posted @ 2021-02-27 18:48 celine227 阅读(58) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-01-03 19:08 celine227 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 1、criterion: 特征选取标准。 默认:gini。 可选gini(基尼系数)或者entropy(信息增益)。 1.1 选择entropy,则是ID3或C4.5算法。 ID3算法原理: a 计算训练集所有样本的信息熵。 b 计算每一特征分类后的信息增益。 c 选择信息增益最大的特征进行分类,得 阅读全文
posted @ 2021-01-03 11:24 celine227 阅读(1931) 评论(0) 推荐(0) 编辑
摘要: concat s1=pd.Series([0,1],index=['a','b']) s2=pd.Series([2,3,4],index=['c','d','e']) s3=pd.Series([5,6],index=['f','g']) In[4]: pd.concat([s1,s2,s3])# 阅读全文
posted @ 2020-12-14 11:19 celine227 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 1.Sklearn通用学习模式 Sklearn中包含众多机器学习方法,但各种学习方法大致相同,我们在这里介绍Sklearn通用学习模式。 首先引入需要训练的数据,Sklearn自带部分数据集,也可以通过相应方法进行构造; Sklearn datasets中我们会介绍如何构造数据。然后选择相应机器学习 阅读全文
posted @ 2020-11-19 10:08 celine227 阅读(292) 评论(0) 推荐(0) 编辑
摘要: 1.np.loadtxt 用法 读取txt文件 numpy.loadtxt(fname, dtype=, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False 参数的作用如下: 1. 阅读全文
posted @ 2020-11-15 12:49 celine227 阅读(5619) 评论(0) 推荐(0) 编辑