12 2020 档案

LDA模型在邮件分类上的运用
摘要:lda模型实战 # -*- coding: utf-8 -*- """ Created on Tue Dec 8 00:02:27 2020 @author: Administrator """ import numpy as np import pandas as pd import re # 数 阅读全文

posted @ 2020-12-10 11:25 iUpoint 阅读(147) 评论(0) 推荐(0) 编辑

hive笔记
摘要:hive笔记 #hive基本语法 #http://dblab.xmu.edu.cn/blog/2440-2/ -- 不区分大小写 --建表 if not exists CREATE TABLE if not exists page_view(viewTime INT, userid BIGINT, 阅读全文

posted @ 2020-12-09 16:05 iUpoint 阅读(98) 评论(0) 推荐(0) 编辑

python爬虫 - 异步多任务
摘要:异步爬虫批量下载图片,文件下载链接已失效,不要直接运行 # 异步批量下载 import aiohttp import asyncio import time async def job(session, url): # 声明为异步函数 name = url.split('/')[-1] # 获得名字 阅读全文

posted @ 2020-12-08 16:01 iUpoint 阅读(242) 评论(0) 推荐(0) 编辑

python使用docx模块读写
摘要:python使用docx模块读写docx文件的方法与docx模块常用方法详解 阅读全文

posted @ 2020-12-07 11:11 iUpoint 阅读(125) 评论(0) 推荐(0) 编辑

python爬虫 - 代理ip的使用
摘要:python爬虫 - 代理ip的使用 import sys import time import hashlib import requests import urllib3 from lxml import etree urllib3.disable_warnings(urllib3.except 阅读全文

posted @ 2020-12-03 13:48 iUpoint 阅读(329) 评论(0) 推荐(0) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示