随笔档案「2018年3月」 - 公众号python学习开发

摘要：https://www.jianshu.com/nb/11202633 阅读全文

posted @ 2018-03-30 16:04 公众号python学习开发阅读(166) 评论(0) 推荐(0)

s6tu

摘要：# -*- coding: utf-8 -*- # @Time : 2018/03/30 15:20 # @Author : cxa # @File : liuuchnagtu.py # @Software: PyCharm import requests from fake_useragent import UserAgent as UA from lxml import htm... 阅读全文

posted @ 2018-03-30 15:56 公众号python学习开发阅读(426) 评论(0) 推荐(0)

python get s6tu

该文被密码保护。

posted @ 2018-03-30 15:06 公众号python学习开发阅读(10) 评论(0) 推荐(0)

网络基本功系列

摘要：https://wizardforcel.gitbooks.io/network-basic/content/0.html 阅读全文

posted @ 2018-03-30 09:56 公众号python学习开发阅读(274) 评论(0) 推荐(0)

pytest相关问题解析

摘要：1. 如果你想查询在你的环境下有哪些pytest的active plugin可以使用： [plain] view plain copy py.test --traceconfig [plain] view plain copy [plain] view plain copy 会得到一个扩展的头文件名阅读全文

posted @ 2018-03-29 16:42 公众号python学习开发阅读(224) 评论(0) 推荐(0)

【Pytest】python单元测试框架pytest简介

摘要：1、Pytest介绍 pytest是python的一种单元测试框架，与python自带的unittest测试框架类似，但是比unittest框架使用起来更简洁，效率更高。根据pytest的官方网站介绍，它具有如下特点：非常容易上手，入门简单，文档丰富，文档中有很多实例可以参考能够支持简单的单元测阅读全文

posted @ 2018-03-29 16:17 公众号python学习开发阅读(383) 评论(0) 推荐(0)

云打码破解验证码

摘要：# -*- coding: utf-8 -*- import json import time import requests # from logger.log import other class YDMHttp: apiurl = 'http://api.yundama.com/api.php' username = '' password = '' a... 阅读全文

posted @ 2018-03-29 15:53 公众号python学习开发阅读(2256) 评论(0) 推荐(0)

Python分布式爬虫打造搜索引擎完整版-基于Scrapy、Redis、elasticsearch和django打造一个完整的搜索引擎网站

摘要：Python分布式爬虫打造搜索引擎基于Scrapy、Redis、elasticsearch和django打造一个完整的搜索引擎网站 https://github.com/mtianyan/ArticleSpider 未来是什么时代？是数据时代！数据分析服务、互联网金融，数据建模、自然语言处理、医疗阅读全文

posted @ 2018-03-29 15:21 公众号python学习开发阅读(2843) 评论(0) 推荐(0)

python 使用xlsxwriter的方法属性

摘要：http://xlsxwriter.readthedocs.io/format.html 阅读全文

posted @ 2018-03-28 17:11 公众号python学习开发阅读(232) 评论(0) 推荐(0)

获取微博内容的文字以及表情

摘要：表情是获取alt属性的值传入内容的div区域即可，node就是内容的最外层的节点阅读全文

posted @ 2018-03-28 15:45 公众号python学习开发阅读(331) 评论(0) 推荐(0)

sqlalchemy.orm.exc.DetachedInstanceError: 错误解决

摘要：使用sqlchemy查询出一个集合的时候第一个对象可以使用，后面的就报如下错误。 sqlalchemy.orm.exc.DetachedInstanceError: Instance <LoginInfo at 0x6d79e70> is not bound to a Session; attrib 阅读全文

posted @ 2018-03-27 09:54 公众号python学习开发阅读(2142) 评论(0) 推荐(0)

python发送消息到ipmsg

摘要：from socket import *#利用socket模块生成套接字s = socket(AF_INET,SOCK_DGRAM)#定义一个元组,包含ip地址,和端口号,ip地址必须为字符串,端口号为#数字飞秋的默认端口为2425add = ("192.168.100.148",2425) #设阅读全文

posted @ 2018-03-27 09:01 公众号python学习开发阅读(343) 评论(0) 推荐(0)

Python 装饰器之 functools.wraps

摘要：在看 Bottle 代码中看见 functools.wraps 这种用法。 def make_default_app_wrapper(name): """ Return a callable that relays calls to the current default app. """ a = 阅读全文

posted @ 2018-03-26 10:22 公众号python学习开发阅读(534) 评论(0) 推荐(0)

python模块之collections

摘要：1.namedtuple 定义一个可以使用属性获取数据的tuple。 2.deque deque是为了高效实现插入和删除操作的双向列表,基本方法类似list，下面是简单的几个方法尝试。阅读全文

posted @ 2018-03-26 10:01 公众号python学习开发阅读(172) 评论(0) 推荐(0)

twitter api的使用

摘要：1.用手机号注册推特账号 https://twitter.com/ 2.进入网站 https://apps.twitter.com/ 创建第一个app,填入基本信息 name写完会检测是否已经存在像我下面这个就存在了所以第二张图改完之后的名字。重点Website *的填写，需要填写的url是需阅读全文

posted @ 2018-03-23 21:11 公众号python学习开发阅读(6536) 评论(0) 推荐(0)

python条件判断之直接加数字

摘要：if 后面跟的是条件表达式，条件表达式的结果为True或者False。（1）如果if后面的条件是数字，只要这个数字不是0，python都会把它当做True处理，见下面的例子： if 3: print 'OK' 输出OK，但是如果数字是0，就会被认为是False。（2）如果if后面跟的是字符串，则只要这个字符串不为空串，python就把它看作True，参见下例 if 'hehe':... 阅读全文

posted @ 2018-03-23 15:15 公众号python学习开发阅读(974) 评论(0) 推荐(0)

pythontip题目解答

摘要：输出字典key 给你一字典a，如a={1:1,2:2,3:3}，输出字典a的key，以','连接，如‘1,2,3'。要求key按照字典序升序排列(注意key可能是字符串）。例如：a={1:1,2:2,3:3}, 则输出：1,2,3 方案1: 方案2: 输出100以内的所有素数，素数之间以一个空格区阅读全文

posted @ 2018-03-23 12:55 公众号python学习开发阅读(421) 评论(0) 推荐(0)

twitter api取出的日期格式化

摘要：带转换字符串Thu Mar 22 05:33:41 +0000 2018，格式化字符串"%a %b %d %H:%M:%S +0000 %Y" 阅读全文

posted @ 2018-03-22 15:00 公众号python学习开发阅读(257) 评论(0) 推荐(0)

twitter api的使用获取关注者的时间线

摘要：# -*- coding: utf-8 -*- from tweepy import OAuthHandler import datetime import pandas as pd import tweepy import time import random import traceback from dbs.db import * class Twitter_Spider(): ... 阅读全文

posted @ 2018-03-22 14:50 公众号python学习开发阅读(2495) 评论(0) 推荐(0)

使用CloudSight API进行图像识别的Python脚本

摘要：# -*- coding: utf-8 -*- # @Time : 2018/03/20 17:02 # @Author : cxa # @File : sss.py # @Software: PyCharm import cloudsight auth = cloudsight.SimpleAuth('apikey') api = cloudsight.API(auth) wit... 阅读全文

posted @ 2018-03-20 16:28 公众号python学习开发阅读(373) 评论(1) 推荐(0)

发送请求工具—Advanced REST Client

摘要：安装地址'https://chrome.google.com/webstore/detail/advanced-rest-client/hgmloofddffdnphfgcellkdfbfbjeloo?utm_source=chrome-app-launcher-info-dialog 测试用 1. 阅读全文

posted @ 2018-03-20 15:15 公众号python学习开发阅读(164) 评论(0) 推荐(0)

windows使用celery遇到的错误

摘要：https://www.jianshu.com/p/e5539d96641c 按照这个教程一步步执行到最后报错了。运行task_dispatcher.py的时候 ValueError: not enough values to unpack (expected 3, got 0) 报错如下然后查阅读全文

posted @ 2018-03-20 15:12 公众号python学习开发阅读(389) 评论(0) 推荐(0)

Pythonic

摘要：这个词翻译过来就是这很python，其产生的目的就是写出更简洁的，没有冗余的python代码。 1.元素交换 2.迭代元素的同时获取索引 3.字符串的拼接 +操作都会产生新字符串，造成内存浪费，而join，整个过程中只会产生一个字符串对象 4.列表操作 deque模块是python标准库colle 阅读全文

posted @ 2018-03-20 09:36 公众号python学习开发阅读(235) 评论(0) 推荐(0)

celery学习之入门

摘要：>Celery 是一个简单、灵活且可靠的，处理大量消息的分布式系统，并且提供维护这样一个系统的必需工具。它是一个专注于实时处理的任务队列，同时也支持任务调度。Celery 是语言无关的，虽然它是用 Python 实现的，但他提供了其他常见语言的接口支持。 ###Celery 结构网上找到一张用得最多阅读全文

posted @ 2018-03-19 23:39 公众号python学习开发阅读(508) 评论(1) 推荐(0)

windows中安装redis

摘要：Redis是有名的NoSql数据库，一般Linux都会默认支持。但在Windows环境中， Windows的Redis安装包需要到以下GitHub链接找到。链接：https://github.com/MicrosoftArchive/redis/releases 下载最新的redis，Redis-x 阅读全文

posted @ 2018-03-19 23:06 公众号python学习开发阅读(172) 评论(0) 推荐(0)

pandas 读写sql数据库

摘要：如何从数据库中读取数据到DataFrame中？使用pandas.io.sql模块中的sql.read_sql_query(sql_str,conn)和sql.read_sql_table(table_name,conn)就好了。第一个是使用sql语句，第二个是直接将一个table转到datafr 阅读全文

posted @ 2018-03-19 10:13 公众号python学习开发阅读(2536) 评论(0) 推荐(0)

You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near

摘要：mysql中字段名定义的时候避开关键字。之前我把一个字段定义成了update结果错了，所以避开关键字，但是mysql究竟多少关键字呢？拓展一下，MYsql的关键字，以后就不要用这些关键字啦阅读全文

posted @ 2018-03-16 22:08 公众号python学习开发阅读(270) 评论(0) 推荐(0)

python 查找硬盘中所有符合条件的word文档

该文被密码保护。

posted @ 2018-03-15 16:48 公众号python学习开发阅读(4) 评论(0) 推荐(0)

Python selenium.webdriver.chrome.options.Options() Examples

摘要：The following are 27 code examples for showing how to use selenium.webdriver.chrome.options.Options(). They are extracted from open source Python proj 阅读全文

posted @ 2018-03-15 11:12 公众号python学习开发阅读(9998) 评论(0) 推荐(0)

python读取所有磁盘的word文件

该文被密码保护。

posted @ 2018-03-14 17:28 公众号python学习开发阅读(2) 评论(0) 推荐(0)

【python】统一转换日期格式dateutil.parser.parse

摘要：【python】统一转换日期格式dateutil.parser.parse 背景：我有很多很多的日志数据，每个日志里面都有日期字符串，我需要将其转换为datetime格式。问题是，这些日志里的字符串格式五花八门，有2017-05-25T05:27:30.313292255Z，有2016-07-0 阅读全文

posted @ 2018-03-14 11:12 公众号python学习开发阅读(840) 评论(0) 推荐(0)

python读取doc

摘要：import os, time, fnmatch from docx import Document class search: def __init__(self, path, search_string, file_filter): self.search_path = path self.search_string = search_string se... 阅读全文

posted @ 2018-03-14 11:02 公众号python学习开发阅读(614) 评论(1) 推荐(0)

大规模爬虫流程总结

摘要：大规模爬虫流程总结爬虫是一个比较容易上手的技术，也许花5分钟看一篇文档就能爬取单个网页上的数据。但对于大规模爬虫，完全就是另一回事，并不是1*n这么简单，还会衍生出许多别的问题。系统的大规模爬虫流程如图所示。先检查是否有API API是网站官方提供的数据接口，如果通过调用API采集数据，则相当阅读全文

posted @ 2018-03-14 09:22 公众号python学习开发阅读(404) 评论(0) 推荐(0)

如何巧妙的利用selenium和requests组合来进行操作需要登录的页面

摘要：一、在这里selenium的作用（1）模拟的登录。（2）获取登录成功之后的cookies 代码通过使用cookies = driver.get_cookies() #我们获取了cookie那么我们怎用呢。二、requests如何使用获取到的cookies 1.创建一个Session对象 2. 阅读全文

posted @ 2018-03-14 08:46 公众号python学习开发阅读(5314) 评论(0) 推荐(1)

使用pandas进行数据清洗

摘要：本文转载自：蓝鲸的网站分析笔记原文链接：使用python进行数据清洗目录：数据表中的重复值 duplicated() drop_duplicated() 数据表中的空值/缺失值 isnull()&notnull() dropna() fillna() 数据间的空格查看数据中的空格去除数据中阅读全文

posted @ 2018-03-12 15:31 公众号python学习开发阅读(903) 评论(0) 推荐(0)

twilio打电话和发短信

摘要：重要的一步默认没有授权中国地区的需要开启授权， Account not authorized to call . Perhaps you need to enable some international permissions: twilio.com/user/account/settings/i 阅读全文

posted @ 2018-03-09 17:37 公众号python学习开发阅读(3623) 评论(1) 推荐(0)

GLE api

摘要：# -*- coding: utf-8 -*-# @Time : 2018/03/09 12:25# @Author : cxa# @File : gle.py# @Software: PyCharmimport requestsimport csv######################### 阅读全文

posted @ 2018-03-09 11:27 公众号python学习开发阅读(1098) 评论(0) 推荐(0)

pycharm配置教程

摘要：http://blog.csdn.net/u013088062/article/details/50100121 阅读全文

posted @ 2018-03-09 11:13 公众号python学习开发阅读(182) 评论(0) 推荐(0)

云语音通讯

摘要：http://www.yuntongxun.com/doc/ready/demo/1_4_1_2.html 阅读全文

posted @ 2018-03-08 15:58 公众号python学习开发阅读(128) 评论(0) 推荐(0)

微博信息实时监控并发邮件

该文被密码保护。

posted @ 2018-03-08 14:29 公众号python学习开发阅读(5) 评论(0) 推荐(0)

微博二级评论爬取

摘要：思路: 1。第一次需要访问的链接是 https://weibo.com/aj/v6/comment/big?ajwvr=6&more_comment=big&root_comment_id=4215074627189144&is_child_comment=ture&id=4095051414397 阅读全文

posted @ 2018-03-08 10:06 公众号python学习开发阅读(1405) 评论(0) 推荐(0)

爬取genome的网页和图片

摘要：# -*- coding: utf-8 -*- # @Time : 2018/03/08 10:32 # @Author : cxa # @File : gethtmlandimg.py # @Software: PyCharm import requests from fake_useragent import UserAgent as UA from lxml import ... 阅读全文

posted @ 2018-03-08 09:54 公众号python学习开发阅读(273) 评论(0) 推荐(0)

一个数据结构转换的问题

摘要：问题背景 #给定一个字典{"uid", 2243,"follow", 23,"fans", 20,"weibo", 45}需要把上面的字典字典转换成3条数据插入数据库。# BIZ_ID: 2243, ITEM_NAME:"follow", DEC_VALUE:23# BIZ_ID: 2243, IT 阅读全文

posted @ 2018-03-07 16:55 公众号python学习开发阅读(179) 评论(0) 推荐(0)

SQLAlchemy ORM教程之二：Query

摘要：from:https://www.jianshu.com/p/8d085e2f2657 这是继SQLAlchemy ORM教程之一：Create后的第二篇教程。在上一篇中我们主要是解决了如何配置ORM系统，建立从类到表的映射的过程，以及如何插入和修改记录。在这个教程中我们主要解决使用的问题。 Que 阅读全文

posted @ 2018-03-07 11:31 公众号python学习开发阅读(476) 评论(0) 推荐(0)

SQLAlchemy中filter()和filter_by()有什么区别

摘要：from:https://segmentfault.com/q/1010000000140472 filter: apply the given filtering criterion to a copy of this Query, using SQL expressions.e.g.:sessi 阅读全文

posted @ 2018-03-07 11:28 公众号python学习开发阅读(6782) 评论(0) 推荐(0)

词云加显示条形图

摘要：import pandas as pd #数据库操作 import numpy as np from collections import Counter import matplotlib.pyplot as plt #绘图 import jieba from scipy.misc import imread from wordcloud import WordCloud #词云可视化 im... 阅读全文

posted @ 2018-03-06 22:51 公众号python学习开发阅读(309) 评论(0) 推荐(0)

智联招聘的python岗位数据词云制作

摘要：# 根据传入的背景图片路径和词频字典、字体文件，生成指定名称的词云图片 def generate_word_cloud(img_bg_path, top_words_with_freq, font_path, to_save_img_path, background_color='white'): # 读取背景图形 img_bg = imread(img_bg_path) ... 阅读全文

posted @ 2018-03-06 20:50 公众号python学习开发阅读(301) 评论(0) 推荐(0)

Python标准库——collections模块的Counter类

摘要：1.collections模块 collections模块自Python 2.4版本开始被引入，包含了dict、set、list、tuple以外的一些特殊的容器类型，分别是： OrderedDict类：排序字典，是字典的子类。引入自2.7。 namedtuple()函数：命名元组，是一个工厂函数。引阅读全文

posted @ 2018-03-06 20:12 公众号python学习开发阅读(343) 评论(0) 推荐(0)

智联招聘的python岗位数据结巴分词（二）

摘要：上次获取第一次分词之后的内容了但是数据数据量太大了，这时候有个模块就派上用场了collections模块的Counter类 Counter类：为hashable对象计数，是字典的子类。然后使用most_common方法返回一个TopN列表。如果n没有被指定，则返回所有元素。当多个元素计数值相同阅读全文

posted @ 2018-03-05 23:21 公众号python学习开发阅读(288) 评论(0) 推荐(0)

词性标注

摘要：转载自:http://www.hankcs.com/nlp/part-of-speech-tagging.html 词性标注（Part-of-Speech tagging 或POS tagging)，又称词类标注或者简称标注，是指为分词结果中的每个单词标注一个正确的词性的程序，也即确定每个词是名词、阅读全文

posted @ 2018-03-05 23:06 公众号python学习开发阅读(6292) 评论(0) 推荐(0)

智联招聘获取python岗位的数据

摘要：import requests from lxml import html import time import pandas as pd from sqlalchemy import create_engine import traceback from fake_useragent import UserAgent as UA #使用其random方法获取随机ua class ZhaoPi... 阅读全文

posted @ 2018-03-05 22:59 公众号python学习开发阅读(889) 评论(0) 推荐(0)

智联招聘的python岗位数据结巴分词（一）

摘要：如何获取数据点击这里数据样式大概这样。然后下面我分析的是工作要求也就是那边的绿框那一列。运行完上面的程序得到的文件结构如下阅读全文

posted @ 2018-03-05 22:56 公众号python学习开发阅读(452) 评论(0) 推荐(0)

python 微博评论获取的时候日期格式化

摘要：# -*- coding: utf-8 -*- # @Time : 2018/03/05 10:57 # @Author : cxa # @File : testDataTime.py # @Software: PyCharm import datetime import time # 今天 12:36 # 34分钟前 # 20秒前 # 2月26日 09:38 #统一格式化成时间类... 阅读全文

posted @ 2018-03-05 14:32 公众号python学习开发阅读(410) 评论(0) 推荐(0)

logging模块的使用

摘要：# -*- coding: utf-8 -*- import os import time import logging import sys log_dir1=os.path.join(os.path.dirname(os.path.dirname(__file__)),"logs") today = time.strftime('%Y%m%d', time.localtime(time.ti... 阅读全文

posted @ 2018-03-05 12:29 公众号python学习开发阅读(236) 评论(0) 推荐(0)

mysqlalchmy操作之建表

摘要：1　创建链接基础类。 2.设计需要的表的字段 3.映射到实体 4.创建表阅读全文

posted @ 2018-03-05 10:59 公众号python学习开发阅读(433) 评论(0) 推荐(0)

mysql 1366的错误字符集错误解决方案

摘要：最近用mysqlalchmy的时候遇到了 sqlalchemy.exc.InternalError: (pymysql.err.InternalError) (1366, "Incorrect string value: '\\xF0\\xA0\\x88\\x8C\\xEF\\xBC...' for 阅读全文

posted @ 2018-03-05 10:36 公众号python学习开发阅读(2378) 评论(0) 推荐(0)

c#使用selenium+Chromedriver参数配置

摘要：using System; //添加selenium的引用 using OpenQA.Selenium.PhantomJS; using OpenQA.Selenium.Chrome; using OpenQA.Selenium.Support.UI; using OpenQA.Selenium; //添加引用-在程序集中添加System.Drawing using System.IO; us... 阅读全文

posted @ 2018-03-02 17:08 公众号python学习开发阅读(8025) 评论(0) 推荐(1)

一起来学python

android逆向

03 2018 档案

公告