kylinlin - 博客园

2022年7月14日

摘要：什么是工单简单来说，就是一个办事流程的凭据。假设你要请假，在学生时代可能要写一个书面的请假条，然后你要亲自拿着请假条找到老师、级长在上面签字同意；在你工作之后，就变成了在oa系统上提交一个申请即可，你的各个上级都会收到通知，然后直接在oa系统上审批。后者其实就是工单的自动化流转，可以极大地提升事情阅读全文

posted @ 2022-07-14 17:06 kylinlin 阅读(679) 评论(0) 推荐(0)

2021年12月6日

内存页不足导致程序启动失败：page allocation failure

摘要：现象之前一直稳定运行了很久的内核ko模块突然功能失灵，通过dmesg命令查看内核信息，发现该模块提示内存页分配失败，如下图所示当时看到 "Failed to allocate memory for ip_entry" 字样，第一反应就是内存不足，直接用命令free -h命令查看系统内存从图中看阅读全文

posted @ 2021-12-06 16:52 kylinlin 阅读(6281) 评论(1) 推荐(0)

2017年1月5日

配置《算法第四版》的Eclipse开发环境

摘要： 1、安装JAVA JAVA网址：http://www.oracle.com/technetwork/java/javase/downloads/index.html 配置环境变量（我把JAVA安装在路径：F:\Java\jdk1.8）： PATH=.;%JAVA_HOME%\binCLASSPATH=.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\toos.... 阅读全文

posted @ 2017-01-05 17:49 kylinlin 阅读(5969) 评论(0) 推荐(0)

2016年4月18日

Learning Scrapy笔记（三）- Scrapy基础

摘要：摘要：本文介绍了Scrapy的基础爬取流程，也是最重要的部分 Scrapy的爬取流程 Scrapy的爬取流程可以概括为一个方程式：UR2IM，其含义如下图所示 URL：Scrapy的运行就从那个你想要爬取的网站地址开始，当你想要验证用xpath或其他解析器来解析这个网页时，可以使用Scrapy sh 阅读全文

posted @ 2016-04-18 17:32 kylinlin 阅读(5185) 评论(1) 推荐(1)

Learning Scrapy笔记（七）- Scrapy根据Excel文件运行多个爬虫

摘要：摘要：根据Excel文件配置运行多个爬虫很多时候，我们都需要为每一个单独的网站编写一个爬虫，但有一些情况是你要爬取的几个网站的唯一不同之处在于Xpath表达式不同，此时要分别为每一个网站编写一个爬虫就显得徒劳了，其实可以只使用一个spider就爬取这些相似的网站。首先创建一个名为generic的阅读全文

posted @ 2016-04-18 14:40 kylinlin 阅读(3848) 评论(2) 推荐(0)

2016年4月17日

Learning Scrapy笔记（六）- Scrapy处理JSON API和AJAX页面

摘要：摘要：介绍了使用Scrapy处理JSON API和AJAX页面的方法有时候，你会发现你要爬取的页面并不存在HTML源码，譬如，在浏览器打开http://localhost:9312/static/，然后右击空白处，选择“查看网页源代码”，如下所示：就会发现一片空白留意到红线处指定了一个名为ap 阅读全文

posted @ 2016-04-17 16:37 kylinlin 阅读(23024) 评论(0) 推荐(2)

2016年4月15日

Scrapy Learning笔记（四）- Scrapy双向爬取

摘要：摘要：介绍了使用Scrapy进行双向爬取（对付分类信息网站）的方法。所谓的双向爬取是指以下这种情况，我要对某个生活分类信息的网站进行数据爬取，譬如要爬取租房信息栏目，我在该栏目的索引页看到如下页面，此时我要爬取该索引页中的每个条目的详细信息（纵向爬取），然后在分页器里跳转到下一页（横向爬取），再爬阅读全文

posted @ 2016-04-15 11:41 kylinlin 阅读(9568) 评论(1) 推荐(2)

Learning Scrapy笔记（五）- Scrapy登录网站

摘要：摘要：介绍了使用Scrapy登录简单网站的流程，不涉及验证码破解简单登录很多时候，你都会发现你需要爬取数据的网站都有一个登录机制，大多数情况下，都要求你输入正确的用户名和密码。现在就模拟这种情况，在浏览器打开网页：http://127.0.0.1:9312/dynamic，首先打开调试器，然后点阅读全文

posted @ 2016-04-15 10:46 kylinlin 阅读(6175) 评论(0) 推荐(1)

2016年4月14日

Learning Scrapy笔记（一）- Scrapy简单介绍

摘要： Scrapy简述 Scrapy十一个健壮的，用来从互联网上抓取数据的web框架，Scrapy只需要一个配置文件就能组合各种组件和配置选项，并且Scrapy是基于事件（event-based）的架构，使得我们可以级联多个操作，包括清理、组织、存储数据到数据库等等。假设现在你要抓取一个网站，这个网站的每阅读全文

posted @ 2016-04-14 16:10 kylinlin 阅读(3305) 评论(0) 推荐(1)

2016年4月13日

Learning Scrapy笔记（零） - 前言

摘要：我已经使用了scrapy有半年之多，但是却一直都感觉没有入门，网上关于scrapy的文章简直少得可怜，而官网上的文档（http://doc.scrapy.org/en/1.0/index.html）对于一个初学者来说实在太不友好了，尤其是像我这种英语水平还未达到炉火纯青地步的程序员来说，读官方文档只阅读全文

posted @ 2016-04-13 21:35 kylinlin 阅读(1796) 评论(1) 推荐(2)

杂牌军里的臭皮匠

公告