https://github.com/YouXianMing

[Python] 根据博客园用户名抓取其所有文章的标题及其链接

根据博客园用户名抓取其所有文章的标题及其链接

 

下载地址: https://github.com/YouXianMing/cnblogsTitleGetter

-使用前须知-

(1) 网络库使用的是 requests (https://github.com/kennethreitz/requests),没有安装的用 pip install requests 安装

(2) 项目基于Python3.60版本,其他版本未做验证

 

效果

 

 

以下是使用步骤:

 

1. 获取名字

 

2. 粘贴如下代码并执行

复制代码
from tittle_getter import *

# http://www.cnblogs.com/YouXianMing/

# 博客园url上的个人名字
title_getter = TittleGetter("YouXianMing")

# 如果存在这个人,则继续
if title_getter.user_exist:

    # 开始分析以及遍历数据
    for item in title_getter.start_analyse.title_object_list:

        print("%s %s" % (item.title_name, item.url))
复制代码

 

3. 以下是打印结果

 

posted @   YouXianMing  阅读(973)  评论(1编辑  收藏  举报
编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
历史上的今天:
2015-03-10 [翻译] BFKit
2014-03-10 使用开源库 Objective-C RegEx Categories 处理正则表达式
点击右上角即可分享
微信分享提示