第三次作业
第三次作业
要求
- 爬虫爬取3个up粉丝数并可视化
- 计算粉丝重合度
- 用合理的算法给出大致正确的重合度,给出算法时间复杂度,估计算法所用的空间内存?
过程
1 ### B站up粉丝数
一个小时过长,就暂且调为1min了
附上大致框架
2 ###
最后战果
PS:部分截图
至于算法:在网上看了set()方法,还不清楚其中的原理ψ(._. )>
反思总结:
- 本次练习,学会了些模块的用法,urllib,requests,bs4的靓汤,re,time.sleep,(正则表达式),扩大眼界( ⓛ ω ⓛ *)
- 要学会高效获取数据,分析网页html(ง •_•)ง的内容,
- 网络上有许多现有代码,要合理利用(ง •_•)ง
做完感觉有点虚,毕竟有很大部分是利用网上的资料小删小改,感觉容易忘,还是要脚踏实地学基础内容(算法与数据结构扥)(ง •_•)ง