PythonBaby

导航

统计

pyspider内网无法正常显示界面或无法保存

这是由于cdn默认为//cdnjs.cloudflare.com/,内网无法访问

方法一:连一次外网正常启动,就会自动缓存资源了。

方法二:下载cdn资源到本地,然后修改\Lib\site-packages\pyspider\webui\templates下面的文件(一共4个文件)。

   将所有cdn地址替换成本地地址,如:

url_for('cdn', path='codemirror/5.20.2/codemirror.min.css')替换成url_for('static', filename='static/codemirror/5.20.2/codemirror.min.css')

方法三:下载cdn资源到本地,然后修改\Lib\site-packages\pyspider\webui\app.py

加入了第37行,在IIS部署flask刚好可以利用上。

 

cdn资源下载方法:

1.修改\Lib\site-packages\pyspider\webui\app.py源码,用于保存资源链接

with open(r'D:/Anaconda3/Lib/site-packages/pyspider/webui/cdn.txt','a+') as f:
            f.write(urljoin(cdn, path)+'\n')

2.启动pyspider,访问http://localhost:5000/ ,这样就自动保存链接到cdn.txt,供下一步下载资源用。

 3.下载资源

复制代码
import os
import sys
import requests

def download_cdn():
    webui_path = r'D:/Anaconda3/Lib/site-packages/pyspider/webui'
    with open(os.path.join(webui_path,'cdn.txt'), 'r', encoding='utf-8') as fcdn:
        url_list = set(fcdn.read().strip().split('\n'))
        for url in url_list:
            js_file = url.replace('//cdnjs.cloudflare.com/ajax/libs/','')
            js_file = os.path.join(webui_path, 'static', js_file)
            js_path = js_file[:js_file.rfind('/')]
            if not os.path.exists(js_path):
                os.makedirs(js_path)
            if not os.path.exists(js_file):
                res = requests.get(f'https:{url}') 
                with open(js_file, 'wb') as f:
                    f.write(res.content)

if __name__ == '__main__':
    download_cdn()
复制代码

4.下载完就保存到/Lib/site-packages/pyspider/webui/static下面了

 

posted on   PythonBaby  阅读(96)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· AI 智能体引爆开源社区「GitHub 热点速览」
点击右上角即可分享
微信分享提示