delphi 学习如何登陆网站下载文件

感谢我宅猫大哥的热心指导.

启动时等待验证码.

 

输入验证码后,等待处理数据

 

处理完成后,显示数据

 

 

实现原理:利用已有的账号和密码登录后产生的cookie,向服务器请求数据.返回的数据是JSON格式,后期需要自己整理.

注意,请在程序中使用同一个TnetHttpClient控件来完成.因为里面保存了cookie信息

 

需要了解的知识点:

一. token:

在 Web 开发中,Token 经常用于用户身份验证。当用户成功登录后,服务器会生成一个 Token,并将其返回给客户端。客户端将该 Token 存储在本地,以后的请求都携带该 Token,用于证明请求的合法性。服务器会根据 Token 验证用户身份,并决定是否允许该请求访问相关资源。

在登录页面的源代码中,按 ctrl+F 查找 token

 

二.cookie

Cookie 主要用于跟踪用户的状态和行为,以提供个性化的用户体验。通过存储在 Cookie 中的数据,网站可以识别和区分不同的用户,记录用户的偏好设置,保持用户登录状态,以及追踪用户在网站上的访问轨迹等。这些信息可以在用户下次访问网站时被读取并使用。

Cookie 有两种类型:会话性 Cookie 和持久性 Cookie。

会话性 Cookie 存储在用户的计算机上,但在用户关闭浏览器时会被自动删除。这种类型的 Cookie 通常用于临时存储会话信息,如用户的登录状态。

持久性 Cookie 有一个指定的过期日期,可以在用户关闭浏览器后继续存在。这种类型的 Cookie 可以用于记住用户的偏好设置和提供个性化的内容。

三.Referer 

Referer 是一个 HTTP 请求头字段,提供了当前请求的来源信息,用于统计、安全验证和针对性处理等用途。但由于用户隐私的考虑,Referer 值可能为空或被限制。

四.数据的请求地址.就是向服务器请求数据的地址.

下面的动画中,展示了登录网站后,如何获取Referer和数据请求地址的过程.

第一步就是登陆了,

第二步是转到要下载文件的页面,按F12调出开发者工具.红3是清除当前记录,避免干扰

 第三步.点击下载文件,然后会看到出现两条记录(以我当面的页面为例).我们观察第二个地址.里面有limit,明显是分页的,舍去,取第一个地址.

也就是数据请求的地址找到了. 等于号后面的那串13位数字,我后面会讲

第四步,单击第一条记录,可以看到它的标头信息,里面就有Referer 信息,记下来.其实为了保险起见,标头里的信息应该全部封装到代码里才算完美.

 点击预览选项卡,这里你就可以看到你的数据包了,我们要抓的,就是这个数据

 

 

 最后我们再回头看看这一串13位的数字.它其实是一个13位的时间戳,它是给服务器用来校验请求的时间是否在合法范围内.知道它是什么,要做一个就简单了

下面是完整的程序代码:

type
  TForm1 = class(TForm)
    Image1: TImage;
    Label1: TLabel;
    NetHTTPClient1: TNetHTTPClient;
    scGPEdit1: TscGPEdit;
    cxGrid1Level1: TcxGridLevel;
    cxGrid1: TcxGrid;
    cxGrid1TableView1: TcxGridTableView;
    cxGrid1TableView1Column1: TcxGridColumn;
    cxGrid1TableView1Column2: TcxGridColumn;
    cxGrid1TableView1Column3: TcxGridColumn;
    cxGrid1TableView1Column4: TcxGridColumn;
    cxGrid1TableView1Column5: TcxGridColumn;
    scGPPanel1: TscGPPanel;
    scGPPanel2: TscGPPanel;
    procedure FormCreate(Sender: TObject);
    procedure Image1Click(Sender: TObject);
    procedure scGPEdit1RightButtonClick(Sender: TObject);
    procedure scGPEdit1KeyDown(Sender: TObject; var Key: Word; Shift: TShiftState);
  private
    { Private declarations }
  public
    { Public declarations }
  end;

  TMyThread = class(TThread)
  protected
    procedure Execute; override;
  end;

var
  Form1: TForm1;

implementation

uses
  DateUtils;

{$R *.dfm}

// 取13位数字时间
function GetDigitalTime: string;
var
  S_Char: string;
begin
  S_Char := FormatSettings.DateSeparator;
  Result := IntToStr(MilliSecondsBetween(IncHour(now, -8), StrToDateTime('1970'
    + S_Char + '1' + S_Char + '1')));
end;

procedure LoadTxtToCxGrid();   //把处理好的数据,加载进表格,展示给用户
begin
  var Lines := TStringList.Create;
  try
    Lines.LoadFromFile('d:\resule.txt', TEncoding.UTF8);
    var view := form1.cxGrid1TableView1.DataController;

    for var i := 1 to Lines.Count - 1 do
    begin
      var k := view.AppendRecord;
      var arr: TArray<string> := Lines[i].Split([',']);
      for var j := 0 to 4 do
      begin
        view.Values[k, j] := arr[j];  //这里一定要注意.先在cxgrid中创建好列,这里是五列,所以才写了0 to 4 .群里有个老六,就为这点喷我,搞得很不愉快.
      end;
    end;
    //隐藏验证码部分,显示出数据表
    Form1.scGPPanel1.Visible := False;
    Form1.Height := 300;
    Form1.scGPPanel2.Visible := True;
    Form1.scGPPanel2.Align := alClient;
  finally
    Lines.Free;
    DeleteFile('D:\123.txt');        //删除文件
    DeleteFile('d:\resule.txt');     //删除文件
  end;
end;

function washData(): Boolean;  //清洗数据
var
  Reader: TStreamReader;
  Writer: TStreamWriter;
  txts: string;
  JSONObj: TJSONObject;
  StockValue, GoodsNameValue: string;
  JsonArray: TJSONArray;
begin
  Reader := TStreamReader.Create('D:\123.txt');
  Writer := TStreamWriter.Create('D:\resule.txt');
  try
    txts := Reader.ReadToEnd; // 读取全部的文件内容

    JSONObj := TJSONObject.ParseJSONValue(txts) as TJSONObject;
    try
      if Assigned(JSONObj) then
      begin
        JsonArray := JSONObj.GetValue('rows') as TJSONArray;    //选对节点,才能拿到正确数据
        Writer.WriteLine('物料代码,物料名称,规格型号,单位,库存');
        for var i := 0 to JsonArray.Count - 1 do
        begin
          StockValue := JsonArray.Items[i].GetValue<string>('stock'); // 获取 stock 字段值
          GoodsNameValue := JsonArray.Items[i].GetValue<string>('goods_name'); // 获取 goods_name 字段值

          // 输出数据
          if GoodsNameValue <> '' then
          begin
            GoodsNameValue := GoodsNameValue.Replace('\', '', [rfReplaceAll]);  //去掉所有'\'
            GoodsNameValue := GoodsNameValue.Replace('', '刀/', [rfReplaceAll]);
            GoodsNameValue := GoodsNameValue.Replace('丝锥', '丝锥/', [rfReplaceAll]);
            GoodsNameValue := GoodsNameValue.Replace('钻D', '钻/D', [rfReplaceAll]);
            GoodsNameValue := GoodsNameValue.Replace('钻头', '钻头/', [rfReplaceAll]);
            var arr: tarray<string>;
            arr := GoodsNameValue.Split(['/']);
            Writer.WriteLine(arr[0] + ',' + arr[1] + ',' + arr[2] + ',' + arr[3]
              + ',' + StockValue);
          end;
        end;
      end;
    finally
      JSONObj.Free;
    end;
  finally
    Reader.Free;
    Writer.Free;
    //写入表格
    LoadTxtToCxGrid;
  end;
end;

procedure TForm1.scGPEdit1KeyDown(Sender: TObject; var Key: Word; Shift: TShiftState);
begin
  if Key = 13 then
    scGPEdit1RightButtonClick(Sender);
end;

procedure TForm1.scGPEdit1RightButtonClick(Sender: TObject);
var
  ss_Request: TStringList;
  token: string;
  captcha: string;
  match: TMatch;
  S2, S3: TMemoryStream;
  Resp: IHTTPResponse;
const
  // 登陆页面
  TokenURL = '登陆地址';
  // 提交网址
  PostURL = '登陆地址';
begin
 //封装标头信息
  NetHTTPClient1.UserAgent :=
    'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36';
  NetHTTPClient1.Accept := 'application/json, text/javascript, */*; q=0.01';
  NetHTTPClient1.ContentType := 'application/json';

  captcha := Trim(scGPEdit1.text); // 用户输入的验证码
  if Length(captcha) <> 4 then // 初步判断用户输入的验证码长度是否正确
  begin
    ShowMessage('请输入正确的验证码');
    Exit;
  end;

  // --------获取token  ---------
  Resp := NetHTTPClient1.Get(TokenURL); // 取得登陆页面的源代码
  // -------用正则取出token
  match := TRegEx.match(Resp.ContentAsString(TEncoding.UTF8), '[\w]{32}');
  if match.Success then
  begin
    token := match.Groups[0].Value;
  end
  else
  begin
    ShowMessage('没有找到token');
    Exit;
  end;

  // --------封包---------
  ss_Request := TStringList.Create;
  ss_Request.Add('__token__=' + token);
  ss_Request.Add('username=登陆的用户名');
  ss_Request.Add('password=登陆密码');
  ss_Request.Add('captcha=' + scgpedit1.text);  //scgpedit1.text 是验证码,这个需要手动输入
  // resp 提交登陆请求
  Resp := NetHTTPClient1.Post(PostURL, ss_Request);

  if Resp.StatusCode = 200 then  //如果登陆成功,则开始抓包
  begin
    Sleep(500);
    NetHTTPClient1.CustomHeaders['X-Requested-With'] := 'XMLHttpRequest';
    NetHTTPClient1.CustomHeaders['Referer'] :=  'xxxx';

    S2 := TMemoryStream.Create;
    NetHTTPClient1.Get('数据请求的地址'+ GetDigitalTime, S2);
    S2.Position := 0;
    S2.SaveToFile('d:\123.txt');    //把流数据保存成文件,以便后期处理
    scGPEdit1.text := '稍等,处理中...';
    scGPEdit1.Enabled := false;
    washData;    //自定义函数,整理123.txt中的内容为需要的格式
  end
  else
    ShowMessage('请求失败');
end;
//初始化窗口.开始时只显示验证码部分
procedure TForm1.FormCreate(Sender: TObject);
begin
  scGPPanel2.Visible := false;
  Self.Height := 120;
  scGPEdit1.Text := '请等待...';
  scGPEdit1.Enabled := False;
  Image1Click(Sender);
end;

procedure TForm1.Image1Click(Sender: TObject); // 点击图片时更新验证码
var
  MyThread: TMyThread;
begin
  // 创建并启动自定义线程
  MyThread := TMyThread.Create(true);
  MyThread.FreeOnTerminate := true; // 线程执行结束后自动释放
  MyThread.Start;
end;

{ TMyThread }
procedure TMyThread.Execute;
var
  Stream: TMemoryStream;
  pngimage: TPngImage;
begin
  Stream := TMemoryStream.Create;
  pngimage := TPngImage.Create;
  try   
    Form1.NetHTTPClient1.Get('验证码地址',  Stream);     // 下载验证码
    Stream.Position := 0;    //初始化读写位置
    pngimage.LoadFromStream(Stream); // 转换流
    Form1.Image1.Picture.Bitmap.Assign(pngimage); // 把验证码显示出来
    if Form1.Image1.Picture.Bitmap = nil then
      ShowMessage('验证码加载失败,请点击右边的图片重新加载')
    else
    begin
      Form1.scGPEdit1.Enabled := true;
      Form1.scGPEdit1.text := '';
    end;
  finally
    pngimage.Free;
    Stream.Free;
  end;
end;

end.

 

posted @ 2023-11-27 18:12  一曲轻扬  阅读(477)  评论(0编辑  收藏  举报