工作总结之loki篇

复盘loki的安装与项目的调通

前言

为什么要装这个呢,完全是因为他相比于其他主流的日志框架,占用内存少,其他的比如:ELK、Graylog动辄几个G,完全吃不消,还想要能够多人同时看到日志,所以选择了只占几百M内存的loki。
然后这些框架,其实都是开源的,区别就是功能的问题,笔者只需要看日志,因此,loki就行了。

架构分析

loki相当于一个库,promtail是一个日志收集器,grafana是一个可视化界面

安装

这次安装有了之前Jenkins的经验,在安装之前找了大量的资料,以防后面出现很多意料之外的问题。
参考教程:
https://zhuanlan.zhihu.com/p/391302537
https://juejin.cn/post/7008424451704356872
笔者是使用docker-compose的方法,基本上照着第一篇文章走,不会有太大的问题。
笔者的配置文件如下:
docker-compose.yml

version: '3.3'

services:
  # 日志存储和解析
  loki:
    image: grafana/loki
    container_name: lpg-loki
    privileged: true
    volumes:
      - /usr/local/lpg/loki/:/etc/loki/
    # 修改loki默认配置文件路径
    command: -config.file=/etc/loki/loki.yml
    ports:
      - 3100:3100

  # 日志收集器
  promtail:
    image: grafana/promtail
    container_name: lpg-promtail
    privileged: true
    volumes:
      # 将需要收集的日志所在目录挂载到promtail容器中
      - /mydata/app/logs/admin/:/var/log/admin/
      - /mydata/app/logs/business/:/var/log/business/
      - /usr/local/lpg/promtail:/etc/promtail/
    # 修改promtail默认配置文件路径
    command: -config.file=/etc/promtail/promtail.yml

  # 日志可视化
  grafana:
      image: grafana/grafana
      container_name: lpg-grafana
      privileged: true
      ports:
        - 3001:3000

loki.yml

auth_enabled: false

server:
  http_listen_port: 3100

ingester:
  lifecycler:
    address: 127.0.0.1
    ring:
      kvstore:
        store: inmemory
      replication_factor: 1
    final_sleep: 0s
  chunk_idle_period: 1h       # Any chunk not receiving new logs in this time will be flushed
  max_chunk_age: 1h           # All chunks will be flushed when they hit this age, default is 1h
  chunk_target_size: 1048576  # Loki will attempt to build chunks up to 1.5MB, flushing first if chunk_idle_period or max_chunk_age is reached first
  chunk_retain_period: 30s    # Must be greater than index read cache TTL if using an index cache (Default index read cache TTL is 5m)
  max_transfer_retries: 0     # Chunk transfers disabled
  wal:
    enabled: true
    dir: /loki/wal

schema_config:
  configs:
    - from: 2020-10-24
      store: boltdb-shipper
      object_store: filesystem
      schema: v11
      index:
        prefix: index_
        period: 24h

storage_config:
  boltdb_shipper:
    active_index_directory: /loki/boltdb-shipper-active
    cache_location: /loki/boltdb-shipper-cache
    cache_ttl: 24h         # Can be increased for faster performance over longer query periods, uses more disk space
    shared_store: filesystem
  filesystem:
    directory: /loki/chunks

compactor:
  working_directory: /loki/boltdb-shipper-compactor
  shared_store: filesystem

limits_config:
  reject_old_samples: true
  reject_old_samples_max_age: 168h

chunk_store_config:
  max_look_back_period: 0s

table_manager:
  retention_deletes_enabled: false
  retention_period: 0s

ruler:
  storage:
    type: local
    local:
      directory: /loki/rules
  rule_path: /loki/rules-temp
  alertmanager_url: http://localhost:9093
  ring:
    kvstore:
      store: inmemory
  enable_api: true

promtail.yml

server:
  http_listen_port: 9080
  grpc_listen_port: 0

positions:
  filename: /tmp/positions.yaml

clients:
  - url: http://loki:3100/loki/api/v1/push

scrape_configs:
- job_name: system
  static_configs:
  - targets:
      - localhost
    labels:
      job: varlogs
      __path__: /var/log/**/*log

遇到的问题归总

  • "error running loki" err="mkdir wal: permission denied
    原因:默认情况下,docker自己内部创建wal目录的时候失败
    解决方法:在配置文件中增加创建/loki/wal目录的配置。这个解决方法还是fq在github上找到的,所以啊,小众的日志框架的缺陷就是前人的经验较少,要么用特殊方法,要么自己摸索
    https://github.com/grafana/loki/issues/2018
    https://github.com/grafana/loki/issues/4704
  • docker将项目日志挂载到宿主机失败(项目启动创建日志文件的时候,会报Permission denied,权限不够)
    原因:根据报错信息的提示,应该是权限不够,有可能根Jenkins的用户配置不是root有关
    解决方法:两种,1.改Linux的配置,但是需要重启机器,不推荐,2.docker启动项目时,增加以特权方式启动的配置
    https://www.cncsto.com/article/558
    https://so.muouseo.com/qa/8m52rm4dq0wr.html
  • 在界面配置loki的时候,填写ip+端口不起作用
    解决方法:填写loki的域名去连接,这也是自己试出来的

结语

基本上就这些了,一定要注意promtail的目录挂载。笔者的项目是结合了logback输出的日志使用的,虽然最后这个日志框架配置好,可以正常使用了,但是因为logback的分级日志的原因,一个日志文件暂时不能看到所有控制台的输出,然后上级又不允许我降低日志文件的等级(这样,一个文件可以尽可能的多记录包括debug、info、error等信息),理由是,正式环境和测试环境不允许这样配置,无奈(hh)。

posted @ 2022-12-24 18:16  xiaoxiaoguai98  阅读(843)  评论(0编辑  收藏  举报