logstash配置解析nginx日志常用操作

我用的是filebeat,

input {
  beats {
                port => 5783
        }
}
filter {
    json {
      source => "message"
    }

}
output {
    elasticsearch {
            hosts => [ "xxx:9200","xxxxx:9200" ]
            index => "nginxaccesslog-%{+YYYY.MM.dd}"
    }

nginx输出要开json格式,不然你搞grok会搞很久,不要问我为什么,如果你的正则very good,那么当我没说。

如果你解析完了以后要吧message给remove掉,那么很简单,mutate很容易做到这点:

  if [event][dataset] !="nginx.error" {
    mutate {
          remove_field  => ["message"]
    }
  }

mutate一般结合if来做,

https://www.elastic.co/guide/en/logstash/current/event-dependent-configuration.html

if EXPRESSION {
  ...
} else if EXPRESSION {
  ...
} else {
  ...
}

就跟c语法一摸一样,表达式里面支持的运算有三类,

You can use these comparison operators:

    equality: ==, !=, <, >, <=, >=
    regexp: =~, !~ (checks a pattern on the right against a string value on the left)
    inclusion: in, not in

Supported boolean operators are:

    and, or, nand, xor

Supported unary operators are:

    !


这东西还是强大,一个dsl语言,所以还是需要一定的学习成本。我一直觉得技术迭代是一方面,当你熟悉了某个技术以后再去用另一个,学习成本是一定要考虑的要素,除非你的学习能力超强或者是团队有其他人support,否则大部分人还是会选择他熟悉的技术栈。

官网还提供了比较详尽的pipeline语法,
https://www.elastic.co/guide/en/logstash/current/configuration-file-structure.html
忘了看看还是挺有必要的。

posted @ 2022-07-31 13:56  过去的我  阅读(457)  评论(0编辑  收藏  举报