每个人都应该知道的 5 个 Cloud Logging 提示
每个人都应该知道的 5 个 Cloud Logging 提示
日志对于减少 MTTD 和 MTTR 至关重要,以下是我使用 Google Cloud Operations Logging 提高效率的重要提示。
JSON 日志会自动编入索引
谷歌将此功能命名为 结构化日志记录 .
Google 抓取的所有日志都会自动解析,如果日志格式是有效的 json 格式,Google 会自动从文本切换到结构化日志。
以下无效的 json 格式被解释为文本日志。有限的属性列表使该日志条目难以使用。
具有有效 json 的类似条目提供了广泛的信息列表,您可以轻松地将其与复杂的过滤器、摘要行属性等一起使用。
在结构化日志记录中,您应该遵循 Google 的模式。可以设置一些特殊字段来填写日志严重性、跟踪上下文或执行详细信息。如果您不遵循此模式,属性将显示在下面 json有效负载 . .更多详情 https://cloud.google.com/logging/docs/structured-logging
根据日志内容获取通知
如果日志匹配模式,您可以触发警报。想象一下,您正在构建一个基于结构化日志的强大监控警报系统,您如何确保所有日志都遵循正确的格式并在不正确的情况下触发警报?
创建基于日志的警报策略将帮助您检测意外的日志内容。结构化日志将极大地帮助您配置日志以包含在警报中。
以下示例为给定应用程序的项目中的每个非结构化日志触发警报。
您现在可以从日志中提取值
继续由基于日志的指标提供并由基于日志的警报策略使用的计数器,您现在可以 创建分布指标 .
分布指标可帮助您从日志中提取值并将其保存到直方图存储桶中。 值不单独记录 ,只存储桶之间的分布。
不要忘记注入跟踪上下文
我最喜欢的 Cloud Logging 功能之一,如果您从服务器请求中提取跟踪上下文,则可以将此信息注入到日志语句中。一个非常有用的附加组件来跟踪特定的执行。
您可以使用 OpenTelemetry 记录仪器 举个例子。
谷歌模式需要 logging.googleapis.com/trace
__ 和 logging.googleapis.com/spanId
, 不直接 trace_id
和 span_id
.
使用日志路由器和日志存储桶配置保留
随着您的 Cloud Logging 使用量增加,您的成本也会增加。
未排除的日志条目可能会产生费用。如需了解详情,请参阅 Cloud Logging 定价。
https://cloud.google.com/logging/docs/routing/overview
如果您将所有日志保留较长的保留期,则成本会增加,并且您可能会在应用程序端删除日志以优化它们,这不是一个好方法(除非它们不提供有用的信息)。
相反,您可以使用 日志接收器 根据模式或属性自动删除日志,或者将它们移动到保留期较短的专用存储桶中。
我希望我的 5 条提示可以帮助您改进对 Cloud Operations Logging 的使用!
您可以了解更多有关 Cloud Operations Logging 的信息,例如日志区域化、集中化、访问控制等。
随时通过 Google 的 YouTube 频道上的一些最佳实践继续您的云日志记录之旅。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明