Logging 工作原理

Caddy 具有强大而灵活的日志记录功能，但它们可能与您习惯的不同，特别是如果您来自更陈旧的共享主机或其他遗留 Web 服务器。

概述

日志记录主要有两个方面：发出和消费。

发出是指生成消息。它包括三个步骤

收集相关信息（上下文）
构建有用的表示形式（编码）
将该表示形式发送到输出（写入）

此功能已内置到 Caddy 的核心中，使 Caddy 代码库或模块（插件）的任何部分都能够发出日志。

消费是消息的摄取和处理。为了有用，发出的日志必须被消费。仅仅写入但从未读取的日志没有任何价值。消费日志可以像管理员读取控制台输出一样简单，也可以像连接日志聚合工具或云服务来过滤、计数和索引日志消息一样高级。

Caddy 的角色

Caddy 是一个日志发出者。它不消费日志，除了编码和写入日志所需的最低限度的处理。这一点很重要，因为它保持了 Caddy 核心的更简洁，从而减少了错误和边缘情况，同时减轻了维护负担。最终，日志处理超出了 Caddy 核心的范围。

但是，总是存在一个 Caddy 应用程序模块消费日志的可能性。（据我们所知，它目前尚不存在。）

结构化日志

与大多数现代应用程序一样，Caddy 的日志是 结构化 的。这意味着消息中的信息不仅仅是不透明的字符串或字节切片。相反，数据保持强类型，并按各个 字段名称 键控，直到需要对消息进行编码并将其写出。

比较传统的非结构化日志——例如传统的 HTTP 服务器常用的陈旧的通用日志格式 (CLF)

127.0.0.1 - - [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.1" 200 2326

这种格式“具有结构”但不是“结构化的”：它只能用于记录 HTTP 请求。没有（有效）方法以不同的方式对其进行编码，因为它是不透明的字节字符串。它也缺少很多信息。它甚至不包括请求的 Host 标头！这种日志格式仅在托管单个站点时有用，并且仅用于获取有关请求的最基本信息。

现在比较来自 Caddy 的等效结构化日志消息，编码为 JSON 并格式化良好以进行显示

{
	"level": "info",
	"ts": 1646861401.5241024,
	"logger": "http.log.access",
	"msg": "handled request",
	"request": {
		"remote_ip": "127.0.0.1",
		"remote_port": "41342",
		"client_ip": "127.0.0.1",
		"proto": "HTTP/2.0",
		"method": "GET",
		"host": "localhost",
		"uri": "/",
		"headers": {
			"User-Agent": ["curl/7.82.0"],
			"Accept": ["*/*"],
			"Accept-Encoding": ["gzip, deflate, br"],
		},
		"tls": {
			"resumed": false,
			"version": 772,
			"cipher_suite": 4865,
			"proto": "h2",
			"server_name": "example.com"
		}
	},
	"bytes_read": 0,
	"user_id": "",
	"duration": 0.000929675,
	"size": 10900,
	"status": 200,
	"resp_headers": {
		"Server": ["Caddy"],
		"Content-Encoding": ["gzip"],
		"Content-Type": ["text/html; charset=utf-8"],
		"Vary": ["Accept-Encoding"]
	}
}

您可以看到结构化日志如何更有用并包含更多信息。此日志消息中丰富的信息不仅有用，而且几乎没有性能开销：Caddy 的日志是零分配的。结构化日志对数据类型或上下文没有限制：它们可以在任何代码路径中使用，并包含任何类型的信息。

由于日志是结构化且强类型的，因此它们可以被编码为任何格式。因此，如果您不想使用 JSON，日志可以被编码为任何其他表示形式。Caddy 通过日志编码器模块支持其他格式，甚至可以添加更多格式。

在结构化日志和旧格式之间的区别中， 最重要的是 ，具有性能损失的结构化日志可以转换为旧的通用日志格式，但反之则不然。从 CLF 转换为结构化格式是非平凡的（或至少效率低下），并且考虑到缺少信息是不可能的。

本质上，高效、结构化的日志记录通常提倡以下理念

日志太多胜过太少
过滤胜过丢弃
延迟编码以获得更大的灵活性和互操作性

发出

在代码中，日志发出类似于以下内容

logger.Debug("proxy roundtrip",
	zap.String("upstream", di.Upstream.String()),
	zap.Object("request", caddyhttp.LoggableHTTPRequest{Request: req}),
	zap.Object("headers", caddyhttp.LoggableHTTPHeader(res.Header)),
	zap.Duration("duration", duration),
	zap.Int("status", res.StatusCode),
)

您可以看到，这一个函数调用包含日志级别、消息和多个数据字段。所有这些都是强类型的，并且 Caddy 使用零分配日志记录库，因此日志发出快速高效，几乎没有开销。

logger 变量是一个 zap.Logger，它可能具有与其关联的任何数量的上下文，其中包括名称和数据字段。这允许记录器很好地从父上下文“继承”，从而实现高级跟踪和指标。

从那里，消息通过高效的处理管道发送，在该管道中对其进行编码和写入。

日志记录管道

如您在上面看到的，消息由 记录器 发出。然后将消息发送到日志进行处理。

Caddy 允许您配置多个日志，这些日志可以处理消息。日志由编码器、写入器、最低级别、采样率以及要包含或排除的记录器列表组成。在 Caddy 中，始终有一个名为 default 的默认日志。您可以通过在配置中的此对象中指定键为 "default" 的日志来对其进行自定义。

编码器： 日志的格式。将内存中的数据表示形式转换为字节切片。编码器可以访问日志消息的所有字段。
写入器： 日志输出。可以是任何日志写入器模块，例如写入文件或网络套接字。它只是写入字节。
级别： 日志具有不同的级别，从 DEBUG 到 FATAL。低于指定级别的消息将被日志忽略。
采样： 极其繁忙的路径可能会发出比有效处理更多的日志；启用采样是一种减少负载的方法，同时仍然产生具有代表性的消息样本。
包含/排除： 每个消息都由一个记录器发出，该记录器具有一个名称（通常从模块 ID 派生）。日志可以包含或排除来自某些记录器的消息。

当从 Caddy 发出日志消息时

检查始发记录器的名称是否与每个日志的包含/排除列表匹配；如果包含（或未排除），则将其添加到该日志中。
如果启用了采样，则快速计算确定是否保留日志消息。
使用日志的配置编码器对消息进行编码。
然后将编码后的字节写入日志的配置写入器。

默认情况下，所有消息都发送到所有已配置的日志。这符合上面描述的结构化日志记录的值。您可以通过设置日志的包含/排除列表来限制哪些消息发送到哪些日志，但这主要用于过滤来自不同模块的消息；它不打算像日志聚合服务那样使用。为了保持 Caddy 的日志记录管道精简高效，日志消息的高级处理被推迟到消费。

消费

在消息被发送到输出后，消费者将读取它们，解析它们，并相应地处理它们。

这与发出日志是一个非常不同的问题领域，Caddy 的核心不处理消费（尽管 Caddy 应用程序模块当然可以）。您可以使用许多工具来处理 JSON 消息流（或其他格式），并查看、过滤、索引和查询日志。您甚至可以编写或实现自己的工具。

例如，如果您运行需要 CLF 分隔到不同文件中的旧版软件，具体取决于特定字段（例如，hostname），则可以使用或编写一个简单的工具，该工具读取 JSON，调用 sprintf() 来创建 CLF 字符串，然后根据 request.host 字段中的值将其写入文件。

Caddy 的日志记录工具也可用于实现指标和跟踪：指标基本上是计算具有某些特征的消息，而跟踪是基于消息之间的共性将多个消息链接在一起。

通过消费 Caddy 的日志，您可以做无数的可能性！