fluentd配置文件语法(二)
原文链接:https://lintingbin2009.github.io/2018/05/01/fluentd%E8%AF%AD%E6%B3%95%E9%80%9F%E8%AE%B0/
官方文档:https://docs.fluentd.org/configuration/config-file
配置文件语法
Fluentd事件的生命周期
1.每个输入的事件会带有一个tag
2.Fluentd通过tag匹配output
3.Fluentd发送事件到匹配的output
4.Fluentd支持多个数据源和数据输出
5.通过过滤器,事件可以被重新触发
1. “source”: 定义数据源
数据源可以在source指令中定义,比如我们可以定义http和forward的数据源。http数据源可以通过http协议来接收数据,forward可以通过tcp协议来接收数据。
|
|
所有source指令中必须包含@type参数,该参数用来指定使用哪个输入插件,比如我们还可以用tail插件来读取文件的内容。
路由
source指令把事件提交到Fluentd的路由引擎。一个事件由三个实体组成:tag、time和record。tag是由’.’分割的字符串组成,被内部路由引擎使用。time由input插件指定,必须是Unix时间戳格式。record是一个Json对象。
2.“match”: 定义数据的输出目标
match指令通过匹配tag字段来将事件输出到其他的系统。同样match指令也必须指定@type参数,该参数用来指定使用哪个输出插件。在下面的例子中,只有myapp.access的tag能够匹配到该输出插件。
|
|
匹配模式
下面的这些匹配模式可以在
*
用来匹配tag的一部分(比如:a.*
可以匹配a.b,但是不能匹配a或者a.b.c)**
可以用来匹配tag的0个或多个部分(比如:a.**可以匹配a、a.b和a.b.c)- {X,Y,Z}匹配X,Y或者Z(比如:{a,b}可以匹配a和b,但是不能匹配c。他可以和*或者**结合起来一起使用。)
- 如果有多个匹配模式写在
里面,则可以用空格分开(比如: <match a b>
能够匹配a和b。<match a.** b.* >
能够匹配a,a.b,a.b.c和b.d。)
匹配顺序
Fluentd是按顺序匹配的,先在配置文件里面出现的match会先匹配。下面的例子中myapp.access永远都不会被匹配到。
|
|
3.“filter”:事件处理管道
“filter”指令的语法和”match”指令的语法相同,但是”filter”能够在管道中被连起来处理,如下所示:
|
|
下面的例子展示了record_transformer fliter的用法。source首先会接收到一个{“event”:”data”}的事件,然后该事件会首先被路由到filter,filter会增加一个host_param的字段到record中,然后再把该事件发送到match中。
|
|
4.“system”:设置系统范围配置(更详细的选项https://docs.fluentd.org/deployment/system-config)
以下的配置能够由”system”指令指定。也可以通过Fluentd的命令行配置选项设置相同的配置: log_level suppress_repeated_stacktrace emit_error_log_interval suppress_config_dump without_source process_name (只能用”system”指令指定)
下面是一个简单的例子:
|
|
process_name参数表示修改fluentd的supervisor和worker进程名称
|
|
5.“label”:用来组织filter和match
“label”指令用来降低tag路由的复杂度,通过”label”指令可以用来组织filter和match的内部路由。下面是一个配置的例子,由于”label”是内建的插件,所以他的参数需要以@开头。
|
|
在上面的例子中,forward的数据源的事件被路由到record_transformer filter和elasticsearch output中。tail数据源被路由到@system里面的grep filter和s3 output中。
“label”对于不带标记前缀的事件流分离非常有用。
@ERROR label
@ERROR label是内建的label,用来记录emit_error_event错误事件的。如果在配置文件里面设置了
6.“@include”:重用配置
可以使用@include指令导入单独配置文件中的指令:
|
|
@include指令支持常规文件路径、glob模式,和http URL约定:
|
|
可以通过”@include”来导入其他的配置文件,配置文件是按顺序导入的。如果使用模式匹配的话,文件是按字母顺序导入的。
|
|
如果导入的文件有顺序的要求的话,最好自己主动写导入的语句,模式匹配导入容易出错。
也可以在不同的区块中导入相同的配置@include /path/to/out_buf_params.conf
|
|
支持的数据类型
每个插件都需要一些参数。例如:in_tail插件有rotate_wait和pos_file这两个参数。每个参数都有对应的类型与其关联。下面是这些类型的定义:
string 类型:该类型被解析成一个字符串。string类型可以有三种形式:不带引号的字符串、带单引号的字符串和带双引号的字符串。
integer 类型:该类型被解析成一个整数。
float 类型:该类型被解析成一个浮点数。
size 类型:该类型用来解析成有多少个字节。可以在整数后面加上k/K、m/M、g/G、t/T,对应的是计算机学科的度量单位。比如:12k表示为12*1024后的数值。
time 类型:该类型被解析成时间。可以在浮点数后面加上s、m、h和d分别表示为秒、分、小时、天。可以用0.1表示100ms。
array 类型:该类型被解析成JSON数组。这种类型还支持缩写,比如:[“key1”, “key2”]可以缩写成key1,key2。
hash 类型:该类型被解析成JSON对象。这种类型也支持缩写,比如:{“key1”:”value1”, “key2”:”value2”}可以缩写成key1:value1,key2:value2。