第 4 章公式

4.1 通过字符串创建公式

4.1.1 问题

你想通过字符串创建公式。

4.1.2 方案

通过字符串的方式来创建公式是非常有用的。这通常用于需要将公式参数当做字符串传入函数中。

最基础实用的方法就是调用函数 as.formula():

# 这将返回一个字符串
"y ~ x1 + x2"
#> [1] "y ~ x1 + x2"

# 这将返回一个公式
as.formula("y ~ x1 + x2")
#> y ~ x1 + x2

下面是一个简单实例：

# 存在一些变量名:
measurevar <- "y"
groupvars <- c("x1", "x2", "x3")

# 创建合适的字符串:
paste(measurevar, paste(groupvars, collapse = " + "), sep = " ~ ")
#> [1] "y ~ x1 + x2 + x3"

# 返回公式:
as.formula(paste(measurevar, paste(groupvars, collapse = " + "), 
  sep = " ~ "))
#> y ~ x1 + x2 + x3

4.2 从公式中提取组分

4.2.1 问题

你想抽离公式的一部分用来使用。

4.2.2 方案

你可以把公式对象当作列表看待，使用 [[ 操作符对其组分进行操作。

f <- y ~ x1 + x2

# 观察f结构
str(f)
#> Class 'formula'  language y ~ x1 + x2
#>   ..- attr(*, ".Environment")=<environment: R_GlobalEnv>

# 获得每一部分
f[[1]]
#> `~`
f[[2]]
#> y
f[[3]]
#> x1 + x2

# 转换为列表观察
as.list(f)
#> [[1]]
#> `~`
#> 
#> [[2]]
#> y
#> 
#> [[3]]
#> x1 + x2

如果公式左边没有任何东西，那么列表只有两个元素：

f2 <- ~x1 + x2
as.list(f2)
#> [[1]]
#> `~`
#> 
#> [[2]]
#> x1 + x2

公式的每一个元素都是一个符号或者语言对象（包含多个符号）：

str(f[[1]])
#>  symbol ~
str(f[[2]])
#>  symbol y
str(f[[3]])
#>  language x1 + x2

# 查看语言对象某部分
str(f[[3]][[1]])
#>  symbol +
str(f[[3]][[2]])
#>  symbol x1
str(f[[3]][[3]])
#>  symbol x2

你可以使用 as.character() 或 deparse() 函数将它们转为字符串。 deparse() 函数可以返回一个看起来更为自然的结果：

as.character(f[[1]])
#> [1] "~"
# > [1] '~'
as.character(f[[2]])
#> [1] "y"
# > [1] 'y'

# 这里语言对象被强制转换为代表解析树的字符向量
as.character(f[[3]])
#> [1] "+"  "x1" "x2"
# > [1] '+' 'x1' 'x2'

# 使用 deparse() 获取更为自然的结果
deparse(f[[3]])
#> [1] "x1 + x2"
deparse(f)
#> [1] "y ~ x1 + x2"

正如我们在运行 str(f) 命令时看到的那样，公式对象也会捕捉调用它的环境。如果要抽取它，可以使用 environment() 函数：

environment(f)
#> <environment: R_GlobalEnv>

第 4 章 公式