关于 eval：使用 R 中的数据掩码评估最大似然表达式

Evaluating a maximum likelihood expression using datamasks in R

我正在尝试使用数据掩码评估最大似然表达式。这个想法是允许在函数内按名称调用参数和变量，同时避免多次调用 attach() 和 detach()。这是一个非常简单的小示例，实际功能非常庞大且复杂。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

set.seed(1)

# Data
db <- data.frame(
x = runif(10),
y = runif(10),
z = sample(c(0, 1), 10, replace = TRUE)
)

# Log likelihood function
ll_lik <- function(param) {
pr_1 <- 1 / (1 + exp(-(param[1]*x – param[2]*y)))
pr_2 <- 1 – pr_1
lik <- z * pr_1 + (1 – z) * pr_2
log(lik)
}

# Parameters
param <- c(p1 = 0.1, p2 = 0.2)

# Run the model with attach()/detach()
attach(db)
model <- maxLik::maxLik(ll_lik, start = param)
detach(db)
summary(model)

这很好用，但是，我必须调用 attach() 和 detach()。要按名称访问参数，我需要将 param 转换为对数似然函数内的列表，然后调用 attach()/detach()。这不仅是混乱的，而且对于大型函数和数据，它会产生不必要的开销。我一直在研究的一种可能性是使用 rlang 包和package函数，这些函数主要是为表达式的整洁评估而编写的。

现在，仅创建数据掩码并尝试评估对数似然函数不起作用：

1 2	mask <- as_data_mask(db) eval_tidy(quo(maxLik::maxLik(ll_lik, start = param)), mask)

它无法访问数据掩码 (Error in fnOrig(theta, …) : object ‘x’ not found) 中的对象。也许问题出在 maxLik 上，但我什至无法评估 ll_lik()，这给出了同样的错误：

1	eval_tidy(quo(ll_lik(param)), mask)

但这有效：

1	eval_tidy(quo(x*3), mask)

所以，我开始怀疑 ll_lik() 有”错误”父级，这就是为什么我的数据掩码可能不在函数的搜索路径中，因此找不到变量。现在，as_data_mask() 的帮助部分确实提供了一些示例，说明如何通过创建顶层、中层和底层环境来”嵌套”环境。好的，让我们看看我是否可以将我的函数创建为数据掩码结构的一部分：

1
2
3
4
5
6
7
8
9
10
11
12
13
14

call_stack <- function() {lobstr::cst()}

# Create a new environment (child of empty) that takes a list of objects to populate it
top <- new_environment(list(ll_lik = ll_lik, call_stack = call_stack))

# Create a child of the”top” environment”
middle <- env(top)

# Create a child of the”middle environment and add the data object to it
bottom <- env(middle, db=db)

# Create a data_mask where the bottom contains the masking elements and the top
# the last element of the data_mask.
new_mask <- new_data_mask(bottom, top = top)

很遗憾，我仍然无法访问 x。我什至没有在这里尝试 maxLik 函数。所以为了尝试更深入地挖掘，我开始搞乱调用堆栈。

1	eval_tidy(call_stack(), data = new_mask)

确实，如果我没看错的话，函数的父级就是全局环境。

1
2
3
4

█
1. ├─rlang::eval_tidy(call_stack(), data = new_mask)
2. └─global::call_stack()
3. └─lobstr::cst()

但是，我不知道如何进行这项工作。任何帮助深表感谢。

奖励：如果我能够在 maxLik 中按名称调用参数而不调用 attach()/detach()，那就太棒了。

Evaluating a maximum likelihood expression using datamasks in R

猜你喜欢