2023年2月19日 01:58:00go评论94阅读模式

英文:

predict.lme is unable to interpret a formula defined from a variable

问题

我一直受到一个错误的困扰，这个错误追溯到在一个函数内部运行的predict.lme，它无法解释基于从函数外部传递的变量的公式。我知道这个问题与变量作用域和不同的环境有关，但我一直无法完全理解它或找到一种解决方法。您的帮助将不胜感激。

以下是一个可重现的示例：

# 这将是嵌套函数。
train_test_perf <- function(train_data, test_data, model, termLabels) {
  fixForm <- reformulate(termlabels=termLabels, response="Y")
  fit <- nlme::lme(fixForm, data=train_data, random=~ 1|ID)
  train_pred <- predict(fit, newdata=train_data, level=0, na.action=na.exclude)
  rtrain <- cor.test(train_data$Y, train_pred)
  test_pred <- predict(fit, newdata=test_data, level=0, na.action=na.exclude)
  rtest <- cor.test(test_data$Y, test_pred)
  tmp <- data.frame(Model=model, 
                    R_train=rtrain$estimate, 
                    R_test=rtest$estimate)
  return(tmp)
}
# 这是调用它的函数。
myfunc <- function(df, newdf, varList) {
  for (v in varList) {
    perf <- train_test_perf(train_data=df, test_data=newdf, model=v, termLabels=v)
    print(perf)
  }
}
# 外部函数调用。
myfunc(df=dat, newdf=newdat, varList=list("W", "X"))

运行这个代码会产生以下错误和回溯：

Error in eval(mCall$fixed) : object 'fixForm' not found
7.
eval(mCall$fixed)
6.
eval(mCall$fixed)
5.
eval(eval(mCall$fixed)[-2])
4.
predict.lme(fit, newdata = train_data, level = 0, na.action = na.exclude)
3.
predict(fit, newdata = train_data, level = 0, na.action = na.exclude)
2.
train_test_perf(train_data = df, test_data = newdf, model = v, 
termLabels = v)
1.
myfunc(df = dat, newdf = newdat, varList = list("W", "X"))

似乎predict.lme无法访问fixForm变量，但我一直无法找到一种既能定义基于变量的公式又能让predict.lme访问值的方法。我不确定嵌套函数结构是否是这里的问题的一部分 - 如果是的话，我希望找到一种维护这种结构的解决方法，因为我的真实代码包括在myfunc之前和之后发生的一些其他事情。

谢谢，Jeff Phillips

英文:

I have been stymied by an error that traces back to predict.lme, running inside a function, failing to interpret a formula based on a variable that has been passed from outside the function. I know the issue has to do with variable scope and different environments, but I've been unable to fully understand it or find a workaround. Your help would be much appreciated.

Here's a reproducible example:

# This will be the nested function.
train_test_perf &lt;- function(train_data, test_data, model, termLabels) {
  fixForm &lt;- reformulate(termlabels=termLabels, response=&quot;Y&quot;)
  fit &lt;- nlme::lme(fixForm, data=train_data, random=~ 1|ID)
  train_pred &lt;- predict(fit, newdata=train_data, level=0, na.action=na.exclude)
  rtrain &lt;- cor.test(train_data$Y, train_pred)
  test_pred &lt;- predict(fit, newdata=test_data, level=0, na.action=na.exclude)
  rtest &lt;- cor.test(test_data$Y, test_pred)
  tmp &lt;- data.frame(Model=model, 
                    R_train=rtrain$estimate, 
                    R_test=rtest$estimate)
  return(tmp)
}
# And here is the function that calls it.
myfunc &lt;- function(df, newdf, varList) {
  for (v in varList) {
    perf &lt;- train_test_perf(train_data=df, test_data=newdf, model=v, termLabels=v)
    print(perf)
  }
}
# The outer function call.
myfunc(df=dat, newdf=newdat, varList=list(&quot;W&quot;, &quot;X&quot;))

Running this gives the following error and traceback:

Error in eval(mCall$fixed) : object &#39;fixForm&#39; not found
7.
eval(mCall$fixed)
6.
eval(mCall$fixed)
5.
eval(eval(mCall$fixed)[-2])
4.
predict.lme(fit, newdata = train_data, level = 0, na.action = na.exclude)
3.
predict(fit, newdata = train_data, level = 0, na.action = na.exclude)
2.
train_test_perf(train_data = df, test_data = newdf, model = v, 
termLabels = v)
1.
myfunc(df = dat, newdf = newdat, varList = list(&quot;W&quot;, &quot;X&quot;))

It seems clear that predict.lme does not have access to the fixForm variable, but I haven't been able to work out a way to both define a formula based on a variable and have the value accessible to predict.lme. I'm not sure whether the nested function structure is part of the problem here--if it is, I would prefer to find a workaround that would maintain this structure, as my real-life code includes some other things inside myfunc that occur before and after the call to train_test_perf.

Thanks,

Jeff Phillips

答案1

得分: 1

使用变量作为公式不会存储变量，而是存储可能存在的问题的公式。我们可以使用 do.call。

train_test_perf <- function(train_data, test_data, model, termLabels) {
  fixForm <- reformulate(termlabels=termLabels, response="Y")
  fit <- do.call(nlme::lme, list(fixForm, data=quote(train_data), random=~ 1|ID))
  train_pred <- predict(fit, newdata=train_data, level=0, na.action=na.exclude)
  rtrain <- cor.test(train_data$Y, train_pred)
  test_pred <- predict(fit, newdata=test_data, level=0, na.action=na.exclude)
  rtest <- cor.test(test_data$Y, test_pred)
  tmp <- data.frame(Model=model, R_train=rtrain$estimate, 
                    R_test=rtest$estimate)
  return(tmp)
}

最后，将它放在 sapply 中以避免繁琐的 for 循环。

t(sapply(c("W", "X"), \(x) train_test_perf(train_data=dat, test_data=newdat, model=x, termLabels=x)))
#      Model R_train   R_test      
# [1,] "W"   0.1686495 -0.001738604
# [2,] "X"   0.4138526 0.2992374

英文:

Using a variable as formula doesn't stores the variable not the formula which might be the issue. We can use a do.call.

train_test_perf &lt;- function(train_data, test_data, model, termLabels) {
  fixForm &lt;- reformulate(termlabels=termLabels, response=&quot;Y&quot;)
  fit &lt;- do.call(nlme::lme, list(fixForm, data=quote(train_data), random=~ 1|ID))
  train_pred &lt;- predict(fit, newdata=train_data, level=0, na.action=na.exclude)
  rtrain &lt;- cor.test(train_data$Y, train_pred)
  test_pred &lt;- predict(fit, newdata=test_data, level=0, na.action=na.exclude)
  rtest &lt;- cor.test(test_data$Y, test_pred)
  tmp &lt;- data.frame(Model=model, R_train=rtrain$estimate, 
                    R_test=rtest$estimate)
  return(tmp)
}

Finally put it in an sapply to avoid tedious for loops.

t(sapply(c(&quot;W&quot;, &quot;X&quot;), \(x) train_test_perf(train_data=dat, test_data=newdat, model=x, termLabels=x)))
#      Model R_train   R_test      
# [1,] &quot;W&quot;   0.1686495 -0.001738604
# [2,] &quot;X&quot;   0.4138526 0.2992374

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

predict.lme 无法解释由变量定义的公式

问题

答案1

将自定义包的所有函数导出到一个文件中。

在R包工作流中，如何将图像添加到Shiny应用程序中？

有一个R函数可以根据以下条件对数据框进行变换并创建一个新的数据框吗？

在R中使用Highcharter在Highcharts饼图上显示标签名称和数值。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。