问题

我有一个类似这样的数据框：

> dput(df)
structure(list(Ethnicity = c("Non-Hispanic/Non-Latino", 
"Non-Hispanic/Non-Latino", "Non-Hispanic/Non-Latino", NA, "Non-Hispanic/Non-Latino", 
"Non-Hispanic/Non-Latino", "Hispanic/Latino", "Non-Hispanic/Non-Latino", 
"Non-Hispanic/Non-Latino", NA), Race = structure(c(1L, 
1L, 1L, NA, 5L, 1L, 7L, 1L, 7L, NA), levels = c("White", "2+ Races", 
"American Indian or Alaska Native", "Asian", "Black or African American", 
"Native Hawaiian or Other Pacific Islander", "Other", "Refused/Unknown"
), class = "factor")), row.names = c(NA, -10L), class = c("data.table", 
"data.frame"), .internal.selfref = <pointer: 0x7fe0098120e0>, index = integer(0))

我想要合并Ethnicity和Race列的信息，以便如果个体的种族是 Hispanic/Latino，则将其记录在 Race 列中。如果个体是 Non-Hispanic/Non-Latino，则不需要将该信息复制到 Race 列中。

数据框应该如下所示：

> dput(r)
structure(list(Ethnicity = c("Non-Hispanic/Non-Latino", "Non-Hispanic/Non-Latino", 
"Non-Hispanic/Non-Latino", NA, "Non-Hispanic/Non-Latino", "Non-Hispanic/Non-Latino", 
"Hispanic/Latino", "Non-Hispanic/Non-Latino", "Non-Hispanic/Non-Latino", 
NA), Race = c("White ", "White", "White", NA, "Black or African American", 
"White", "Other (Hispanic/Latino)", "White", "Other", NA)), class = "data.frame", row.names = c(NA, 
-10L))

如您所见，第7行现在在 Race 列中包括个体是 Hispanic/Latino 的信息。

英文:

I have a dataframe that looks like this:

&gt; dput(df)
structure(list(Ethnicity = c(&quot;Non-Hispanic/Non-Latino&quot;, 
&quot;Non-Hispanic/Non-Latino&quot;, &quot;Non-Hispanic/Non-Latino&quot;, NA, &quot;Non-Hispanic/Non-Latino&quot;, 
&quot;Non-Hispanic/Non-Latino&quot;, &quot;Hispanic/Latino&quot;, &quot;Non-Hispanic/Non-Latino&quot;, 
&quot;Non-Hispanic/Non-Latino&quot;, NA), Race = structure(c(1L, 
1L, 1L, NA, 5L, 1L, 7L, 1L, 7L, NA), levels = c(&quot;White&quot;, &quot;2+ Races&quot;, 
&quot;American Indian or Alaska Native&quot;, &quot;Asian&quot;, &quot;Black or African American&quot;, 
&quot;Native Hawaiian or Other Pacific Islander&quot;, &quot;Other&quot;, &quot;Refused/Unknown&quot;
), class = &quot;factor&quot;)), row.names = c(NA, -10L), class = c(&quot;data.table&quot;, 
&quot;data.frame&quot;), .internal.selfref = &lt;pointer: 0x7fe0098120e0&gt;, index = integer(0))

I want to combine the info in both the Ethnicity and Race columns, so that if an individual's ethnicity is Hispanic/Latino, that is recorded in the Race column. If the individual is Non-Hispanic/Non-Latino, then that information does not need to be copied into the race column.

The dataframe should look like this:

&gt; dput(r)
structure(list(Ethnicity = c(&quot;Non-Hispanic/Non-Latino&quot;, &quot;Non-Hispanic/Non-Latino&quot;, 
&quot;Non-Hispanic/Non-Latino&quot;, NA, &quot;Non-Hispanic/Non-Latino&quot;, &quot;Non-Hispanic/Non-Latino&quot;, 
&quot;Hispanic/Latino&quot;, &quot;Non-Hispanic/Non-Latino&quot;, &quot;Non-Hispanic/Non-Latino&quot;, 
NA), Race = c(&quot;White &quot;, &quot;White&quot;, &quot;White&quot;, NA, &quot;Black or African American&quot;, 
&quot;White&quot;, &quot;Other (Hispanic/Latino)&quot;, &quot;White&quot;, &quot;Other&quot;, NA)), class = &quot;data.frame&quot;, row.names = c(NA, 
-10L))

As you can see, row 7 includes that the individual was Hispanic/Latino in the Race column now.

答案1

得分: 1

由于这是一个data.table，我们可以使用data.table方法 - 使用逻辑表达式指定i并使用paste分配（:=）该值。

library(data.table)
df[Ethnicity == "Hispanic/Latino", Race := sprintf("%s (%s)", Race, Ethnicity)]

输出：

> df
                  Ethnicity                      Race
 1: Non-Hispanic/Non-Latino                     White
 2: Non-Hispanic/Non-Latino                     White
 3: Non-Hispanic/Non-Latino                     White
 4:                    <NA>                      <NA>
 5: Non-Hispanic/Non-Latino Black or African American
 6: Non-Hispanic/Non-Latino                     White
 7:         Hispanic/Latino   Other (Hispanic/Latino)
 8: Non-Hispanic/Non-Latino                     White
 9: Non-Hispanic/Non-Latino                     Other
10:                    <NA>                      <NA>

希望这个翻译对你有帮助。

英文:

As it is a data.table, we can use data.table methods - specify the i with a logical expression and paste to assign (:=) the value

library(data.table)
df[Ethnicity == &quot;Hispanic/Latino&quot;, Race := sprintf(&quot;%s (%s)&quot;, Race, Ethnicity)]

-output

&gt; df
                  Ethnicity                      Race
 1: Non-Hispanic/Non-Latino                     White
 2: Non-Hispanic/Non-Latino                     White
 3: Non-Hispanic/Non-Latino                     White
 4:                    &lt;NA&gt;                      &lt;NA&gt;
 5: Non-Hispanic/Non-Latino Black or African American
 6: Non-Hispanic/Non-Latino                     White
 7:         Hispanic/Latino   Other (Hispanic/Latino)
 8: Non-Hispanic/Non-Latino                     White
 9: Non-Hispanic/Non-Latino                     Other
10:                    &lt;NA&gt;                      &lt;NA&gt;

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

合并两列并设置条件？

问题

答案1

带虚拟变量交互的LM模型

当使用lm_robust时，以及texreg仅获取观察数：

使NA在使用调色板函数时变为透明。

根据时区更改时间，但R不识别CEST。

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论