问题

让我们假设我有一个向量

letters <- c("a", "b", "c", "d", "e")

我还有一个名为 df 的表，其中包含一个列，其中包含值，如 a_1, b_2, c_3, 等等。

我该如何过滤 letters，只保留在 df 的列中可用的字符。

例如，letters <- c("a", "b", "c", "d", "e", "f")，df$column 的值为 "a_1", "d_3", "b_7"。letters 现在应该变成 c("a", "b", "d")。

英文:

Let's say I have a vector

letters &lt;- c(&quot;a&quot;, &quot;b&quot;, &quot;c&quot;, &quot;d&quot;, &quot;e&quot;)

I also have a table named df which has a column containing values such as "a_1", "b_2", c_3", ...etc.

How do I filter letters to only keep characters that are available in the column from df.

For example, letters <- c("a", "b", "c", "d", "e", "f") and df$column values are "a_1", "d_3", "b_7". letters should now become c("a", "b", "d").

答案1

得分: 1

我们可以从列中移除_和一个或多个数字(\\d+)，使用%in%创建一个逻辑向量并对letters对象进行子集操作。

letters[letters %in% sub("_\\d+", "", df$column)]
[1] "a" "b" "d"

数据

df <- data.frame(column = c("a_1", "d_3", "b_7"))

英文:

We may remove the _ and one or more digits (\\d+) from the column, use %in% to create a logical vector and subset the letters object

letters[letters %in% sub(&quot;_\\d+&quot;, &quot;&quot;, df$column)]
[1] &quot;a&quot; &quot;b&quot; &quot;d&quot;

data

df &lt;- data.frame(column = c(&quot;a_1&quot;, &quot;d_3&quot;, &quot;b_7&quot;))

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

根据列中的数值筛选向量。

问题

答案1

数据

data

无法更改带有 $ 的列名。

R Shapefile未正确绘制纬度/经度

如何根据分类变量在R中从某些行的值中减去其他行的值

在ggplot2中，根据给定条件对绘制的线进行对齐。

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论