2023年3月8日 19:23:01go评论98阅读模式

英文:

How to sort the Rows with identical column values in R

问题

我的数据框看起来像这样：

dput(Data)
structure(c(NA, "FGFR3", "FAT1", "ARID1A", "CREBBP", "HRAS", 
"SF3B1", "RHOB", "FBXW7", "KRAS", "TP53", "PIK3CA", "RHOA", "ASXL2", 
"HLA-A", "APC", "ATM", "ARID2", "PTEN", "CDM1", "RBM10", "ERBB4", 
"ERCC2", "BAP1", "KMT2D", "ERBB2", "SMC1A", "RB1", "BCLAF1", 
NA, NA, NA, NA, NA, NA, NA, "TP53", "RHOA", "FGFR3", "SF3B1", 
"PTEN", "RB1", "FAT1", "KDM6A", "ARID1A", "PIK3CA", "CDKN1A", 
"ERBB4", "RBM10", "ASXL2", "HRAS", "BAP1", "KMT2A", "ERBB3", 
"RHOB", "KRAS", "APC", "KMT2C", "BCLAF1", "KMT2D", "CDKN2A", 
"PSIP1", "FBXW7", "HLA-A", "ERBB2", "ATM", "RXRA", "CREBBP", 
"EP300", "ARID2", "KDM6A", "CDKN1A", "KMT2A", "ERBB3", "KMT2C", 
"CDKN2A", "PSIP1", "RXRA", "EP300", NA, NA, NA, NA, NA, NA, NA, 
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, 
NA, NA), dim = c(35L, 3L), dimnames = list(NULL, c("F_d", "M_d", "unique")))

我想按照这样的方式对这些数据进行排序或排序，如果某一列的值在两列或三列之间是相同的，它应该在同一行中。

我的输出应该是：

   F_d    M_d  Unique
1  TP53   TP53   NA
2   NA  CDKN1A CDKN1A

英文:

My df looks like

dput(Data)
structure(c(NA, &quot;FGFR3&quot;, &quot;FAT1&quot;, &quot;ARID1A&quot;, &quot;CREBBP&quot;, &quot;HRAS&quot;, 
&quot;SF3B1&quot;, &quot;RHOB&quot;, &quot;FBXW7&quot;, &quot;KRAS&quot;, &quot;TP53&quot;, &quot;PIK3CA&quot;, &quot;RHOA&quot;, &quot;ASXL2&quot;, 
&quot;HLA-A&quot;, &quot;APC&quot;, &quot;ATM&quot;, &quot;ARID2&quot;, &quot;PTEN&quot;, &quot;CDH1&quot;, &quot;RBM10&quot;, &quot;ERBB4&quot;, 
&quot;ERCC2&quot;, &quot;BAP1&quot;, &quot;KMT2D&quot;, &quot;ERBB2&quot;, &quot;SMC1A&quot;, &quot;RB1&quot;, &quot;BCLAF1&quot;, 
NA, NA, NA, NA, NA, NA, NA, &quot;TP53&quot;, &quot;RHOA&quot;, &quot;FGFR3&quot;, &quot;SF3B1&quot;, 
&quot;PTEN&quot;, &quot;RB1&quot;, &quot;FAT1&quot;, &quot;KDM6A&quot;, &quot;ARID1A&quot;, &quot;PIK3CA&quot;, &quot;CDKN1A&quot;, 
&quot;ERBB4&quot;, &quot;RBM10&quot;, &quot;ASXL2&quot;, &quot;HRAS&quot;, &quot;BAP1&quot;, &quot;KMT2A&quot;, &quot;ERBB3&quot;, 
&quot;RHOB&quot;, &quot;KRAS&quot;, &quot;APC&quot;, &quot;KMT2C&quot;, &quot;BCLAF1&quot;, &quot;KMT2D&quot;, &quot;CDKN2A&quot;, 
&quot;PSIP1&quot;, &quot;FBXW7&quot;, &quot;HLA-A&quot;, &quot;ERBB2&quot;, &quot;ATM&quot;, &quot;RXRA&quot;, &quot;CREBBP&quot;, 
&quot;EP300&quot;, &quot;ARID2&quot;, &quot;KDM6A&quot;, &quot;CDKN1A&quot;, &quot;KMT2A&quot;, &quot;ERBB3&quot;, &quot;KMT2C&quot;, 
&quot;CDKN2A&quot;, &quot;PSIP1&quot;, &quot;RXRA&quot;, &quot;EP300&quot;, NA, NA, NA, NA, NA, NA, NA, 
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, 
NA, NA, NA), dim = c(35L, 3L), dimnames = list(NULL, c(&quot;F_d&quot;, 
&quot;M_d&quot;, &quot;unique&quot;)))

I want to sort or order this data in a way that if a column value is common between two or three column it should be in same row.

Like my output should me

 F_d  M_d  Unique
 TP53 TP53 NA
  NA  CDKN1A CDKN1A

答案1

得分: 1

通过创建一个包含所有可能出现的列，你可以解决你的问题。

library(dplyr)
df = as.data.frame(df)
list_tot = data.frame(x=unlist(df), row.names = 1:105) %>%
  distinct() %>%
  filter(is.na(x)==FALSE)
interm1 <- left_join(list_tot,
                     df %>% select(F_d) %>% mutate(x=F_d),
                     by="x")
interm2 <- left_join(interm1,
                     df %>% select(M_d) %>% mutate(x=M_d),
                     by="x")
df2 <- left_join(interm2,
                 df %>% select(unique) %>% mutate(x=unique),
                 by="x") %>%
  select(-x)

解释这段代码，list_tot 将基于表中的所有项创建一个唯一的列表。然后通过 left_join 查看这些项是否在不同的列中（每个列都需要一个 left_join）。df2 应该看起来像你需要的样子！

希望这对你有帮助！

英文:

By creating a column with all the possible occurences, you can solve your problem

library(dplyr)
df = as.data.frame(df)
list_tot = data.frame(x=unlist(df), row.names = 1:105) %&gt;% 
  distinct() %&gt;% 
  filter(is.na(x)==FALSE)
interm1 &lt;- left_join(list_tot,
                     df %&gt;% select(F_d) %&gt;% mutate(x=F_d),
                     by=&quot;x&quot;)
interm2 &lt;- left_join(interm1,
                     df %&gt;% select(M_d) %&gt;% mutate(x=M_d),
                     by=&quot;x&quot;)
df2 &lt;- left_join(interm2,
                 df %&gt;% select(unique) %&gt;% mutate(x=unique),
                 by=&quot;x&quot;) %&gt;% select(-x)

To explain the code, list_tot will create a unique list based on all the items in your table. Then the left_join to see if those items are in the different columns (one left_join by column needed)
df2 should look like what you need!

Hope this will help you

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

如何在R中对具有相同列数值的行进行排序

问题

答案1

email dataframe as table in mail body using python

查看数据框的属性，但不包括行名。

如何仅保留列中的第一组重复项，如果有多个重复项。

检查加入队列时的最大等待时间。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。