问题

if df1 look like a df2, df1 would replaced to df2

英文:

i want to replace a df1 data, with df2, which df2 is a data like df1
example

df1 &lt;- data.frame(
  name = c(
    &quot;A. MAHJUM-61365&quot;,
    &quot;A. MAHJUM-61365. MAHJUM-61365&quot;,
    &quot;A. RIZAL. AD-11002795&quot;,
    &quot;A. RIZAL. AD-11002795. RIZAL. AD-11002795&quot;,
    &quot;ABD. KADIR-60447&quot;,
    &quot;ABD. KADIR-60447ABD. KADIR-60447&quot;,
    &quot;ABD. KAHAR-62551&quot;,
    &quot;ABD. RASYID DS-11002082&quot;,
    &quot;ABDREAS APUNG @SANY&quot;,
    &quot;ABDUL AZIS @HYUNDAY&quot;,
    &quot;ABDUL AZIZ @HYUNDAI&quot;,
    &quot;ABDUL AZIZ@HYUNDAI&quot;
  ))

and df2 is

df2 &lt;- data.frame(
  name = c(
    &quot;A. MAHJUM-61365&quot;,
    &quot;A. RIZAL. AD-11002795&quot;,
    &quot;ABD. KADIR-60447&quot;,
    &quot;ABD. KAHAR-62551&quot;,
    &quot;ABD. RASYID DS-11002082&quot;,
    &quot;ABDREAS APUNG @SANY&quot;,
    &quot;ABDUL AZIS @HYUNDAY&quot;
  ))

if df1 look like a df2, df1 would replaced to df2

答案1

得分: 3

如它是子字符串匹配，我们可以使用 fuzzyjoin。

library(dplyr)
library(fuzzyjoin)
regex_left_join(df1, df2, by = 'name') %>%
  transmute(name = coalesce(name.y, name.x))

或者使用基于距离的方法。

stringdist_left_join(df1, df2, by = 'name') %>%
  transmute(name = coalesce(name.y, name.x))

英文:

As it is substring match, we can use fuzzyjoin

library(dplyr)
library(fuzzyjoin)
regex_left_join(df1, df2, by = &#39;name&#39;) %&gt;% 
  transmute(name = coalesce(name.y, name.x))

or use a distance based approach

 stringdist_left_join(df1, df2, by = &#39;name&#39;) %&gt;% 
   transmute(name = coalesce(name.y, name.x))

</details>



# 答案2
**得分**: 0

你可以使用 `adist` 来查找最佳匹配并替换它们。
```R
i <- max.col(-adist(df1$name, df2$name, partial=TRUE))
df1$name <- df2$name[i]

df1
#                      name
#1          A. MAHJUM-61365
#2          A. MAHJUM-61365
#3    A. RIZAL. AD-11002795
#4    A. RIZAL. AD-11002795
#5         ABD. KADIR-60447
#6         ABD. KADIR-60447
#7         ABD. KAHAR-62551
#8  ABD. RASYID DS-11002082
#9      ABDREAS APUNG @SANY
#10     ABDUL AZIS @HYUNDAY
#11     ABDUL AZIS @HYUNDAY
#12     ABDUL AZIS @HYUNDAY

英文:

You can use adist to find the best match and replace them.

i &lt;- max.col(-adist(df1$name, df2$name, partial=TRUE))
df1$name &lt;- df2$name[i]

df1
#                      name
#1          A. MAHJUM-61365
#2          A. MAHJUM-61365
#3    A. RIZAL. AD-11002795
#4    A. RIZAL. AD-11002795
#5         ABD. KADIR-60447
#6         ABD. KADIR-60447
#7         ABD. KAHAR-62551
#8  ABD. RASYID DS-11002082
#9      ABDREAS APUNG @SANY
#10     ABDUL AZIS @HYUNDAY
#11     ABDUL AZIS @HYUNDAY
#12     ABDUL AZIS @HYUNDAY

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

如何在R中用另一个数据框替代一个数据框

问题

答案1

如何将 ggplot 中的 “fill” 变量的条形图排列在一起？

不同的卡方检验数值在R和在线计算器中

从数据框中提取引号内的字母字符串

如何在R中将XML中的字典解嵌套？

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论