英文:
Fixing foreign/special characters
问题
我有一个包含特殊字符的名单,我希望将它们还原为实际的名字,例如:
Bulcsú Révész
到实际的名字:
Bulcsu Revesz
我有几个类似的名字,重音是否在名字中都无所谓。
英文:
I have a list of names with special characters and I wish to revert them back to the actual names, in this case I want to get from the below examble of;
Bulcsú Révész
to the actual name of
Bulcsu Revesz
I have a few names like this, not fussy if the accent are in the name or not
答案1
得分: 2
你可以使用 xml2
从 HTML 实体代码中恢复名称:
# 输入字符串
input_str <- "Bulcs&#250; R&#233;v&#233;sz"
# 转换
xml2::xml_text(xml2::read_html(charToRaw(input_str)))
# [1] "Bulcsú Révész"
# 如果有多个要转换的名称
input_str_vec <- c("Bulcs&#250; R&#233;v&#233;sz", "M&eacute;lissa", "Fran&ccedil;ois")
# 在编码名称的向量上应用 sapply
sapply(input_str_vec, \(str){
# 转换
xml2::xml_text(xml2::read_html(charToRaw(str)))
})
# Bulcs&#250; R&#233;v&#233;sz M&eacute;lissa Fran&ccedil;ois
# "Bulcsú Révész" "Mélissa" "François"
英文:
You can use xml2
to recover the name from the HTML entity code:
# input string
input_str <- "Bulcs&#250; R&#233;v&#233;sz"
# convert
xml2::xml_text(xml2::read_html(charToRaw(input_str)))
# [1] "Bulcsú Révész"
# If there are multiple names to be converted
input_str_vec <- c("Bulcs&#250; R&#233;v&#233;sz", "M&eacute;lissa", "Fran&ccedil;ois")
# sapply over the vector of encoded names
sapply(input_str_vec, \(str){
# convert
xml2::xml_text(xml2::read_html(charToRaw(str)))
})
# Bulcs&#250; R&#233;v&#233;sz M&eacute;lissa Fran&ccedil;ois
# "Bulcsú Révész" "Mélissa" "François"
通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库,让每个人都能够通过互相帮助和分享经验来进步。
评论