英文:
Go xml.Marshal returns invalid characters
问题
我使用下面的代码生成字符串 str 的 XML 编码:
str := string([]byte{0x01})
marshalBytes, _ := xml.Marshal(str)
fmt.Println(string(marshalBytes)) // 输出: <string>�</string>; � 在字节中表示为 [239 191 189]。
显然,� 并不等同于 0x01。
我该如何修复这个问题?
英文:
I use the code below generate a XML encoding of string str:
str := string([]byte{0x01})
marshalBytes, _ := xml.Marshal(str)
fmt.Println(string(marshalBytes)) // output: <string>�</string>; � is [239 191 189] in bytes.
Obviously, � is not equivalent of 0x01.
How can I fix it?
答案1
得分: 5
字节[239 191 189]是Unicode替换字符的UTF-8编码。
XML编组器将字节0x1替换为Unicode替换字符,因为字节0x01在XML中不是合法字符。
无法阻止XML编组器使用替换字符。
英文:
The bytes [239 191 189] are the UTF-8 encoding of the Unicode Replacement Character.
The XML marshaler replaces the byte 0x1 with the Unicode Replacement Character because
the byte 0x01 is not a legal character in XML.
It is not possible to prevent the XML marshaler from using the replacement.
通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库,让每个人都能够通过互相帮助和分享经验来进步。
评论