英文:
How to retrieve html document size from url in golang
问题
我使用GoQuery来提取HTML文档中的一些值。现在我需要获取HTML文档的大小(不包括资源)。
在Firefox中,只需点击工具 -> 页面信息(常规)选项卡,就可以查看HTML文档的大小。
我也尝试过net/html
包,但是我无法找到给定URL返回的HTML的大小。有什么线索吗?
英文:
I used GoQuery to retrieve some value within an HTML document. Now I need to get the size of HTML document (without assets).
In Firefox, it's as simple as Tools --> Page Info (General) tab show the Size of the HTML document.
I tried net/html
package as well but I can't find the size of the returned HTML given a URL. Any clues?
答案1
得分: 3
通过以下方式获取文档:
res, err := http.Get(url)
if err != nil {
// 处理错误
}
defer res.Body.Close()
现在你可以:
body, err := ioutil.ReadAll(res.Body)
if err != nil {
// 处理错误
}
l := len(body)
使用GoQuery:
utfBody, err := iconv.NewReader(res.Body, charset, "utf-8")
if err != nil {
// 处理错误
}
doc, err := goquery.NewDocumentFromReader(utfBody)
if err != nil {
// 处理错误
}
关于GoQuery和读取器的更多详细信息,请参阅这里。
英文:
Get the document via:
res, err := http.Get(url)
if err != nil {
// handle error
}
defer res.Body.Close()
Now you can:
body, err := ioutil.ReadAll(res.Body)
if err != nil {
// handle error
}
l := len(body)
To use with GoQuery:
utfBody, err := iconv.NewReader(res.Body, charset, "utf-8")
if err != nil {
// handler error
}
doc, err := goquery.NewDocumentFromReader(utfBody)
if err != nil {
// handler error
}
More datail about GoQuery and readers is here.
通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库,让每个人都能够通过互相帮助和分享经验来进步。
评论