一个服务器返回的页面可能会有不同的编码,但我们常见的编码可能就两类。识别不同的编码有什么用呢?一方面是我们在提交post包的时候需要注意提交符合编码的包让服务器能正常识别(特别是含有中文还有一些符号的时候),另一方面是我们在获取到服务器的信息的时候,能够用正确的编码解析出来,否则就会看到乱码的内容。
常见的网页编码有两种。
第一种,utf-8(或utf8或UTF8之类的),这是一种包含了字母、字符、汉字等在一起的编码,在目前应用最为广泛,它的范围较广,可以使得网页基本用各种语言都不会出现乱码。
第二种,gbk(或叫gb2312)是一种包含中文汉字的编码,部分网页会使用,我们直接获取到的页面如果是这种编码那就可以直接看到汉字了,如果看到的是前一种就需要转换成这一种才能看到正确的汉字。
网页的具体编码可以在协议头或网页源码的<head>部分看到。
课后作业:
本课没有作业。
我相信,你一定会爱上它的!
以下是我们的视频教程:
在线观看:
内容已经隐藏,请注册为本站会员后查看
高清源文件下载:
内容已经隐藏,请注册为本站会员后查看
感谢大家的收看,我们下期再见!
如果你觉得内容不错的话,欢迎点赞,评论和分享哟~
评论