网络协议(十):HTTP(报文格式、请求方法、头部字段、状态码、跨域)

2025-05-08 15:49:11

一、HTTPHTTP(Hyper Text Transfer Protocol),超文本传输协议 是互联网中应用最广泛的应用层协议之一设计HTTP最初的目的是:提供一种发布和接收HTML页面的方法,由URI来标识具体的资源后面用HTTP来传递的数据格式不仅仅是HTML,应用非常广泛HTML( Hyper Text Markup Language):超文本标记语言 用以编写网页 版本

1991年,HTTP/0.9 只支持GET请求方法获取文本数据(比如HTML文档),且不支持请求头、响应头等,无法向服务器传递太多信息1996年,HTTP/1.0 支持POST、HEAD等请求方法,支持请求头、响应头等,支持更多种数据类型(不再局限于文本数据)浏览器的每次请求都需要与服务器建立一个TCP连接,请求处理完成后立即断开TCP连接1997年,HTTP/1.1(最经典、使用最广泛的版本) 支持PUT、DELETE等请求方法采用 持久连接(Connection: keep-alive),多个请求可以共用同一个TCP连接2015年,HTTP/2.02018年,HTTP/3.0 标准

由万维网协会(W3C)、互联网工程任务组(IETF)协调制定,最终发布了一系列的RFCRFC(Request For Comments,可以译为:请求意见稿) HTTP/1.1最早是在1997年的 RFC 2068 中记录的HTTP/2标准于2015年5月以 RFC 7540 正式发表,取代HTTP/1.1成为HTTP的实现标准1996年3月,清华大学提交的适应不同国家和地区中文编码的汉字统一传输标准被IETF通过为RFC 1922;成为中国大陆第一个被认可为RFC文件的提交协议二、报文格式 URL的编码

URL中一旦出现了一些特殊字符(比如中文、空格),需要进行编码 在浏览器地址栏输入URL时,是采用 UTF-8 进行编码例如: 编码前:https://www.baidu.com/s?wd=百度编码后:https://www.baidu.com/s?wd=%E7%99%BE%E5%BA%A6可通过 Java 将 “百度” 用 UTF-8 解码后转为16进制查看:

代码语言:javascript代码运行次数:0运行复制public class Main {

public static void main(String[] args) throws Exception {

byte[] bytes = "百度".getBytes(StandardCharsets.UTF_8);

for (byte b : bytes) {

System.out.print(Integer.toHexString(b & 0xFF) + " "); //保留低8位

}

}

}输出结果:e7 99 be e5 ba a6

三、请求方法GET:常用于读取的操作,请求参数直接拼接在URL的后面(浏览器对URL是有长度限制的)POST:常用于添加、修改、删除的操作,请求参数可以放到请求体中(没有大小限制)HEAD:请求得到与GET请求相同的响应,但没有响应体 使用场景:在下载一个大文件前,先获取其大小(HEAD),再决定是否要下载(GET)。以此可以节约带宽资源OPTIONS:用于获取目的资源所支持的通信选项,比如 服务器支持的请求方法 OPTIONS * HTTP/1.1通过向 Tomcat 发送 OPTIONS请求,可以知道它支持以下请求方法

PUT:用于对已存在的资源进行整体覆盖PATCH:用于对资源进行部分修改(资源不存在,会创建新的资源)DELETE:用于删除指定的资源TRACE:请求服务器回显其收到的请求信息,主要用于HTTP请求的测试或诊断CONNECT:可以开启一个客户端与所请求资源之间的双向沟通的通道,它可以用来创建隧道(tunnel) 可以用来访问采用了 SSL (HTTPS) 协议的站点四、头部字段(Header Field)头部字段可以分为4种类型

请求头字段(Request Header Fields) 有关要获取的资源或客户端本身信息的消息头响应头字段(Response Header Fields) 有关响应的补充信息,比如服务器本身(名称和版本等)的消息头实体头字段(Entity Header Fields) 有关实体主体的更多信息,比如主体长度(Content-Length)或其MIME类型通用头字段(General Header Fields) 同时适用于请求和响应消息,但与消息主体无关的消息头 请求头字段

Refer 可用于 防盗链

注意:q 值越大,表示优先级越高,如果不指定q值,默认是1.0(1.0是最大值)

range用于下载断点续传,记录下载字节位置

响应头字段

Content-Disposition 使用实例:

代码语言:javascript代码运行次数:0运行复制@Override

protected void doPost(HttpServletRequest request, HttpServletResponse response)

throws ServletException, IOException {

response.setContentType("text/plain; charset=UTF8");

response.setHeader("Content-Disposition", "attachment; filename=\"lzy.txt\"");

response.getWriter().write("这是我的文件数据");

}五、状态码(Status Code) 状态码可以分为5类

信息响应:100~199成功响应:200~299重定向:300~399客户端错误:400~499服务器错误 :500~599 常见状态码

100 Continue 请求的初始部分已经被服务器收到,并且没有被服务器拒绝。客户端应该继续发送剩余的请求,如果请求已经完成,就忽略这个响应允许客户端发送带请求体的请求前,判断服务器是否愿意接收请求(服务器通过请求头判断)在某些情况下,如果服务器在不看请求体就拒绝请求时,客户端就发送请求体是不恰当的或低效的200 OK:请求成功302 Found:请求的资源被暂时的移动到了由Location头部指定的URL上304 Not Modified:说明无需再次传输请求的内容,也就是说可以使用缓存的内容400 Bad Request:由于语法无效,服务器无法理解该请求401 Unauthorized:由于缺乏目标资源要求的身份验证凭证403 Forbidden:服务器已经理解请求,但是拒绝执行它404 Not Found:服务器端无法找到所请求的资源405 Method Not Allowed:服务器禁止了使用当前HTTP方法的请求(请求方式错误)406 Not Acceptable:服务器端无法提供与Accept-Charset以及Accept-Language指定的值相匹配的响应408 Request Timeout:服务器想要将没有在使用的连接关闭500 Internal Server Error:所请求的服务器遇到意外的情况并阻止其执行请求501 Not Implemented:请求的方法不被服务器支持,因此无法被处理 服务器必须支持的方法(即不会返回这个状态码的方法)只有 GET 和 HEAD502 Bad Gateway:作为网关或代理角色的服务器,从上游服务器(如tomcat)中接收到的响应是无效的503 Service Unavailable:服务器尚未处于可以接受请求的状态 通常造成这种情况的原因是由于服务器停机维护或者已超载六、跨域 浏览器有个同源策略 (Same-Origin Policy)

它规定了:默认情况下,AJAX请求只能发给同源的URL同源是指3个相同:协议、域名(IP)、端口img、script、link、iframe、video、audio 等标签不受同源策略的约束 解决 AJAX跨域请求的常用方法

CORS (Cross-Origin Resource Sharing),跨域资源共享客户端:基本所有的浏览器都支持(IE至少是IE10版本)服务器:需要返回相应的响应头(比如 Access-Control-Allow-Origin),告知浏览器这是一个允许跨域的请求Access-Control-Allow-Origin 用于允许哪些源头可以跨域

如果不设置允许跨域,则会出现下面情况:

在返回响应时要设置允许跨域,即可跨域访问资源

设置跨域后,即可成功访问页面