从输入URL到页面完成加载

这个看似简单的过程, 其实藏着非常多的基础知识点

首先总结下大致的流程有哪些然后进行展开阐述:

输入URL后 DNS查询
建立TCP连接
发送HTTP请求
服务器处理请求并返回报文
浏览器解析并render页面
完成后连接断开

# URL 和 URI

这俩就差一个字母, 到底有什么差别呢?

URI 统一资源标志符 (Uniform Resource Identifier), 某个协议方案表示的资源的定位标识符, 用来标记资源本身(这里的协议方案指当前采用的协议)
URL 统一资源定位符 (Uniform Resource Locator), 则指资源在互联网中的地址

这里举一个现实一点的例子加以说明: 张三是xxx公司的老板, 公司的地址在成都市春熙路666号;

这其中, xxx公司老板张三, 就是URI, 它表明了这个资源(张三这个人)本身; 位于成都市春熙路666号的xxx公司的老板张三就是的 URL, 它表明了这个资源是什么, 同时如何找到它

实际上, URL 是 URI 的子集, 因为 URL 也可以直接访问到资源。

# DNS 查询

巩固一下 DNS的定义, 全称是Domain Name System, 指域名系统, 主要用于域名和IP地址的转换

如果你输入的是纯 IP 地址, 则不会进行DNS查询, 所以输入域名的情况才会进行DNS查询, 域名只是为了方便记忆, 本节内容的前提是输入的URL是域名:

域名的定义

由一串用点分隔的名字(www.baidu.com)组成的Internet上某一台计算机或计算机组的名称，用于在数据传输时标识计算机的电子方位（有时也指地理位置）

String

这里是解说:

首先浏览器查找本地DNS(Local DNS Server) 缓存的记录, 如果有就直接返回IP
如果上一步没有找到, 则往上到根DNS(Root DNS Server), 根DNS会判断去找哪个顶级服务器
顶级DNS, 即TLD(Top-Level DNS Server), TLD 会去找正确的授权服务器
在授权DNS(Authoritative DNS Server) 内即可获取到正确的DNS结果, 并返回正确的IP

详细可以在这里了解, How DNS works, 英文水平差点估计看着吃力

# TCP 连接

经过上一步的DNS查询后, 接下来就要开始将获取到的IP(Internet Protocol)拿来建立TCP连接了, TCP(Transmission Control Protocol) 是一种面向连接的、可靠的、基于字节流的传输层通信协议。

* 本节使用 WireShark 抓包工具进行演示辅助理解

# TCP/IP协议族的模型

关于TCP/IP协议族, 也可以点这里查看

TCP/IP 模型分为四层: 应用层, 传输层, IP层, 链路层。

String

懵逼树下懵逼果, 懵逼树前你和我, 下面就开始用刚刚提到的抓包工具来访问一下鹅网 www.qq.com, 在wireshark里面查看每一个层都是啥样的

String

# TCP 的三次握手

三次握手(Three-way Handshake), 是指 建立一个TCP连接时, 客户端和服务器总共要发送三个包。

这里访问一哈成都理工大学官网, 在wireshark找到如图所示的这一条, 并追踪其TCP流:

String

第一次握手: 客户端发送 SYN = 1, seq = x
第二次握手: 服务器发送 SYN = 1, seq = y, ACK = 1, ack = x + 1
第三次握手: 客户端发送 seq = x + 1, ACK = 1, ack = y + 1

有点复杂, 可以通过简略版图示来理解:

String

这里我有看到一个神奇的比喻:

在一个漆黑的夜晚对面有个妹子走来, 由于环境影响不能完全确认是不是熟人, 这时候就需要招手来互相确认是不是认识:

你首先向妹子招手(send SYN)，妹子看到你向自己招手后，向你点了点头挤出了一个微笑(send ACK)。你看到妹子微笑后确认了妹子成功辨认出了自己(进入estalished 确认状态);。

妹子有点不好意思, 出于礼貌点了点头露出了微笑(send ACK), 但是她也不完全确定你是在跟她打招呼, 万一是别人呢, 于是她也向你确认: 招手和微笑(send SYN), 这时候你发现她也在招手跟你确认, 于是你再次以点头和微笑回应(send ACK), 这样你们就快速走到跟前相认啦!

回顾一下这个过程:

你招手
妹子点头微笑
妹子招手
你点头微笑

其中妹子点头微笑和招手是可以同时进行的, 于是简化一下, 就成了标准的 '三次握手'

你招手 (SYN)
妹子点头微笑并招手 (SYN & ACK)
你点头微笑 (ACK)

# HTTP 请求

握完手之后, TCP连接就建立好了, 接下来就是常用到的请求内容了, 浏览器的开发者工具就能捕获到这些内容, 例如 GET 请求等

# HTTP

这个东西说起来就很广了, HTTP (Hyper Text Transform Protocol) 意为超文本传输协议, 这个协议建立在 TCP/IP 协议族之上

举例说明, 客户端发起了这么一个请求, 以下是发送的请求报文的组成:

什么是报文

用于 HTTP 协议交互的信息被称为 HTTP 报文, 是由多行（用 CR回车符+LF换行符作换行符）数据构成的字符串文本。 HTTP 报文大致可分为报文首部和报文主体两块。两者由最初出现的空行（CR+LF）来划分。通常，并不一定要有报文主体。

message

GET  /index.html  HTTP/1.1
// 请求头部
Host: somehost.com
Connection: keep-alive
Content-Type: application/x-www-form-urlencoded
Content-Length: 18

// 内容实体, 它上方是有一个 空行 的, 用来分隔, 表示没有请求头了
name=zoomze&age=26

1
2
3
4
5
6
7
8
9

这就是客户端发送的请求报文的内容, GET 指方法(method), /index.html 指资源对象, 也称之为请求URI, HTTP/1.1 是协议版本, 这三个内容又被称为请求行, 是属于报文首部的内容;

HTTP 协议版本

HTTP/1.0 支持: GET, POST, HEAD HTTP/1.1 新增: OPTIONS, PUT, DELETE, TRACE, CONNECT

HEAD: 用于检测通信状态, 与 GET 唯一的区别是: HEAD 不返回报文主体 OPTIONS: 用于查询对应URI所支持的方法 TRACE: 方法容易引发XST跨站追踪, 并不常用, 略 CONNECT: 要求用隧道协议连接代理

HTTP/1.1 所有的链接都是持久连接(Connection: keep-alive), 但是在 HTTP/1.0 并未标准化, 同时由于持久连接的存在, 多数据请求得以实现以管线化(pipelining), 就跟异步的概念差不多

然后是请求头部, 是以键值对的形式存在的, Host指主机名; Content-Type表明客户端发送的实体数据的数据类型; Content-Length指实体的字符长度; 除上述提到几个头部内容还有User-Agent: 客户端本身(浏览器)的信息; Accept: 客户端希望接收到的数据类型

服务器则会发送一些响应:

HTTP/1.1 200 OK
Date: Tue, 10 Jul 2020 15:50:15 GMT
Content-Length: 666
Content-Type: text/html

// 这里同样有一个空行, 用于分隔
<html>
...

1
2
3
4
5
6
7
8

其中协议版本不再赘述, 200 指状态码(satus code) OK是原因短语(reason-phrase) 下方三行都是首部字段(header field)

接着就是资源实体的主体(entity body)

# HTTPS

HTTPS 中的 'S' 指 SSL/TLS 的鉴权/认证

这部分内容去看看阮老师的就好, 这儿就不班门弄斧了...

SSL/TLS协议运行机制的概述图解SSL/TLS协议

# HTTP 响应

服务器处理上述的请求完毕后, 开始执行响应动作, 返回所请求的内容或是JSON数据一类的都是在这个阶段内

# 浏览器解析 & 页面渲染

拿到了服务器返回的东西之后呢, 然后就是把这些东西呈现给用户了

根据服务器返回的东西类型不同, 浏览器对应的解析也是有不同的, 这里以返回 HTML 页面为例进行说明(不考虑返回JSON或者XML)

# 渲染树 Render Tree

浏览器渲染的过程其实是渲染 DOM 树和 CSSOM 树的融合, 两者的组合构成了浏览器的渲染树 Render Tree, 浏览器根据这些信息决定渲染谁和渲染再网页的哪个位置上, 例如 display: none 属性就会影响到对应节点的渲染。

处理 HTML 标记并构建 DOM 树。
处理 CSS 标记并构建 CSSOM 树。
将 DOM 与 CSSOM 合并成一个渲染树。
根据渲染树来布局，以计算每个节点的几何信息。
将各个节点绘制到屏幕上。

渲染完成后，连接即断开；

至此，就完成了从输入URL 到渲染完成页面的全部过程

# Web 优化

Web优化我们知道，人的耐心是有限的，一个页面如果超过8s，人基本上不会等了，这会对业务产生巨大影响。我们该如何去优化页面呢？

思路很简单，就是按照我们前面介绍的几大步骤去优化。我们先回顾一下几大步骤：

DNS查询
TCP连接
发送HTTP请求
Server处理HTTP请求并返回HTTP报文
浏览器解析并render页面
HTTP连接断开

以下简单的说明了一些可优化的点：

尽量将server离用户近一些，例如人处在中国访问Apple，应该是Apple中国站提供服务，GSLB很重要。
不要把layout嵌入一层又一层，简单说就是嵌套别太深，不然影响解析和渲染性能。
有些数据可以在后台处理的，就不要在前端通过JavaScript处理了。
如果请求过大，Load Balance这些手段还是要上的。
保持HTTP连接，合理设置Connection。
后台事件性能要高，能够及时将结果返回给用户。

ZooMze's World

Choose mode