Net3 - 应用层协议 (HTTP 与 HTTPS)

约 2137 字大约 7 分钟

应用层

HTTP 是超文本传输协议，信息是明文传输，存在安全风险的问题。HTTPS 则解决 HTTP 不安全的缺陷，在 TCP 和 HTTP 网络层之间加入了 SSL/TLS 安全协议，使得报文能够加密传输。
HTTP 连接建立相对简单， TCP 三次握手之后便可进行 HTTP 的报文传输。而 HTTPS 在 TCP 三次握手之后，还需进行 SSL/TLS 的握手过程，才可进入加密报文传输。
两者的默认端口不一样，HTTP 默认端口号是 80，HTTPS 默认端口号是 443。
HTTPS 协议需要向 CA（证书权威机构）申请数字证书，来保证服务器的身份是可信的

HTTP 由于是明文传输，所以安全上存在以下三个风险：

HTTPS 在 HTTP 与 TCP 层之间加入了 SSL/TLS 协议，可以很好的解决了上述的风险：

HTTPS 是如何解决上面的三个风险的？

HTTPS 协议会对传输的数据进行加密，而加密过程是使用了非对称加密实现

HTTPS 的整体过程分为证书验证和数据传输阶段，具体的交互过程如下：

Client 发起一个 HTTPS 的请求
Server 把事先配置好的公钥证书返回给客户端
Client 验证公钥证书：比如是否在有效期内，证书的用途是不是匹配 Client 请求的站点，是不是在 CRL 吊销列表里面，它的上一级证书是否有效，这是一个递归的过程，直到验证到根证书（操作系统内置的 Root 证书或者 Client 内置的 Root 证书），如果验证通过则继续，不通过则显示警告信息
Client 使用伪随机数生成器生成加密所使用的对称密钥，然后用证书的公钥加密这个对称密钥，发给 Server
Server 使用自己的私钥解密这个消息，得到对称密钥。至此，Client 和 Server 双方都持有了相同的对称密钥
Server 使用对称密钥加密明文内容 A，发送给 Client
Client 使用对称密钥解密响应的密文，得到明文内容 A
Client 再次发起 HTTPS 的请求，使用对称密钥加密请求的明文内容 B，然后 Server 使用对称密钥解密密文，得到明文内容 B

非对称加密保证秘密交互设计的私钥

对称加密基于该私钥进行内容传输

采用的是对称加密和非对称加密结合的「混合加密」方式：

采用「混合加密」的方式的原因：

为了保证传输的内容不被篡改，我们需要对内容计算出一个「指纹」，然后同内容一起传输给对方。

对方收到后，先是对内容也计算出一个「指纹」，然后跟发送方发送的「指纹」做一个比较，如果「指纹」相同，说明内容没有被篡改，否则就可以判断出内容被篡改了

那么，在计算机里会用**摘要算法（哈希函数）**来计算出内容的哈希值，也就是内容的「指纹」，这个哈希值是唯一的，且无法通过哈希值推导出内容

通过哈希算法可以确保内容不会被篡改，但是并不能保证「内容 + 哈希值」不会被中间人替换，因为这里缺少对客户端收到的消息是否来源于服务端的证明

比如消息在某个路由器传输，内容被人全改了，并修改了对应的指纹，但接受的验证了也不知道

那为了避免这种情况，计算机里会用非对称加密算法来解决，共有两个密钥：

这两个密钥可以双向加解密的，比如可以用公钥加密内容，然后用私钥解密，也可以用私钥加密内容，公钥解密内容。

流程的不同，意味着目的也不相同：

公钥加密，私钥解密。这个目的是为了保证内容传输的安全，因为被公钥加密的内容，其他人是无法解密的，只有持有私钥的人，才能解密出实际的内容；
私钥加密，公钥解密。这个目的是为了保证消息不会被冒充，因为私钥是不可泄露的，如果公钥能正常解密出私钥加密的内容，就能证明这个消息是来源于持有私钥身份的人发送的。

一般我们不会用非对称加密来加密实际的传输内容，因为非对称加密的计算比较耗费性能的。

所以非对称加密的用途主要在于通过「私钥加密，公钥解密」的方式，来确认消息的身份，我们常说的数字签名算法，就是用的是这种方式，不过私钥加密内容不是内容本身，而是对内容的哈希值加密

私钥是由服务端保管，然后服务端会向客户端颁发对应的公钥。如果客户端收到的信息，能被公钥解密，就说明该消息是由服务器发送的

但这种方式存在一个致命漏洞：无法保证对方的真实身份。比如你访问了个伪造网站，但你以为是真的，实际上是别人伪造的

黑客可以自己生成一对公私钥，然后用自己的私钥签名消息，你用黑客给的"公钥"一验...完全有效，但你根本没在和真实网站通信。

而你就把所有信息全部告诉了盗版网站

关键问题是：如何确保你收到的"公钥"就是真的公钥，而不是黑客的公钥？

这就需要借助第三方权威机构 CA （数字证书认证机构）。

CA 的作用是：用自己的私钥对服务器的公钥进行签名，生成数字证书。这样做的好处是：

整个信任链就是：

你信任CA的公钥（内置）
    ↓
用CA的公钥验证服务器公钥的签名
    ↓
签名有效 = 这个公钥确实是服务器的
    ↓
现在你可以放心使用这个公钥了

通过数字证书的方式，解决了冒充的风险，保证了公钥的真实性。