【计算机网络笔记】Web缓存/代理服务器技术

系列文章目录

什么是计算机网络?
什么是网络协议?
计算机网络的结构
数据交换之电路交换
数据交换之报文交换和分组交换
分组交换 vs 电路交换
计算机网络性能(1)——速率、带宽、延迟
计算机网络性能(2)——时延带宽积、丢包率、吞吐量/率
计算机网络体系结构概念
OSI参考模型基本概念
OSI参考模型中非端-端层(物理层、数据链路层、网络层)功能介绍
OSI参考模型中端-端层(传输层、会话层、表示层、应用层)功能介绍
TCP/IP参考模型基本概念,包括五层参考模型
网络应用的体系结构
网络应用进程通信
网络应用对传输服务的需求
Web应用之HTTP协议(涉及HTTP连接类型和HTTP消息格式)
Cookie技术


  • 系列文章目录
  • 功能
  • Web缓存/代理服务器技术解决了什么问题?
  • 如何实现?
  • 示例
  • 条件性GET方法


功能

Web缓存/代理服务器技术能够在不访问服务器的前提下满足客户端的HTTP请求

也就是说如果我们有一个代理服务器,那我们上网看到的页面可能都不是原服务器提供的,而是由代理服务器提供。

Web缓存/代理服务器技术解决了什么问题?

那为什么要发明这种技术?是为了解决性能上的问题。前面的cookie是解决功能上的问题。也就是说,cookie实现了新的功能,而Web缓存/代理服务器技术是优化了性能。那它能够改善哪些性能呢?

  • 缩短客户请求的响应时间。用户的感觉就是网速快。
  • 减少机构/组织的流量。
  • 在大范围内(Internet)实现有效的内容分发。

如何实现?

结构如下:
【计算机网络笔记】Web缓存/代理服务器技术_第1张图片

在客户和服务器之间架设代理服务器,然后用户设定浏览器访问缓存或代理服务器。也就是说浏览器的所有请求都发给了缓存/代理服务器,而不是直接发给原始服务器。那这里就有两种情况:

  • 如果缓存/代理服务器中有用户所请求的对象,那就直接返回了;
  • 如果没有,缓存/代理服务器就向原始服务器发送HTTP 请求,获取对象,然后把返回给客户端同时保存该对象。

所以缓存/代理服务器既充当客户端,也充当服务器

缓存/代理服务器一般由组织或ISP(Internet服务提供商)来架设。

示例

【计算机网络笔记】Web缓存/代理服务器技术_第2张图片

机构内部有一个局域网,速率是10Mbps,机构的局域网接入互联网,速率是1.5Mbps,原始服务器都在互联网上。

假定:

  • 对象的平均大小=100,000比特(100KB)
  • 机构网络中的浏览器平均每秒有15个到原始服务器的请求
  • 从机构路由器到原始服务器的往返延迟=2秒

网络性能分析:

  • 每秒有15个请求,每个请求的对象大小是100KB,那一秒的总的请求消息大小是15*100KB=1.5MB

  • 局域网(LAN)的利用率=15%(1.5/10)。

  • 接入互联网的链路的利用率=100%(1.5/1.5)。当一条链路的利用率接近100%一位着巨大的时间延迟。

  • 总的延迟 = 互联网上的延迟+访问延迟+局域网 延迟

    ​ =2秒+几分钟+几微秒

可以看到这种情况下的时间延迟是非常大的。

解决方法有:

  1. 花钱升级及机构局域网接入互联网的带宽,从1.5Mbps升级为10Mbps。问题是成本太高。

  2. 尝试Web缓存或代理服务器。在机构内部增加一个缓存/代理服务器。假定缓存命中率是0.4。

    网络性能分析:

    • 40%的请求立刻得到满足
    • 60%的请求通过原始服务器满足
    • 接入互联网的链路的利用率下降到60%,从而 其延迟可以忽略不计,例如10微秒
    • 总的平均延迟=互联网上的延迟+访问延迟+局 域网延迟=0.6×2.01秒+0.4×n微秒 < 1.4

问题是如何保证代理服务器和原始服务器的数据是否是一致的。这个靠HTTP里的条件性GET方法。

条件性GET方法

目标:如果缓存/代理服务器有最新的版本,则不需要发送请求对象。

那怎么做呢?

缓存/代理服务器在HTTP请求消息中声明所持有版本的日期。服务器收到之后进行检查,如果如果缓存的版本是最新的,则响应消息中不包含对象,并且响应状态码为304代表没有改变;如果改了就把新的对象发给他,并放回200状态码。

这样意味着当客户访问缓存的时候,缓存有必要利用条件性GET方法向服务器发起请求,当没有发生改变的时候就节省了带宽。这样就解决了前面提到的内容是不是最新、是不是一

你可能感兴趣的:(计算机网络,笔记,代理服务器)