缓存服务Squid简介

1. Squid是什么?

Squid是一个高性能的代理缓存服务器,Squid支持FTP、gopher和HTTP协议。和一般的代理缓存软件不同,Squid用一个单独的、非模块化的、I/O驱动的进程来处理所有的客户端请求。
Squid可运行在大多数Unix和OS/2版本的系统之上,已知的可工作的有:Windows,AIX,Digital Unix,FreeBSD,HP-UX,Irix,Linux,NetBSD,Nextstep,SCO,Solaris

初始版本 1996年7月
稳定版本 3.5.27(2017年8月19日,​8天前)
预览版本 4.0.21(2017年7月2日,​56天前)

2. 主要功能

  • 缓存网站内容,以达到分担源站压力加快访问速度的目的。
    • 热点缓存,只缓存访问热度到达设定级别的网站内容。
    • 合并回源,多个相同的请求只回源一次。
  • ACL访问控制,可针对源IP、目的地IP、域名、URL、访问时间、单一最大连接数限制访问行为。或通过外部程序验证访问者(proxy_auth)。
  • 主要支持协议:HTTP、HTTPS、FTP
  • 网页内容篡改,可根据需求篡改网站内容。
  • 网站头部篡改,可根据需求篡改请求头部。
  • 可针对不同的域名或url配置不同的缓存规则。

3. 应用场景

  • 正向代理(本地网关)
    • 正向代理的典型用途是为在防火墙内的局域网客户端提供访问Internet的途径。
    • 正向代理还可以使用缓存特性减少网络使用率。
    • 正向代理允许客户端通过它访问任意网站并且隐藏客户端自身,因此你必须采取安全措施以确保仅为经过授权的客户端提供服务。
  • 透明代理(cdn,架设于网络运营商主干机房)
    • 提高各个地区访问者的访问速度。
    • 减少源站压力。
    • 减少网络运营商的网间结算费用。
    • 节省网络运营商带宽资源。
  • 反向代理(网站前端)
    • 降低源站服务器的负载。
    • 隐藏源站真实ip。

4. 缓存状态日志

  • TCP_HIT
    Squid发现请求资源的貌似新鲜的拷贝,并将其立即发送到客户端。

  • TCP_MISS
    Squid没有请求资源的cache拷贝。

  • TCP_REFERSH_HIT(squid3.0改为TCP_REFRESH_UNMODIFIED)
    Squid发现请求资源的貌似陈旧的拷贝,并发送确认请求到原始服务器。原始服务器返回304(未修改)响应,指示squid的拷贝仍旧是新鲜的。

  • TCP_REF_FAIL_HIT
    Squid发现请求资源的貌似陈旧的拷贝,并发送确认请求到原始服务器。然而,原始服务器响应失败,或者返回的响应Squid不能理解。在此情形下,squid发送现有cache拷贝(很可能是陈旧的)到客户端。

  • TCP_REFRESH_MISS(squid3.0改为TCP_REFRESH_MODIFIED)
    Squid发现请求资源的貌似陈旧的拷贝,并发送确认请求到原始服务器。原始服务器响应新的内容,指示这个cache拷贝确实是陈旧的。

  • TCP_CLIENT_REFRESH_MISS
    Squid发现了请求资源的拷贝,但客户端的请求包含了Cache-Control: no-cache指令。Squid转发客户端的请求到原始服务器,强迫cache确认。

  • TCP_IMS_HIT
    客户端发送确认请求,Squid发现更近来的、貌似新鲜的请求资源的拷贝。Squid发送更新的内容到客户端,而不联系原始服务器。

  • TCP_SWAPFAIL_MISS
    Squid发现请求资源的有效拷贝,但从磁盘装载它失败。这时squid发送请求到原始服务器,就如同这是个cache丢失一样。

  • TCP_NEGATIVE_HIT
    在对原始服务器的请求导致HTTP错误时,Squid也会cache这个响应。在短时间内对这些资源的重复请求,导致了否命中。negative_ttl 指令控制这些错误被cache的时间数量。请注意这些错误只在内存cache,不会写往磁盘。下列HTTP状态码可能导致否定cache(也遵循于其他约束): 204, 305, 400, 403, 404, 405, 414, 500, 501, 502, 503, 504。

  • TCP_MEM_HIT
    Squid在内存cache里发现请求资源的有效拷贝,并将其立即发送到客户端。注意这点并非精确的呈现了所有从内存服务的响应。例如,某些cache在内存里,但要求确认的响应,会以TCP_REFRESH_HIT, TCP_REFRESH_MISS等形式记录。

  • TCP_DENIED
    因为http_access或http_reply_access规则,客户端的请求被拒绝了。注意被http_access拒绝的请求在第9域的值是NONE/-,然而被http_reply_access拒绝的请求,在相应地方有一个有效值。

  • TCP_OFFLINE_HIT
    当offline_mode激活时,Squid对任何cache响应返回cache命中,而不用考虑它的新鲜程度。

  • TCP_REDIRECT
    重定向程序告诉Squid产生一个HTTP重定向到新的URI(见11.1节)。正常的,Squid不会记录这些重定向。假如要这样做,必须在编译squid前,手工定义LOG_TCP_REDIRECTS预处理指令。

  • NONE
    无分类的结果用于特定错误,例如无效主机名。

  • UDP_HIT
    Squid在cache里发现请求资源的貌似新鲜的拷贝。

  • UDP_MISS
    Squid没有在cache里发现请求资源的貌似新鲜的拷贝。假如同一目标通过HTTP请求,就可能是个cache丢失。请对比UDP_MISS_NOFETCH。

  • UDP_MISS_NOFETCH
    跟UDP_MISS类似,不同的是这里也指示了Squid不愿去处理相应的HTTP请求。假如使用了-Y命令行选项,Squid在启动并编译其内存索引时,会返回这个标签而不是UDP_MISS。

  • UDP_DENIED
    因为icp_access规则,ICP查询被拒绝。假如超过95%的到某客户端的ICP响应是UDP_DENIED,并且客户端数据库激活了(见附录A),Squid在1小时内,停止发送任何ICP响应到该客户端。若这点发生,你也可在cache.log里见到一个警告。

  • UDP_INVALID
    Squid接受到无效查询(例如截断的消息、无效协议版本、URI里的空格等)。Squid发送UDP_INVALID响应到客户端。


5. squidclient是什么?

squidclient是提供用于检索URL的命令行工具。 专为测试任何HTTP 0.9,1.0或1.1 Web服务器或代理而设计。 该工具可以与脚本组合,以执行任何基本的HTTP操作。 提供了一些用于访问squid代理对象缓存和管理信息的附加功能。

6. 安装aquidclient

  • 在Debian或Ubuntu下 #apt-get install squidclient
  • 在Redhat或Centos下yum install squidclient

7.常用squidclient命令

squidclient -h              #查看帮助
squidclient -p 80 mgr:info      #取得squid运行状态信息
squidclient -p 80 mgr:mem     #取得squid内存使用情况
squidclient -p 80 mgr:objects   #取得squid已经缓存的列表(谨慎使用,量大时容易崩溃)
squidclient -p 80 mgr:diskd  #取得squid的磁盘使用情况
squidclient -p 80 -m PURGE http://www.php-oa.com/static.php  #强制更新某个url
squidclient -p 80 mgr:io        #取得squid io情况
squidclient -p 80 mgr:ipcache       #查看squid缓存的dns解析记录
squidclient -p 80 mgr:info|grep Aver    #查看端口连接数
squidclient http://www.baidu.com/100.html   #测试访问
squidclient -p 80 mgr:traffic       #查看流量
squidclient -p 80 mgr:404           #取5分钟内404错误请求的个数
squidclient -p 80 mgr:status        #取5分钟内各种返回码的个数

你可能感兴趣的:(缓存服务Squid简介)