1.自我介绍,项目简单带过。2-3分钟,毕业学校和专业、工作经验,项目
2.上家公司离职原因
不要写消极的,什么抱怨工作啊,抱怨薪资等。写积极的符合你自己实际的,如学习新技术等。
3.对加班的看法
不要老实回答,要回答认可
4.期望薪资
不超过招聘里面写的上线
5.职业规划
深化技术,学习主流技术,自动化运维等
6.你这边有什么想要问的(有什么要问面试官的,问项目相关的)
7.你遇到的最难的问题是什么
回答技巧:
1.理解面试官的真实目的:面试官问这个问题并不是为了窥探你的隐私,而是希望通过这个问题了解你在面对困难时的思考、行动以及解决问题的能力,
从而判断你的抗压能力和问题解决能力。
2.选择合适的困难:选择一个与应聘岗位相关的困难,避免选择太低级的困难,如毕业论文答辩、写简历等,这些内容显得不够成熟。
3.使用STAR答题模版:使用Situation(情况)、Task(任务)、Action(行动)、Result(结果)的结构来组织答案,
详细描述问题的背景、你的任务、采取的行动以及最终的结果。
4.突出解决过程与能力提升:重点讲述你解决问题的过程、获得的成就以及从中获得的能力提升,尤其是与应聘岗位相关的能力。
5.保持自信和专业:即使遇到压力问题,也要保持自信,不卑不亢地展示自己与岗位的匹配度。
8.遇到不会的,不要不懂装懂,说我会尽快上手的
监控、巡检和拨测是IT运维管理中的关键组成部分,它们共同确保了系统的稳定性、可用性和性能。
要保持测试环境的稳定性,可以采取以下措施:
1. 隔离测试环境:将测试环境与生产环境分开,避免相互干扰。
2. 版本控制:对软件版本进行严格控制,确保测试环境中的软件版本与预期一致。
3. 配置管理:记录和管理测试环境的配置信息,以便快速还原和部署。
4. 定期维护:包括硬件检查、软件更新和系统优化等。
5. 监控和告警:实时监控测试环境的状态,及时发现并解决问题。
6. 数据备份和恢复:定期备份重要数据,以便在出现问题时进行恢复。
7. 权限管理:限制对测试环境的访问权限,防止误操作。
8. 测试环境标准化:遵循统一的标准和规范进行搭建和管理。
9. 自动化部署:使用自动化工具进行环境搭建和部署,减少人为错误。
10. 容量规划:确保测试环境具备足够的资源来满足测试需求。
原文链接:https://blog.csdn.net/wx17343624830/article/details/137779623
我们xx有自己的监控平台
部署服务的时候,在流水线把对应插件勾选上,然后去到对应的平台就有基础的监控了,如果还需要其他指标 可以在平台添加对应的监控策略
如果上面的过于简单了,可以参考下面的:
可直接拿来用的kafka+prometheus+grafana监控告警配置
https://blog.csdn.net/x763795151/article/details/119705372
Prometheus监控以及告警配置
https://blog.csdn.net/weixin_45705963/article/details/124032579
zabbix基础2——监控告警流程
https://blog.csdn.net/yi_qingjun/article/details/131533328
grafana监控告警配置
https://blog.csdn.net/qq_38125626/article/details/115658233
Prometheus+Grafana监控告警配置
https://blog.csdn.net/Q0717168/article/details/122496855
网络探针,主机探针,应用程序探针,数据库探针,安全探针
容器探针:https://blog.csdn.net/wang725/article/details/90719294
Kubernetes 提供了三种类型的探针:存活探针(Liveness Probe)、就绪探针(Readiness Probe)、启动探针(Startup Probe)
一、存活探针(Liveness Probe)
存活探针用于检测容器内应用程序的健康状态。如果存活探针失败(即应用程序不健康),Kubernetes 将会自动重启容器,以尝试恢复应用程序的健康状态。
对于存活探针(Liveness Probe):如果存活探针失败,Kubernetes 将自动重启容器。它会尝试将容器恢复到健康状态,并继续运行应用程序。如果存活探针失败,Kubernetes 将首先重启容器,希望通过重新启动容器来恢复应用程序的健康状态。如果重启容器仍然无法解决问题,Kubernetes 可能会根据配置的重启策略进一步采取行动。重启策略包括:
Always(默认):始终重启容器,无限次数地尝试恢复应用程序的健康状态。
OnFailure:仅在容器失败(退出状态码非零)时重启容器,尝试恢复应用程序的健康状态。
Never:永不重启容器,不会尝试恢复应用程序的健康状态。
二、就绪探针(Readiness Probe)
就绪探针用于检测容器是否已经准备好接收流量。如果就绪探针失败(即容器未准备好),Kubernetes 将会从服务负载均衡的池中剔除该容器,不会将流量路由到该容器,直到探测成功。
对于就绪探针(Readiness Probe):如果就绪探针失败,Kubernetes 将从服务负载均衡的池中剔除该容器。这意味着新的流量将不会被路由到该容器,直到就绪探针成功为止。这可以确保只有健康的容器能够接收流量,避免将流量发送到尚未准备好的容器上。一旦就绪探针成功,Kubernetes 将再次将容器纳入服务负载均衡,并开始将新的流量路由到该容器。
三、启动探针(Startup Probe)
启动探针用于检测容器内应用程序是否已经启动成功。与存活探针和就绪探针不同,启动探针仅在容器启动时执行,并且只需检测一次。启动探针的结果不会影响容器的重启或负载均衡。它主要用于检测应用程序是否成功启动,并在启动过程中提供一定的等待时间。
如果启动探针失败,Kubernetes 不会采取任何特殊行动。这是因为启动探针失败只意味着应用程序尚未成功启动,并且不会触发容器的重启或负载均衡操作。
四、探针定义方式
执行命令(Exec):通过在容器内执行特定的命令来检查应用程序的状态。如果命令的返回状态码是 0,探针被认为是成功的;否则,探针被认为是失败的。
发送 HTTP 请求(HTTP GET):通过发送 HTTP GET 请求到容器内的指定端点来检查应用程序的状态。如果返回的 HTTP 状态码在 2xx 或 3xx 范围内,探针被认为是成功的;否则,探针被认为是失败的。
TCP 套接字(TCP Socket):通过尝试建立到容器内指定端口的 TCP 连接来检查应用程序的状态。如果连接成功建立,探针被认为是成功的;否则,探针被认为是失败的。
原文链接:https://blog.csdn.net/qq_42979842/article/details/130857164
巡检(Patrol Inspection)
巡检是定期或不定期对IT系统进行的预防性检查,以发现和解决可能的问题。这通常包括对硬件、软件、网络连接和其他关键组件的外观和性能的检查。
巡检可以是物理的,也可以是虚拟的,其目的是主动评估风险,强调的是一种主动发现风险的数字化思维模式与组织协同文化。
IT巡检可以定义为一系列计划性和预防性的措施,旨在通过定期检查IT资源的状态和性能来确保业务连续性和系统稳定性。这些措施包括但不限于:
系统性能监控:评估系统响应时间、资源利用率等关键性能指标。
安全检查:确保系统安全措施得到有效执行,包括防火墙配置、安全补丁更新等。
配置审核:检查系统配置是否符合最佳实践和安全策略。
备份验证:确保备份策略的有效性,验证数据恢复流程。
故障预防:通过分析巡检数据预测潜在的故障和性能瓶颈。
巡检(Patrol Inspection)
目的:巡检的主要目的是通过定期或不定期的检查来预防潜在问题,确保系统和设备的正常运行,并及时发现和解决可能存在的故障。
方法:巡检通常是手动或半自动化的过程,涉及对硬件、软件、网络连接和其他关键组件的外观和性能的检查。巡检可以是物理的,如检查服务器的物理状态,也可以是虚拟的,如通过特定的脚本或工具检查系统日志。
实施过程:巡检往往是周期性的,根据预定的计划执行。巡检的内容和频率可以根据系统的重要性和历史性能进行调整。巡检过程中可能需要运维人员进行现场检查或远程登录系统进行操作。
高可用的本质就是冗余,高可用是负载均衡可以实现的基础
https://baijiahao.baidu.com/s?id=1779335428681557760&wfr=spider&for=pc
https://blog.csdn.net/weixin_61428407/article/details/135497152
https://blog.csdn.net/m0_37680131/article/details/136310725
https://blog.itpub.net/70024922/viewspace-3015950/
https://blog.csdn.net/jjclove/article/details/124924220
高可用的本质就是冗余
负载均衡
建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。
负载均衡的核心就是为了实现高可用
实现负载均衡的三种方式
1、HTTP重定向实现负载均衡(nginx的正向代理)
2、DNS负载均衡(域名解析)
3、反向代理负载均衡(nginx的反向代理)
实现高可用的三种方式
1.主备高可用,也叫主备集群。主节点提供读写请求,备节点在主节点正常工作的情况下,只是用来同步主节点的数据。当主节点不可用情况下,再手动切换到备节点。
比如,mysql的主备集群
2.主从高可用,也叫主从集群。主节点提供读写请求,从节点除了向主节点同步数据外,自己用会承担一部分的读写请求。主从集群一般自带故障转移功能,如果当前主节点挂了,
会自动向从节点中选举一个出来,成为主节点。比如,zookeeper集群
3.cluster集群,也叫分片集群。将一份数据给拆成多个小份,然后散落到不同的机器里面。它由master和slaver角色组成,master充当管理和协调的角色,
本身不承担数据的读写任务,它会把所有发送到自己身上的读写请求都转发到对应的slaver节点,而当slaver节点故障后,master会马上收到消息(心跳检测机制),
并将新的读写请求转发到其他正常的slaver,来保证集群的高可用。对于master来说,要满足高可用,也需要引入多个,正常对外提供服务的叫active master,
替补位置的master叫standby master。比如,HDFS、mongodb分片集群
什么是负载均衡:https://blog.csdn.net/qq_45414633/article/details/115368244
MySQL集群 - 一主多从、双主双从:https://blog.csdn.net/weixin_45682053/article/details/141264900
拨测是指对系统、应用或网站进行测试,以确定其是否正常工作。
拨测是一种网络链路质量的测试手段。
以下是一些进行有效拨测的建议:
1.设计拨测计划: 在进行拨测前,开发团队需要制定拨测计划,明确拨测的目的和范围,以及测试的时间和资源。
这有助于确保拨测的有效性和可重复性,并减少不必要的浪费。
2.选择适当的拨测工具和服务: 选择适当的拨测工具和服务非常重要,可以大大提高拨测的效率和准确性。开发团队可以选择一些成熟的拨测工具和服务。
3.模拟真实环境: 在进行性能测试时,开发团队需要模拟真实的使用环境,以确保测试结果的准确性。
例如,如果软件需要在高负载环境下运行,那么在进行性能测试时,需要模拟这种高负载环境。
4.定期进行拨测: 软件开发是一个持续不断的过程,因此定期进行拨测非常重要。定期拨测可以帮助发现潜在的问题和漏洞,并及时进行修复和优化,
从而提高软件的质量和可靠性。
5.分析拨测结果: 在完成拨测后,开发团队需要对测试结果进行分析和归纳,以确定哪些方面需要改进和优化。例如,如果发现性能问题,
开发团队可以考虑优化代码或增加硬件资源来提高性能。
简而言之,拨测是指对系统、应用或网站进行测试,以确定其是否正常工作,是质量看护的一项重要手段。
从复杂度以及