整合您的 IT 管理工具

Published on 12 Sept 2022

整合、IT 管理、工具

开发人员、站点可靠性工程师 (SRE)、IT 管理员以及他们服务的客户在更加动态的环境中面临着新的问题。这并不是什么新鲜事。为了方便起见,团队经常使用自己的工具集来监控和管理其管辖范围内的系统和基础设施。

然而,其结果是工具和应用程序激增,这通常会产生类似于向池塘扔鹅卵石的连锁反应。最初的影响可能看起来不大,但如果不加控制,深远的影响将导致巨大的问题。考虑一下多个团队使用非集成的单点工具来监控应用程序和 IT 环境会导致盲点、不断切换上下文、增加平均检测时间 (MTTD) 和平均解决时间 (MTTR)、缺乏可扩展性以及增加与管理多个许可证和工具相关的成本。

但是为什么会出现工具蔓延的情况呢?

基于云的复杂性。操作的转变需要对程序进行修改,这使得程序更难使用和调试。这种日益增加的复杂性使得使用旧技术进行监控变得更加困难,并且通常需要安装多种工具来监控云服务的各个组件。

值得庆幸的是,事情不必如此。以下是需要考虑的因素以及正确执行该程序的方法。

设备整合的必要性

无论转型是出于自我动机还是由于快速扩张,运营都可能会陷入困境——通常是没有意识到的。

在前一种情况下,运营通常采用不同的云服务和方法,包括使用跨多云和混合云环境的容器中交付的微服务开发应用程序。它灵活且可扩展。但是,如果没有在各个层面监控和观察技术的策略,技术堆栈的转型将是无效的。如果没有持续的策略来监控和管理这些新设置,就有可能不了解环境/基础设施和运营,这可能会导致停机、安全威胁和负面的客户体验。

在后一种情况下,发展和扩张公司可能会对后端产生负面影响。IT 运营和 DevOps 团队可能不知道正在使用什么及其后果,直到他们的费用开始飙升。有时,组织会进行收购,并在使用他们的点工具集时忽略了其他供应商工具与他们当前的生态系统相冲突的事实。

IT 和 DevOps 团队整合工具的最普遍动机包括:

数据缺失。许多监控技术会采样或丢弃数据并对数据结构设置限制。这会导致用户和分析算法的可见性出现重大差距,从而导致影响客户的问题增多,这些问题需要更长的时间才能解决。

功能有效性。容器的上下旋转需要几分钟的时间。无服务器功能的实例以秒为单位发生。微服务是一个复杂的相互关系和交互网络。如果监控解决方案不是设计为在几秒钟内完成工作并快速扩展以管理流量高峰,那么它们就是无用的,而且会忽略问题。

智能不足。数据实在是太多了,而大多数监测技术都缺乏解读这些数据所需的智能。

通知太多,太多人花费太长时间来确定问题。

设备太多。由于上述困难,工具蔓延是一个重大问题。它导致数据孤立、流程脱节、重复,并迫使团队学习使用多种技术。

显然,必须解决工具泛滥的问题。


下载 Splunk Observability Cloud 的白皮书,以了解有关仅在线白皮书上整合 IT 管理工具的更多信息。

Icon
THANK YOU

You will receive an email with a download link. To access the link, please check your inbox or spam folder