AIOps 및 관찰 가능성이 IT에 도움이 되는 방법
AIOps 관찰 가능성은 IT에서 가동 중지 시간을 줄이고 애플리케이션 성능을 개선하며 고객 만족을 유지하는 데 도움이 됩니다.
2016년 Gartner는 AIOps(ArtificialIntelligence for IT Operations)라는 약어를 만들었습니다. 그러나 그보다 몇 년 전에 IT 전문가는 이미 자율 컴퓨팅의 요소에 대해 듣고 경험하고 있었습니다. 이러한 자동화 기술을 통해 메인프레임과 서버는 자동 및 적응형 결정과 조정을 수행할 수 있으므로 운영 전반에 걸쳐 내장된 센서가 성능에 대해 알려주는 것에 응답할 수 있습니다.
AIOps 관찰 가능성 소개
AIOps이건 자율 컴퓨팅이건 간에 목표는 항상 IT가 성능을 모니터링하고 조정하여 컴퓨터화된 자산을 최대한 활용하고 비즈니스에 최적화된 기술을 제공할 수 있도록 지원하는 것이었습니다. IT는 지금부터 2026년까지 AIOps 솔루션에 대해 예측되는 21.05%의 복합 연간 성장률에서 알 수 있듯이 AIOps에 대해 낙관적입니다.
그렇다면 AIOps가 그토록 매력적인 가치 제안이 되는 이유는 무엇입니까?
과로한 시스템 프로그래머, 네트워크 관리자 및 소프트웨어 개발자를 위해 AIOps는 즉각적인 주의와 해결이 필요하거나 필요하지 않을 수 있는 잠재적인 성능 문제 및 일일 경고의 건초 더미에서 가장 시급한 문제를 나타낼 수 있습니다. 이러한 경고는 기업 IT 부서에서 관리해야 하는 사일로화된 시스템의 수 덕분에 모든 곳에서 발생합니다. 이러한 변경이 도움보다 더 산만한 소음을 생성하는 경우가 있습니다.
AIOps는 사고 또는 중단과 진정으로 관련된 중요한 조건에 대한 이러한 불협화음 경고를 줄이는 데 도움이 됩니다. 이는 조직의 IT 인프라의 요소와 역학을 추적하고 무엇이 정상이고 무엇이 문제인지 학습할 때 인공 지능과 기계 학습을 사용하기 때문에 가능합니다. 이러한 지식을 갖춘 AIOps는 이전 시스템 접근 방식과 마찬가지로 식별하고 경고를 발행합니다. 그러나 오늘날의 AIops를 독특하게 만드는 것은 운영 모니터링에 포함된 AI가 이제 AIOps를 인프라 관찰 가능성의 영역으로 끌어들이는 것입니다.
Observability는 IT가 별도로 평가하고 문제를 해결해야 하는 개별 시스템 구성 요소에서 독립 실행형 경고를 발행하는 대신 IT 인프라에서 수집한 상황 정보를 인공 지능 및 자동화와 결합할 수 있기 때문에 IT의 차별화 요소입니다. 인프라 지식과 문제 감지를 포함하는 IT 인프라 평가에 대한 보다 총체적인 접근 방식을 통해 AIOps 관찰 가능성은 IT 메트릭, 로그 및 추적을 사용하고 IT가 문제 해결 시간을 단축하는 데 사용할 수 있는 수정 사항에 대한 진단 권장 사항을 발행합니다.
관측 가능성의 이해
실제로 AIOps 관찰 가능성 플랫폼은 애플리케이션이 통과하는 다양한 시스템, 데이터 및 네트워크를 통합할 수 있습니다. 하이브리드 컴퓨팅 환경에서 이는 온프레미스 리소스뿐만 아니라 클라우드를 통과하는 애플리케이션 워크플로를 통과하는 것을 의미할 수 있습니다. 성능이 저하될 경우 이러한 리소스 중 하나 또는 모두에서 경고가 발생할 수 있습니다. AIOpsobservability가 없으면 IT는 문제의 근본 원인에서 경고 "노이즈"를 분리하는 효율적인 수단 없이 많은 시스템 모듈 및 요소에서 들어오는 수많은 경고를 평가할 수 있습니다. 이 거위 추격은 시스템 다운타임과 성능 문제를 연장시킵니다. 이는 불행한 사용자와 고객을 생성하고 회사에 분당 평균 $5,600의 손실을 입힐 수 있습니다.
AIops 관찰 가능성이 다운타임 및 성능 문제를 해결하는 방법
예를 들어, AIOps 소프트웨어가 IT 인프라의 역학 및 운영 컨텍스트를 이해하면 일반적으로 주말에 문을 닫는 동부 해안의 현장 서비스 지점에서 비정상적인 활동을 신속하게 감지할 수 있지만 갑자기 토요일에 활동 급증을 등록할 수 있습니다.
AIOps는 네트워크의 서버 또는 라우터가 최대 용량인지, 하루 중 가장 바쁜 처리 시간 또는 전자 상거래 판촉으로 인한 스파이크 비활성과 같은 특정 상황에서 초과 용량 활용이 정상적인지 감지할 수 있습니다. .
테스트를 위해 여러 가상 시스템을 가동하지만 작업이 완료된 후 잊어버릴 수 있는 애플리케이션 테스트 영역에서 관찰 가능성은 이러한 유휴 자산을 식별하여 할당을 해제할 수 있습니다.
온프레미스 클라우드 환경의 하이브리드에서 AIOps 관찰 가능성은 종단 간 애플리케이션 워크플로 어딘가에 성능 저하를 일으키는 방해물이 있는 경우 애플리케이션 개발자에게 실시간으로 알릴 수 있습니다.
그 결과 IT가 더 잘 실행되고 애플리케이션이 비즈니스에 더 빨리 제공되며 가동 중지 시간이 줄어듭니다.
관측 가능성 상태
하지만 AIOps 관찰 가능성은 많은 조직에서 아직 배포 초기 단계에 있습니다.
한 가지 문제는 모든 IT 부서가 관찰 가능성(다소 모호한 단어)이 무엇을 의미하는지 정확히 이해하지 못한다는 것입니다. 대신에 관찰 가능성이 AI와 머신 러닝에 의해 촉진되는 "정보에 입각한 관찰"로 이해된다면 기술의 활용이 더 빨라지고 그 가치가 드러날 것입니다.
20년 이상 CIO로 일하면서 저는 다음 두 가지를 알고 있습니다.
첫째, CIO와 IT는 가동 중지 시간을 싫어하여 미친 듯이 쫓아다니며 사용자, 고객 및 경영진의 감정을 진정시켜야 하는 반면 IT는 많은 시스템에 영향을 미치는 복잡한 애플리케이션에서 무엇이 잘못되었는지 파악해야 합니다.
둘째, 1981년과 마찬가지로 2021년에도 계속되는 마라톤 "전쟁실" 회의를 끝낼 수 있다면 손가락질은 줄어들고 직원들의 사기는 높아질 것입니다. AIOpsobservability는 DBA에서 애플리케이션 개발자, 시스템 프로그래머에 이르기까지 관련된 모든 사람에게 실행 가능한 단일 버전의 진실을 더 잘 제공할 것입니다.