산업 제조
산업용 사물 인터넷 | 산업자재 | 장비 유지 보수 및 수리 | 산업 프로그래밍 |
home  MfgRobots >> 산업 제조 >  >> Industrial Internet of Things >> 클라우드 컴퓨팅

클라우드 중단:왜 그리고 어떻게 발생합니까?

IT가 클라우드 서비스에 더 많이 의존할수록 클라우드 중단으로 인한 다운타임과 수익 손실을 겪을 가능성이 높아집니다. 퍼블릭 클라우드를 사용하는 조직의 60% 이상이 2022년에 이러한 사고로 인한 손실을 보고하므로 가동 중단은 기발한 상황이 아니며 기업이 직면할 가능성은 거의 없습니다.

그러나 중단이 클라우드를 영원히 떠나야 할 충분한 이유가 됩니까? 아니면 가끔 다운타임이 발생할 위험이 있음에도 불구하고 이 인프라 유형을 유지해야 합니까?

이 문서에서는 클라우드 중단에 대해 알아야 할 모든 것을 설명합니다. . 주요 원인을 간략하게 설명하고 놀라운 통계를 검토하고 클라우드 다운타임의 영향을 최소화하는 방법을 보여주고 최근 몇 년 동안 발생한 가장 영향력 있는 중단을 살펴봅니다.

클라우드 중단이란 무엇입니까?

클라우드 중단은 최종 사용자가 클라우드 공급자의 서비스를 사용할 수 없는 기간입니다. 공급업체의 인프라가 다운되고(버그, 정전 등으로 인해) 공급업체가 문제를 해결할 때까지 클라이언트는 클라우드 기반 자산에 액세스할 수 없습니다.

영향 면에서 온사이트 데이터 센터가 다운되는 것과 클라우드가 중단되는 것 사이에는 차이가 없습니다. 두 경우 모두 IT 자산에 액세스할 수 없지만 클라우드 컴퓨팅에 대한 수동 접근 방식에는 몇 가지 고유한 고려 사항이 추가됩니다.

로컬 하드웨어와 마찬가지로 두 가지 유형의 중단이 발생할 수 있습니다.

최근 연구에 따르면 계획되지 않은 중단은 계획된 중단 시간(온프레미스 및 클라우드 모두)보다 35% 더 많은 비용이 듭니다. 예상치 못한 사고를 식별하고 수정하는 데 시간이 더 오래 걸리고 정전이 오래 지속되면 피해가 더 커지기 때문에 가격 차이가 발생합니다.

현장 하드웨어와 비교할 때 클라우드 기반 인프라는 다운타임이 더 자주 발생하지만 심각도는 낮습니다. . 100% 가동 시간을 제공하는 호스팅 시스템은 없기 때문에 클라이언트는 클라우드 컴퓨팅 이점에 대한 대가로 가끔 발생하는 중단을 용인할 준비가 되어 있습니다. 이러한 의지는 시장 성장에서도 분명합니다. 클라우드는 2024년에 전체 글로벌 IT 지출의 14.2%를 차지할 것입니다(2020년 9.1%에서 증가).

클라우드 중단 원인

클라우드 중단은 공급자가 통제할 수 있는 범위 안팎의 여러 원인으로 인해 발생합니다. 다음은 가장 일반적인 목록입니다.

클라우드가 다운되면 어떻게 됩니까?

최상의 시나리오에서 클라우드 중단은 몇 분 동안만 지속되며 소수의 사용자 또는 서비스에 영향을 미칩니다. 최악의 경우 정전으로 인해 고객의 비즈니스가 반나절 이상 마비됩니다. 회사는 모든 클라우드 기반 자산에 대한 액세스 권한을 상실하고 중단이 끝날 때까지 차단 상태를 유지합니다.

위협적이지만 제3자 제공업체의 실수가 2021년 심각한 정전의 "단" 7%의 원인 . 심각한 정전에는 다음 중 하나(또는 여러 개)가 포함되어야 합니다.

더 시급한 문제가 있지만(아래 도넛 차트 참조) 1분의 평균 다운타임 비용은 $5,600입니다. (이 분당 수치는 기업의 경우 $9,000입니다). 준비가 되어 있지 않은 경우(예:데이터 백업, 재해 복구 등이 없는 경우) 클라우드 중단으로 인해 서비스가 중단되고 수익에 막대한 타격을 줄 수 있습니다.

클라우드에서 운영의 작은 부분을 유지하는 회사는 가동 중단에 덜 취약합니다. 예를 들어 클라우드에서 이메일만 호스팅하는 경우 하루 동안의 중단도 치명적이지 않습니다. 사고를 기다리거나 기능이 저하된 앱을 실행할 수 있는데, 클라우드를 사용하여 IoT 플랫폼을 실행하거나 결제 처리를 수행하면 작동하지 않는 전략입니다.

경우에 따라 클라우드 중단으로 인해 영구적인 데이터 손실이 발생합니다(손실된 데이터 양은 백업 빈도에 따라 다름). 또한 엄격한 산업 분야의 고객은 정전으로 인해 데이터 유출 또는 유출이 발생하는 경우 법적 벌금을 내야 하므로 클라우드 스토리지에 보관할 항목을 결정할 때 신중을 기해야 합니다.

사용자는 무엇을 할 수 있습니까?

클라우드 중단의 영향을 완화하기 위해 기업이 수행하는 작업은 다음과 같습니다.

최근 가장 큰 클라우드 중단

클라우드를 사용할 때 클라우드 중단은 피할 수 없으며 가장 인기 있는 공급자(예:Azure, AWS 및 Google Cloud)도 가동 중지 시간에 영향을 받지 않습니다. 최근 역사상 가장 심각한 클라우드 중단을 살펴보겠습니다.

Azure 정전(2021년 10월)

2021년 10월, Microsoft Azure는 6시간 동안 가상 머신 서비스를 중단시키는 중단을 겪었습니다. . 중단 기간 동안 많은 사용자가 새 VM을 배포하거나 확장을 업데이트할 수 없었습니다. 기본 서비스 관리 작업(예:시작, 생성, 삭제)에서도 ​​오류가 발생했습니다.

클라우드 중단의 원인은 VM 쿼리가 아티팩트의 필수 버전 데이터를 검색할 수 없었기 때문입니다. 복구 후 보고서에 따르면 Microsoft가 VM 아키텍처 중 하나를 마이그레이션할 때 소프트웨어 기반 실수가 발생했습니다.

Google 클라우드 중단(2021년 11월)

Google Cloud가 약 2시간 다운되었습니다. 작년 11월 중순에 다음과 같은 영향을 미쳤습니다.

영향을 받는 웹 사이트는 방문자가 액세스를 시도할 때 404 오류를 표시했습니다. Google은 클라우드 중단의 원인이 로드 밸런싱을 담당하는 네트워크 구성의 결함이라고 보고했습니다.

AWS 중단(2021년 12월)

대규모 연결 활동 급증은 AWS의 주력 시설 중 하나에서 네트워킹 장치를 압도하여 다양한 웹 사이트와 앱에 영향을 미쳤습니다. 가장 주목할만한 "피해자"는 다음과 같습니다.

데이터 센터 문제로 인해 내부 AWS 네트워크 내에서 심각한 지연 시간이 발생했습니다. 고객 앱은 약 7시간 동안 트래픽 지연 또는 전체 종료로 인한 파급 효과를 느꼈습니다. .

2개의 후속 IBM 중단(2022년 1월)

IBM 인프라 문제가 5시간 넘게 달라스 지역의 클라우드 서비스에 영향을 미쳤습니다. . 사내 팀이 문제를 해결했지만 실수로 가상 사설 클라우드에 1시간 동안 추가 문제를 일으켰습니다. 두 번째 문제는 미국, 일본, 캐나다, 독일을 비롯한 전 세계 사용자에게 영향을 미쳤습니다.

AWS/Slack 중단(2022년 2월)

Slack은 2월에 AWS 클라우드 리소스가 중단되어 5시간 동안 통신 플랫폼을 정상적으로 사용할 수 없었습니다. . 보고된 사용자가 11,000명 이상:

Slack의 팀은 클라우드 중단의 원인을 공유하지 않았으며 영향을 받는 모든 사용자에게 복구 후 앱을 다시 시작하고 캐시를 지우도록 요청했습니다.

iCloud 중단(2022년 3월)

15개의 주요 Apple 서비스가 4시간 동안 중단되었습니다. 다음을 포함한 클라우드 중단으로 인한 3월:

Apple의 기업 및 소매 시스템도 다운되었습니다. 회사는 나중에 근본 원인이 회사의 도메인 이름 시스템(DNS)과 관련된 문제라고 밝혔습니다.

Google 클라우드 중단(2022년 3월)

2022년 3월 8일 Google Cloud 사용자에게 2시간 30분 동안 서비스 오류가 발생했습니다. . Spotify와 Discord가 정전의 피해를 입었습니다.

구성 처리를 위한 Traffic Director 코드 변경으로 인해 오류가 발생했습니다. 복구 후 보고서에 따르면 잘못된 코드 변경으로 인해 구성 데이터 형식 마이그레이션이 무시되어 플랫폼에서 실수로 사용자의 프로그래밍을 삭제했습니다.

Atlassian 중단(2022년 4월)

올해 최대의 Atlassian 중단은 4월 5일에 시작되어 4월 18일에 종료되었습니다(일부 사용자는 4월 8일까지 서비스 복원을 시작했지만). 회사는 부적절한 팀 커뮤니케이션과 잘못 계획된 사고 대응 계획으로 인해 정전이 발생했다고 설명했습니다.

이 클라우드 중단은 거의 2주 지속되었지만 일부 사용자의 경우 클라이언트 데이터의 심각한 손실에 대한 보고가 없었습니다. 그러나 Atlassian의 주력 제품인 Trello와 Jira의 사용자 모두 이 문제의 영향을 받았습니다.

Microsoft Azure 중단(2022년 6월)

6월 7일에 Azure 고객은 미국 동부 2 지역(주로 버지니아)에서 호스팅되는 리소스에 연결할 수 없습니다. 정전은 약 12시간 지속됨 영역 중복 인프라에 의존하는 소비자에게는 영향을 미치지 않았습니다. 손상된 서비스 포함:

원인은 로컬 데이터 센터 중 한 곳의 갑작스러운 전력 진동으로 인해 AHU(Air Handling Units)가 중단되었습니다.

Cloudflare 중단(2022년 6월)

6월에 Cloudflare의 우발적인 중단으로 인해 1시간 30분 지속되는 대규모 중단이 발생했습니다. , 다음과 같은 인기 사이트 삭제:

샌프란시스코에 본사를 둔 공급업체는 계획되지 않은 다운타임이 19개 데이터 센터의 네트워크 구성 변경으로 인해 발생했다고 설명했습니다.

클라우드 정전 계획의 가치를 간과하지 마십시오

최근 몇 년 동안 발생한 클라우드 중단의 예는 다음과 같은 분명한 메시지를 전달합니다. 클라우드가 IT의 판도를 바꿀 수 있지만 기술은 완벽하지 않습니다. . 최종 사용자와 앱 가용성에 관심이 있는 회사는 간헐적인 가동 중지 시간에 대비해야 하므로 백업 및 재해 복구(BDR)가 클라우드 기반 리소스 사용의 필수적인 부분이 됩니다.


클라우드 컴퓨팅

  1. 트랜스퍼 몰딩이란 무엇이며 어떻게 작동합니까?
  2. 퍼블릭 클라우드 성능을 벤치마킹하는 방법과 이유
  3. 클라우드 보안이란 무엇이며 왜 필요한가요?
  4. 클라우드와 클라우드가 IT 세계를 변화시키는 방식
  5. 에이전트 없는 아키텍처와 에이전트 기반 아키텍처:중요한 이유는 무엇입니까?
  6. 난독화된 VPN 서버란 무엇이며 어떻게 작동합니까
  7. Google Cloud Storage는 어떻게 작동합니까?
  8. 진공 감사를 수행하는 이유와 방법
  9. 산업용 클러치란 무엇이며 어떻게 작동합니까?
  10. 크레인 검사:언제, 왜, 어떻게?