[인포스탁데일리=이형진 선임기자] 기업들의 ESG(환경·사회·지배구조) 경영이 확대되고 있다. 이에 따라 경제, 환경, 사회공헌 등을 아우르는 지속가능경영이 활발해지고 있다. 특히 눈에 보이는 자산보다 평판과 도덕성 등 보이지 않는 기업의 자산이 주가에 더 큰 영향을 미친다. 인포스탁데일리는 기업 레퍼런스체크 연구소 '평판체크연구소'와 공동으로 주요 기업의 평판 등을 국내외 다양한 연구논문 중심의 학문적 접근을 통해 살펴보고, 평판관리를 위한 문제해결 방안과 방향성 등을 종합적으로 점검해 본다. [편집자 주]
SK C&C 판교 데이터센터 화재로 인한 카카오 (KS:035720) 먹통대란. 사진=인포스탁데일리
지난 15일 SK C&C 판교 데이터센터 화재로 카카오그룹 시스템 전반에서 통신 장애가 발생했다. 카카오톡, 카카오페이, 카카오모빌리티 등 주요 서비스가 일제히 중단되는 초유의 사태가 일어났다.
화재가 발생한 데이터센터에는 카카오뿐만 아니라 네이버 (KS:035420) 등 다른 기업들도 입주해 있었다. 하지만, 다른 기업들과 달리 카카오 사태는 심각했다. 카카오의 비상 대응이 미흡했고, 재해복구 시스템이 전혀 작동하지 않았다.
카카오의 남궁훈, 홍은택 각자대표는 카카오의 통신장애 발생 원인과 복구까지 오랜 시간이 소요될 것에 대해서 사과했다. 생활 의존도가 높은 보편적 서비스들의 장시간 장애는 사회와 대중에 큰 피해를 안기는 동시에 혼란을 가져올 수 있어 비판에 직면할 수밖에 없다.
카카오뱅크 (KS:323410) 판교 오피스. 사진=카카오뱅크
◇ “거대 IT 플랫폼, 시스템 사고 관리는 생존을 위한 기본 요건”
IT에 대한 우리 사회의 의존도가 높아짐에 따라 짧은 다운타임이라도 상당한 재정적 손실을 초래할 수밖에 없다. 심각할 경우 인명 위험까지 발생한다. 이에 따라 IT 기업에 시스템의 항시 가동은 운영의 필수이고, 주요 사고 관리는 생존을 위한 기본이다[1].
IT 서비스를 제공하는 대다수 기업은 ‘재해 복구(DR, Disaster Recovery) 시스템’을 활용해 치명적인 시스템 장애로 인한 가동 중지에 대응한다. DR 시스템 및 메커니즘은 장애 서비스를 신속하게 원 상태로 돌아오게 하는 BC(Business Continuity) 지원이다[2,3].
카카오 남궁훈, 홍은택 대표가 말한 지역 데이터 백업센터(DR센터)의 경우 평소 지리적으로 분리된 사이트 간의 지속적인 동기식 데이터 복제를 통해 DR을 수행하게 된다. SK C&C 판교 데이터센터(IDC, 데이터 센터)를 사용할 수 없게 되면, DR센터의 백업 사이트가 인계 받아 가장 최근에 복제된 데이터를 사용해 서비스를 활성화하고 이어 나간다.
이때 사고 유형 및 규모, 애플리케이션 유형 및 백업 기술에 따라 서비스의 연속성을 좌우하는 수동 작업을 수행할 수 있다. 수동 작업에는 이를 위한 전문가 혹은 경영진의 판단과 계획이 필요하다[4]. 경영진의 판단과 계획이란, 시스템 다운타임 또는 데이터 손실의 금전적 비용에 대한 비즈니스 결정을 말한다.
왼쪽부터 남궁훈, 홍은택 카카오 각자대표. 사진=인포스탁데일리
◇ 남궁훈, 홍은택 각자 대표, ‘DR센터’ 구축에 소홀 유추
카카오 서비스 장애의 복구 지연이 남궁훈, 홍은택 대표를 비롯한 경영진 판단과 결정에 따른 결과일 가능성이 높다. SK C&C 판교 데이터센터 화재는 전기실에서 발생해 복구에 따른 데이터 전송과 저장 비용 등을 고려해 SK C&C 복구를 대기했을 가능성도 있다[5].
또 연구들은 DR을 수행하는 ▲소프트웨어 ▲IT 인프라 ▲인력의 불충분을 지적하고 있다[2]. DR 서비스는 단순 데이터 백업과 복구만의 문제가 아니다. 서버 손실에 대한 복구, 백업 서버에서의 정보 탐색 및 수정, 보안 등의 여러 기술 서비스로 운영해야 효율적이다.
이런 DR 서비스는 일반적으로 큰 비용이 든다[5,6]. 때문에 일부 기업은 데이터 백업 이외의 DR의 활용도가 낮다. 카카오가 비용절감을 위해 적합한 DR센터 구축과 기술 활용에 소홀했던 것으로 유추된다.
카카오의 평소 DR센터 운영 및 관리가 형식적이고, 재난에 대응할 IT 전문 인력도 부족했을 가능성이 높다. 이는 경영적 결정이므로 카카오의 남궁훈, 홍은택 대표를 비롯한 경영진들의 안일함에서 비롯됐다고 생각된다.
연구에서는 DR 서비스를 평소 업무에 활용하는 기능적 DR 데이터 센터를 제시하고 있다[1]. 카카오는 재해와 이례적이라는 핑계가 아닌 부족함을 사과하고, 기능적 DR센터 방안과 같은 변화할 구체적인 변화를 보여야 할 필요가 있겠다.
사진=인포스탁데일리
출처
[1] Dhanujati, N., & Girsang, A. S. (2018, September). Data center-disaster recovery center (DC-DRC) for high availability IT service. In 2018 International Conference on Information Management and Technology (ICIMTech) (pp. 55-60). IEEE.
[2] Wood, T., Cecchet, E., Ramakrishnan, K. K., Shenoy, P., Van Der Merwe, J., & Venkataramani, A. (2010). Disaster recovery as a cloud service: Economic benefits & deployment challenges. In 2nd USENIX Workshop on Hot Topics in Cloud Computing (HotCloud 10).
[3] Cerullo, V., & Cerullo, M. J. (2004). Business continuity planning: A comprehensive approach. Information systems management, 21(3), 70-78.
[4] Keeton, K., Beyer, D., Brau, E., Merchant, A., Santos, C., & Zhang, A. (2006). On the road to recovery: restoring data after disasters. ACM SIGOPS Operating Systems Review, 40(4), 235-248.
[5] Alhazmi, O. H., & Malaiya, Y. K. (2012, November). Assessing disaster recovery alternatives: On-site, colocation or cloud. In 2012 IEEE 23rd International Symposium on Software Reliability Engineering Workshops (pp. 19-20). IEEE.
[6] Tamimi, A. A., Dawood, R., & Sadaqa, L. (2019, April). Disaster recovery techniques in cloud computing. In 2019 IEEE Jordan International Joint Conference on Electrical Engineering and Information Technology (JEEIT) (pp. 845-850). IEEE.
이형진 선임기자 magicbullet@infostock.co.kr