KT 통신 장애는 인재 "라우터 교체 직원 exit 명령어 누락"(종합)

연합뉴스
지난 25일 발생한 KT통신 장애는 기업 망의 라우터 교체작업 중 작업자가 잘못된 설정명령을 입력한 것이 원인인 것으로 확인됐다.

과학기술정보통신부는 29일 브리핑을 갖고 "이번 사고 로그기록을 분석한 결과, 부산국사에서 기업 망 라우터 교체 작업 중, 작업자가 잘못된 설정 명령을 입력하였고, 이후 라우팅 오류로 인해 전국적인 인터넷 네트워크 장애가 발생한 것으로 분석됐다"고 발표했다.

조사결과, 디도스 공격이나 네트워크 대역폭 공격의 흔적은 없는 것으로 나타났다.

PC나 스마트폰으로 인터넷에 접속할 때는 지역라우터, 센터라우터 등을 거쳐 국내외 네트워크로 연결된다. 연결이 정상적으로 이뤄지기 위해서는 이용자 단말과 접속 대상 IP 주소 사이에 있는 다수의 라우터의 '경로 정보'가 필요하다.

라우터는 서로 다른 네트워크를 연결해주는 장치를 말한다.

라우터는 접속요구를 받아 라우터끼리 경로정보를 교환하며 경로정보를 구성하는데, KT와 외부 네트워크는 BGP프로토콜(Boarder Gateway Protocol)을 사용하고, KT 내부간 네트워크는 IS-IS프로토콜을 사용한다.

사고 당일 작업자는 사고 발생 라우터에 라우팅 설정명령어를 입력하는 과정에서 IS-IS 프로토콜 명령어를 마무리하는 부분에서 'exit' 명령어를 누락했다. 이로인해, 외부 라우터와 경로정보를 주고받는 BGP 프로토콜에서 교환해야 할 경로정보가 IS-IS 프로토콜로 전송됐다.

통상 1만개 내외의 정보를 교환하는 IS-IS 프로토콜에 수십만개의 BGP 프로토콜의 정보가 잘못 전송되면서, 라우팅 경로에 오류가 발생했다.

부산 라우팅 경로가 잘못 설정된 뒤, 다른 지역의 IS-IS라우터에도 잘못된 업데이트 정보가 전달되면서 전국의 라우터에 연쇄적인 경로 업데이트가 일어나 통신장애가 전국으로 확대됐다.

임혜숙 과기정통부 장관이 지난 26일 오후 사고분석반 원인조사 분석활동 점검을 마친 후 과천 KT네트워크 관제센터를 나서며 취재진 질문에 답하고 있다.연합뉴스
과기부 조사반은 KT 네트워크관제센터가 야간작업(01시~06시)을 승인했지만, 작업이 주간에 이뤄지는 과정에서 장애가 발생하게 됐고, 작업관리자가 없는 상황에서 작업이 이뤄진 점, 네트워크가 연결된 채로 작업이 이뤄진 점을 들어 "KT의 관리가 부실했다"고 지적했다.

조사단은 1, 2차에 걸친 사전검증 단계가 존재했으나, 사람이 직접 검토하는 체계여서 오류를 발견하지 못했고, 지역에서 발생한 오류가 전국으로 확산되는 것을 차단할 시스템도 없었다는 기술적 문제점도 지적했다.
 
과기부는 이용자들의 피해를 보상하기 위해 "KT는 이용자 피해현황 조사 및 피해구제 방안 마련을 추진하고, 방통위는 통신장애 발생시 피해구제를 위한 법령 및 이용약관 등 개선방안 마련할 것"이라고 밝혔다.

한편, KT 네트워크 장애사고는 25일 오전 11시 16분쯤 시작돼, DNS 트래픽 증가에 이어, 네트워크 장애가 발생했고, 12시 45분 KT의 복구조치가 완료돼 약 89분 동안 서비스 장애가 발생했다.


실시간 랭킹 뉴스