workerthreads1 푸시 서버는 왜 죽었는가: 장애 원인 분석과 구조 개선 기록 시작하며;작년 9월과 10월, 두 달에 걸쳐 푸시 서버와 관련된 문제를 집중적으로 들여다봤다. 당시엔 따로 정리할 여유가 없었지만, 지금에서야 늦은 회고를 남겨본다. 모바일 서비스에서 푸시 알림은 단순한 메시지를 넘어, 사용자와의 접점을 가장 빠르고 직접적으로 만들어내는 중요한 수단이라고 생각한다. 실시간으로 정보를 전달하고, 사용자 행동을 유도하며, 서비스의 존재감을 각인시키는 데 핵심적인 역할을 하기 때문이다. 그런데.. 우리 서비스의 운영 과정에서 푸시 누락에 대한 제보가 지속적으로 발생했다. 사내 공유 목적으로 장애 보고서를 쓰며 로그를 역추적해보니, 이 문제는 2024년 10월 15일까지 계속해서 반복되고 있었다. 즉, 내가 합류하기 전부터 존재했던, 꽤 오래된 장애였다. 그래서 한동안 푸시 .. 2025. 7. 17. 이전 1 다음