와탭의 기술 세미나(MSA와 장애대응)

퇴사를 앞두고 부쩍 기술세미나와 커뮤니티에 관심이 많아졌는데, 이번 세미나를 가게된 계기도 내가 구독하고있는 브런치의 작가가 와탭 관계자라는 것을 우연히 알게 되면서 였다. 글로만 만나뵈었던 신현묵님을 실제로 뵙고싶었는데, 와탭에서 세미나를 개최한다는 소식을 페이스북 커뮤니티를 통해 접한 것이다. 이에 한달음에 달려가게 되었다.

그 세미나는 바로 어제, 2017년 1월 17일에 진행한 ‘MSA와 장애대응’ 세미나이다. 와탭은 서버 및 WAS 성능 모니터링을 서비스를 제공하는 회사로, 우리 회사와 같은 업을 하고 있는 회사이기도 하다. SaaS팀에 속해 있어, 많이 들을수밖에 없는 회사이기도 하다.

세미나를 듣고나서 같은 업에 종사하고 있는 주니어 개발자로서 뭔가 후련한 느낌이었다. 우물 안 개구리가 자기 힘으로 펄쩍 뛰어올라 우물 밖의 세상을 처음 본 기분이 이랬을까. 와탭에서 진행한 세미나를 듣고나서 모니터링 제품이 갖는 의미와 갖춰야할 덕목들. 이런 것들이 크게 와닿았다. 와탭이 이 제품을 만들기 위해 얼마나 많은, 얼마나 깊은 고민을 했는지도 느낄 수 있었다.

클라우드 환경으로 Migration 하면서 겪었던 큰 회사의 장애 이야기들, 결국 무엇이 문제였고 어떻게 해결했는지에 대한 추적과정. 어떻게 가설을 수립했고, 그 과정에서 어떤 이유때문에 그것을 의심하게되었는지 정말 상세하게, 재미있게 공유해주셔서 너무 감사한 자리였다.

모니터링 제품을 만들지만, 어쨌든 우리도 서비스를 해야하기 때문에 중간 중간, 어 우리는 저거 어떻게 하더라? 어, 우리는 저거를 확인했나? 고려했었나? 생각하게 되는 부분이 있었다.

인상깊었던 부분은 Connection Pool 라이브러리의 구조와 Load Banacler 설정 값으로 생긴 장애 사례였다. 라이브러리의 구조가 스택형태로 구현이 되어있었는데, Load Balancer의 idle timeout 기준으로 오랫동안 사용하지않는 pool들은 연결을 끊은 것이다.
시니어 개발자입장에서는 그게 뭐? 할 수 있겠지만, (시니어가 아니라 모른다.) 나는 뒷통수를 한대 맞은 느낌이었다. 한 문제는 여러 정상적이고 복합적인 문제로부터 발생할 수 있다. 늘 생각해왔던 명제이지만, 그 구체적 사례를 직접 들으니 신기하고, 두근거리고, 흥분되었다.

클라우드이기 때문에 편하지만, 클라우드이기 때문에 조심해야할 것들에 대해 말씀해주시면서 몇몇 장애사례들을 소개해주셨는데 아직 서비스를 런칭하지않아서 겪지 못했지만 내가 불안해하던 문제들, 걱정하고 있는 문제들이 이미 수면위로 올라 큰 장애를 경험한 사례를 듣고 간접적인 경험을 할 수있어 좋았다.

comments powered by Disqus