SRE - 클라우드 (System Engineering)

  • 당근마켓
  • 개발(플랫폼)
  • 정규직
  • 경력

SRE팀을 소개해요.

SRE팀은 당근마켓 서비스 운영에 필요한 모든 인프라를 구축하고 서비스를 안정적으로 운영하는 역할을 해요. 서비스 운영에는 아마존 웹 서비스(Amazon Web Service)와 쿠버네티스(Kubernetes)를 주로 사용하고 있으며, 클라우드 기반의 인프라 구축 및 운영, 쿠버네티스를 사용한 서비스 배포 및 운영, 안정적인 서비스 운영을 위한 모니터링, 인프라 관리 시스템 개발에 대한 책임을 지고 있어요. SRE팀은 크게 업무 별로 3개 파트로 나눠져있으며, 퍼블릭 클라우드를 운영하는 클라우드 파트, 쿠버네티스 운영을 담당하는 클러스터 파트, 배포 시스템을 구축하는 딜리버리 파트가 있어요. SRE팀 클라우드 파트에서는 아마존 웹 서비스 네트워크를 설계하고, 클라우드의 모든 리소스를 관리하는 업무를 담당해요. 또한 각 팀 별로 클라우드 서비스를 잘 활용할 수 있도록 가이드하고, 퍼블릭 클라우드의 비용 관리도 병행하고 있어요.

이런 일을 해요

  • 서비스 별 Linux 커널을 최적화하고, 시스템의 퍼포먼스를 리뷰하고 개선해요
  • 시스템을 모니터링하고, 시스템 장애 및 네트워크 이슈를 리뷰/트러블 슈팅해요
  • 인프라 관련 서비스를 운영하고 자동화해요

이런 분을 찾아요

  • 3년 이상의 시스템 엔지니어 경력 혹은 AWS 서비스들에 대한 운영 및 개선 경험이 있으신 분
  • Linux 운영체제에 대한 깊은 이해 및 커널 최적화/튜닝 능력이 있으신 분
  • 네트워크 레이어에 대한 깊은 이해 및 디버깅 능력이 있으신 분
  • Kafka, Elasticsearch, Ceph, RDB, NoSQL 등 스테이트풀 서비스 운영 및 스케일 경험이 있으신 분

이런 분이면 더 좋아요!

  • Python, Node.js, Go 등 하나 이상의 프로그래밍 언어에 능숙하신 분
  • Nginx, Redis, Memcached, Elasticache 등 오픈소스 인프라 관련 도구 운영 경험이 있으신 분
  • Terraform, Ansible, Chef 등 인프라 자동화 도구 사용 경험이 있으신 분
  • AWS/GCP 서비스들에 대한 운영 및 개선 경험이 있으신 분
  • Kubernetes 아키텍처 및 네트워크 설계에 대한 이해가 있으신 분

이렇게 합류해요

  • 1. 서류 접수  →  2. 화상 면접  →  3. 직무 면접  →  4. 컬쳐핏 면접