뤼튼(Wrtn Technologies) (플랫폼엔지니어)
2024.03 ~
AI 검색 기반 플랫폼 서비스 회사플랫폼엔지니어로서 AWS 기반 인프라 운영 및 모니터링, DevOps 시스템화를 위한 플랫폼 개발 및 운영 담당
전사 클라우드 기반 인프라 운영
- AWS EKS 기반 인프라 구축 및 운영
- 주요 리소스 Terrform 프로비저닝 및 모듈화로 인해 자주 생성요청되는 리소스(Redis, Kafka, RDS)에 대한 프로비저닝 시간 단축 및 플랫폼화 기여
- Datadog 기반 모니터링 시스템 운영 및 로그 포맷 통일화
- 전사 공통 Gitlab CI 템플릿, Helm Chart 개발 및 표준 CI/CD 파이프라인 구축
- 운영에 필요한 여러 SaaS on K8S (Self-hosted) 구축 및 운영
- AWS IAM 관리 및 SaaS SSO 도입 및 RBAC 기반 권한 관리
- CloudFlare WAF, VPN(zerotrust)를 활용한 프로덕션 환경, 사내망 보안 관리 및 도메인 관리
Windmill(OSS workflow engine)을 활용한 DevOps 플랫폼 개발
- 배포에 필요한 ECR, helm chart, argocd App 등 생성 자동화 플랫폼 개발 -> 신규 마이크로 서비스 배포 구성 작업을 수동에서 완전 자동화
- 사내 정책에 맞는 RDS 프로비저닝 도구 개발 → 네이밍 및 태깅 컨벤션과 RI 계약에 맞는 인스턴스를 자동 생성
- 사내 정책에 맞는 S3, CloudFront 프로비저닝 도구 개발 → 네이밍 및 태깅 컨벤션에 맞는 리소스를 자동 생성
- IRSA, Pod Identity 주입 도구 개발 → 사전 정의된 Role, 권한등을 쉽게 k8s 환경 워크로드에 자동 주입 가능
- Datadog 비용 관리를 위한 환경 및 애플리케이션별 Datadog On/Off Switch 플랫폼 개발
- 배포 완료 알람을 위한 환경 및 애플리케이션별 Argocd Notification On/Off Switch 플랫폼 개발 → 개발자들이 자신이 담당하는 서비스의 배포 결과를 빠르게 확인할 수 있도록 함
- KEDA를 활용한 탄력적 k8s 워크로드 운영 On/Off Switch 플랫폼 개발 → 마케팅등과 같은 이벤트시 인프라 수평 확장/축소를 쉽게 조절
- [외부문서링크] Windmill를 활용한 플랫폼 개발 상세 내용
인프라 비용 관리
- 전사 모든 AWS 리소스에 대한 비용 모니터링 및 최적화
- Atlas MongoDB, Elastic Cloud 등 AWS 외부 Managed 리소스와 VPC Peering, Private Endpoint 구축으로 관련 NAT 네트워크 비용 대폭 절감
- Karpenter, Spot Instance를 활용하여 컴퓨팅 인프라 비용 대폭 절감
- 모든 버킷에 intelligence tiering 도입 자동화 및 S3 Lifecycle 적용을 통한 비용 30% 절감
- Datadog 사용량 추적 및 약정 계약 관리 및 로그 인덱스 최적화 작업으로 월 평균 15% 절감
전사 CI/CD 통합 관리 및 최적화
- karpenter를 활용한 gitlab CI/CD runner on k8s 운영으로 비용 최적화
- 태그 기반으로 개발자가 쉽게 원하는 환경(arch, gpu 이미지 빌드등)에 맞는 러너를 선택할 수 있도록 운영
플랫폼(JVM, Node, Python)에 따른 표준 CI/CD 파이프라인 구축
- preview 환경을 위한 CI/CD 파이프라인 구축
- 표준 Helm Chart 구성 및 ArgoCD Notification을 활용하여 담당자에게 배포 완료 알림 구성
- IOS 빌드를 위한 Mac OS 물리머신 기반 runner 운영 및 Bitrise로의 마이그레이션 지원
- 플랫폼구분 없이 모든 개발 프로젝트 Dockerfile 최적화 작업 지원(필요한 Base image 작성 및 layer 최적화 등)