
[AI Research Div.] Senior MLOps Engineer (8년 이상)
우리는 게이머의 로망을 실현하기 위해, 누구도 가지 않는 길을 갑니다.
예상을 뛰어넘는 과감한 상상력과 기술로, 전 세계 팬들이 잊지 못할 세상을 만들기 위해 담대하게 도전하고 개척합니다.
We pioneer the path to players' dreams.
With bold imagination and breakthrough technology, we create unforgettable worlds for fans across the globe.
우리 팀(프로젝트)을 소개합니다.
[AI Service 본부 비전]
크래프톤 AI Service 본부는 사내외 여러 분야와 협업하여 다양한 문제에 대한 AI 솔루션을 제공하며, 자체 딥러닝 연구를 통해 우리만의 서비스를 개발합니다. 그 방향성은 크게 네 가지입니다.
- Production Cost Down : 게임 제작 공정에 딥러닝 기술을 적용하여 제작 효율을 높이고, 제작자들의 업무 경험을 혁신합니다.
- New Way to Create : 생성형 AI를 포함한 다양한 딥러닝 기술로 게임 창작의 방식을 확장합니다.
- Virtual Friends : 딥러닝 기반 Virtual Friend를 개발하여 게임 안팎의 새로운 사용자 경험을 만듭니다.
- Unique, Endless Gameplay : 딥러닝을 통해 유저에게 매번 새로운 경험을 제공하는 게임 콘텐츠를 구현합니다.
[Culture Fit]
AI Service 본부는 다양한 배경을 가진 구성원들이 함께 일하며, 수평적이고 활발한 커뮤니케이션 속에서 문제를 해결합니다.
직급과 연차를 넘어 자유롭게 의견을 제시할 수 있으며, 여러 직군과의 협업을 통해 기술과 서비스의 접점을 함께 만들어갑니다.
[팀 소개]
KRAFTON MLSys & Ops 팀은 AI Service 본부 내 모델 개발과 서비스 적용을 위한 GPU 인프라와 ML 플랫폼을 설계·구축·운영합니다.
모델 학습/실험 환경, ML 파이프라인, 모델 서빙 인프라, GPU 클러스터 운영, 인프라 자동화와 관측성 체계를 함께 다루며, 게임 제작과 서비스에 필요한 AI 워크로드가 안정적이고 효율적으로 동작할 수 있도록 공통 플랫폼을 만들어갑니다.
이번 포지션은 이미 확보된 B300 125노드 기반 GPU infrastructure를 함께 운영·고도화하면서, 이를 연구/개발/서비스 조직이 안정적이고 효율적으로 사용할 수 있는 GPU platform으로 발전시키는 실무형 시니어 엔지니어 역할입니다.
또한 실무 경험에서 얻은 인사이트를 바탕으로 향후 GPU 추가 구매, 클라우드 병행, 직접 구축, 외부 인프라 활용 여부까지 포함한 GPU/Compute 운영 전략을 기술적으로 제안하고 실행에 참여합니다.
우리 팀과 함께할 미션을 소개합니다.
- 이번 포지션은 B300 125노드 기반 GPU infrastructure를 함께 운영·고도화하면서, 이를 연구/개발/서비스 조직이 안정적이고 효율적으로 사용할 수 있는 GPU platform으로 발전시키는 실무형 시니어 엔지니어 역할입니다.
- B300 125노드 기반 GPU infrastructure의 운영 안정화, 성능 개선, 자원 효율화, 운영 자동화에 직접 참여합니다.
- Kubernetes 기반 ML/GPU 플랫폼의 스케줄링, 멀티테넌시, 워크로드 격리, 쿼터, 관측성, 장애 대응 체계를 설계·구축·운영합니다.
- 학습/추론 워크로드 특성을 바탕으로 GPU 활용률, 대기 시간, 처리량, 비용 효율을 개선하는 운영 전략을 수립하고 실제 플랫폼에 반영합니다.
- GPU capacity planning과 사용률 분석을 바탕으로 향후 GPU 추가 구매, 클라우드 병행, 직접 구축, 외부 인프라 활용 여부에 대한 기술적 판단을 제안합니다.
- ML 플랫폼과 재현 가능한 운영 체계를 고도화하고, 여러 팀의 요구사항을 공통 플랫폼 관점에서 조율합니다.
- B300 125노드 기반 GPU infrastructure의 운영 안정화, 성능 개선, 자원 효율화, 운영 자동화에 직접 참여합니다.
이런 경험을 가진 분과 함께 성장하고 싶습니다! (필수요건)
- AI/ML 학습 또는 추론 워크로드가 동작하는 대규모 GPU 클러스터 또는 Kubernetes 기반 ML 플랫폼을 설계·구축·운영해본 경험이 있으신 분
- Kubernetes 기반 ML/GPU 플랫폼의 스케줄링, 멀티테넌시, 워크로드 격리, 쿼터, 관측성, 장애 대응 체계를 직접 개선해본 경험이 있으신 분
- GPU 활용률 분석, 리소스 할당, 스케줄링, 우선순위, 비용/성능 최적화 전략을 실제 운영에 반영해본 경험이 있으신 분
- 모델 학습/실험/배포/서빙 등 ML 워크플로우 전반을 이해하고, 공통 ML 플랫폼을 운영·고도화해본 경험이 있으신 분
- IaC, GitOps, CI/CD, 관측성 체계 등을 활용하여 재현 가능하고 반복 가능한 플랫폼 운영 표준을 만들고 운영해본 경험이 있으신 분
- 장애 및 성능 이슈를 시스템 전반 관점에서 분석하고, 근본 원인 해결과 구조적 개선으로 연결해본 경험이 있으신 분
- 연구/개발/서비스 조직과 협업하며 공통 ML/GPU 플랫폼의 요구사항을 정리하고, 기술적 대안과 실행 우선순위를 제안해본 경험이 있으신 분
- 생성형 AI, LLM 기반 도구, 코드 어시스턴트 등 AI 도구를 실무에 활용하여 운영 효율, 문제 해결, 문서화, 자동화 생산성을 높여본 경험이 있으신 분
- 해외 출장에 결격 사유가 없는 분
이런 경험들이 있다면 저희가 찾는 그 분입니다! (우대요건)
- NVIDIA GPU Operator, DCGM, MIG/MPS, Run:ai, Slurm, Kueue, Volcano 등 GPU 리소스 관리·스케줄링·오케스트레이션 도구를 활용한 경험
- B-Series/B300, H100/H200, GB200/GB300 또는 동급의 차세대 GPU 아키텍처 운영, 검증, 최적화 경험
- KServe, Triton, Ray Serve, Kubeflow, Argo Workflows 등 모델 서빙 및 ML 파이프라인 플랫폼을 구축하거나 고도화한 경험
- Linux 시스템, cgroups, NUMA, I/O, 컨테이너 런타임, NCCL/RDMA, InfiniBand/RoCE, Ceph/MinIO 등 시스템·네트워크·스토리지 레벨 성능 최적화 경험
- GPU/Cloud 비용, 사용률, 대기 시간, 처리량, 팀별 사용량을 기반으로 자원 정책을 설계/구현/운영해 본 경험
크래프톤의 도전에 함께 하기 위해 아래의 전형 과정이 필요합니다.
- 서류 전형 > *과제 전형 > 인성검사 (Personality Assessment) > 직무면접 (Technical Fit Interview) > 종합면접 (2-3회) (Culture Fit Interview) > 합격 및 입사
- *해당 절차는 각 포지션 및 후보자에 따라 변동이 있을 수 있습니다.
- 상시 채용으로 채용 완료 시 조기 마감될 수 있습니다.
- 필요 시, 인터뷰 및 직무 테스트가 추가될 수 있습니다.
- 전형 일정 및 합격 또는 불합격 결과는 지원서에 등록하신 이메일 또는 유선으로 개별 안내 드립니다.
필요 서류를 확인해주세요!
- 입사지원서 (자유 양식), 자기소개서, 경력기술서, 포트폴리오(필수)
- 신입일 경우 자기소개서를, 경력일 경우 경력기술서를 중심으로 기술해 주시기 바랍니다.
- 포트폴리오 첨부 시, 하단 안내 사항을 확인해 주시기 바랍니다.
근무지
- 역삼 센터필드 West 타워
고용형태
- 정규직
아래 안내 사항을 확인해주세요!
- 장애인 및 국가 유공자 등 취업 보호 대상자는 관계 법령에 따라 우대합니다.
- 지원서 내용 중 허위사실이 있는 경우에는 합격이 취소될 수 있습니다.
- 5개월의 수습기간을 적용합니다. 회사는 수습기간에 대한 평가 결과에 따라 본채용을 거부할 수 있으며, 수습기간 중이라도 중간평가 결과에 따라 수습기간을 조기 종료하고 본채용을 거부할 수 있습니다. 수습기간 내 고용형태 및 급여 조정은 없습니다.
- 채용 전형 중 궁금하신 사항은 크래프톤 채용 FAQ 내에서 확인하실 수 있습니다.
BE BOLD, LEARN AND WIN! 크래프톤의 성장과 도전의 스토리를 알아가고 싶다면?
- 크래프톤 제작 스튜디오
- 크래프톤 게임
- 크래프톤 비전 & 핵심가치
- 크래프톤 라이프 & 복리후생
- 크래프톤 공식 유튜브 채널
- 배틀그라운드 공식 유튜브 채널
- 크래프톤 인스타그램
- 크래프톤 블로그
Please check the information below
- Those eligible for an affirmative action program such as individuals with disabilities or with distinguished service to the state will be given hiring preference according to relevant laws
- False statements in your resume may lead to the withdrawal of the employment offer
- A 5-month probationary period applies. Based on the mid-term evaluation, employment may be terminated early or not continued. No changes in employment type or salary during this period.
- Please contact career@krafton.com for other inquiries
BE BOLD, LEARN AND WIN! Would you like to explore KRAFTON’s growth and adventure stories?
이 직무 지원하기
*
필수 입력 필드를 나타냅니다