
[Deep Learning Div.] Deep Learning Engineer - ML Ops (Infra) (5년 이상)
우리 팀(프로젝트)을 소개합니다.
[Deep Learning 본부 비전]
크래프톤 Deep Learning 본부는 사내외 여러 분야와 협업하여 다양한 문제에 대한 AI 솔루션을 제공하며, 자체 딥러닝 연구를 통해 우리만의 서비스를 개발합니다. 그 방향성은 크게 네 가지입니다.
- Production Cost Down : 게임 제작에 수반되는 많은 공정들에 딥러닝 기술을 투입하여 제작 과정을 단축하고, 게임 제작자들의 업무 경험을 혁신합니다.
- New Way to Create : 생성형 AI를 포함한 다양한 딥러닝 기술들로 게임 제작 전반에 걸쳐 창작자들의 크리에이티브를 확장합니다.
- Virtual Friends : 딥러닝 기술 기반 Virtual Friend를 개발하고 이를 게임 내/외 다양한 어플리케이션으로 적용합니다.
- Unique, Endless Gameplay : 딥러닝 기술을 통하여 유저들에게 매번 다른 경험을 선사하여 한계 없이 즐길 수 있는 게임 컨텐츠를 제공합니다.
[R&D]
Deep Learning 본부에서는 위 비전에 필요한Language Model, Voice Synthesis, Vision & Animation, Reinforcement Learning, Data-centric AI 등의 딥러닝 기술을 연구 개발 중입니다.
또한, 이를 효과적으로 아우를 수 있는 초거대모델/경량화모델 연구 및 각각의 요소 기술들을 자유롭게 조합하는 Multimodal 모델 연구도 진행하고 있습니다. 이러한 기술들을 실제 게임 제작 환경에 통합하여, 게임 제작 업무 경험을 혁신하고 크리에이티브를 확장합니다.
[Culture Fit]
Deep Learning 본부 인원들은 다양한 프로젝트를 통하여 여러 분야의 팀원들과 교류하고 협업하며 다양한 문제에 창의적인 아이디어를 제시할 수 있습니다. 나이 및 직급에 관계없이 자유롭게 의견을 개진하는 분위기가 장려됩니다.
다양한 문화적 배경을 가진 인원들이 모여 팀을 이루고 있으며 활발한 소통을 위해 통·번역 등 언어적 장벽을 해소할 수 있는 방법들을 적극 지원하고 있습니다.
[팀 소개]
KRAFTON MLSys & Ops 팀은 본부 내 모델 개발을 위한 GPU 인프라와 ML 플랫폼을 설계·구축·운영합니다.
또한 게임 서비스에 투입되는 ML 모델의 서빙 및 모델 최적화와, 필요 시 온디바이스(엣지) 배포까지 지원합니다.
우리 팀과 함께할 미션을 소개합니다.
이번 채용 포지션은 인프라/플랫폼 운영과 고도화를 담당합니다.
담당 업무 (Infra/Platform 중심)
- Kubernetes 기반 ML/GPU 클러스터 설계·구축·운영
- 스케줄링/격리/보안, 업그레이드·증설, 멀티테넌시·리소스 효율화
- GPU 플랫폼 고도화
- 드라이버/런타임/디바이스플러그인, GPU Operator 운영, DCGM 기반 관측, MIG/MPS 활용, 용량·비용·성능 최적화
- ML 플랫폼 구성요소 운영
- 실험/학습 워크스페이스, 잡/파이프라인 오케스트레이션(예: Argo Workflows 등), 아티팩트·레지스트리·스토리지
- 모델 서빙 인프라 운영
- KServe/Triton/ONNX Runtime/Ray Serve 등 기반의 서빙 스택 운영, SLO(지연/처리량/가용성) 및 배포 자동화(Canary/Rollout)
- 데이터 경로·스토리지·네트워크 설계
- 객체/블록/파일 스토리지(Ceph/MinIO 등), 고대역폭·저지연 전송 경로, (필요 시) IB/RoCE 등 학습 네트워킹 고려
- 관측성·신뢰성·보안 체계
- 로그/메트릭/트레이싱(OTel), 경보·대시보드, 이미지 서명(cosign)·정책(OPA Gatekeeper/Kyverno)·런타임 보호
- 표준화/자동화
- IaC/GitOps(Terraform/Argo CD 등) 기반의 재현 가능한 플랫폼 템플릿과 변경관리(롤백/감사) 운용
이런 경험을 가진 분과 함께 성장하고 싶습니다! (필수요건)
- 프로덕션 Kubernetes 운영 경험
- 장애 대응/업그레이드, 멀티 노드·멀티 클러스터 중 일부 실전 경험
- Linux 시스템/리소스 관리 심화 이해
- cgroups/NUMA/IO/네트워킹, 컨테이너 런타임(containerd/CRI-O)
- GPU 워크로드 운영 경험
- NVIDIA GPU Operator, k8s device plugin, DCGM, MIG/MPS 등 중 일부 실무 경험
- 관측성·운영 자동화
- Prometheus/Grafana/ELK·Loki/OpenTelemetry 중 일부, IaC/GitOps(Terraform/Argo CD 등) 경험
- 문서화·협업 역량
- 운영 표준·SLO 정의, 변경관리·릴리스 노트 등 기술 커뮤니케이션
- 해외 출장에 결격사유가 없는 분
이런 경험들이 있다면 저희가 찾는 그 분입니다! (우대요건)
- 클러스터/플랫폼 아키텍처 주도 경험
- 대규모 확장·마이그레이션·리플랫폼 또는 멀티테넌시 격리/비용·성능 최적화의 주도 사례
- 서빙/플랫폼 운영 경험
- KServe + (Triton/ONNX Runtime) 또는 Ray Serve 등 모델 서빙 인프라 중 1개 이상 실운영
- SLO/비용/용량계획 거버넌스
- GPU 효율/지연/처리량 등 핵심 지표로 목표 수립·운영, 온콜·장애 사후분석 주도
- 온프레미스 GPU 클러스터 신규 구축, CNI(Cilium/Calico)·서비스 메쉬(Istio/Envoy) 심화 운영
- 분산 학습 인프라 경험
- NCCL/GPUDirect, IB/RoCE 네트워크, (Ray/Horovod/DeepSpeed 등) 학습 잡 오케스트레이션
- 스토리지/데이터 경로 최적화
- Ceph/Rook, MinIO, 병렬/분산 파일시스템 설계·운영 및 성능 튜닝
- 파이프라인/플랫폼 엔지니어링
- Argo Workflows·Kubeflow·Airflow 등 잡/파이프라인, MLflow(Model Registry), Feast(Feature Store) 운영 경험
크래프톤의 도전에 함께 하기 위해 아래의 전형 과정이 필요합니다.
- 서류 전형 > 전화 인터뷰 (Phone Interview) > 직무 테스트 (Pre-Test) > 직무 면접 (Technical Fit Interview) > 종합 면접 (Culture Fit Interview) > 합격 및 입사
- 상시채용으로 우수 인재 채용 시 조기에 마감될 수 있습니다.
- 전형별 합격자에 대해 지원서에 등록하신 이메일 혹은 유선으로 개별 안내 드립니다.
- 전화 인터뷰의 경우, 필수 전형이 아닌 필요에 따라 진행되는 선택 전형임을 사전 안내 드립니다. 이에 대한 상세 내용은 개별 안내 드립니다.
- 필요 시 면접은 추가될 수 있으며, 이에 대한 상세 내용은 개별 안내 드립니다.
필요 서류를 확인해주세요!
- 입사지원서 (자유 양식), 성적증명서, 자기소개서, 경력기술서, 포트폴리오(필수)
- 신입일 경우 자기소개서를, 경력일 경우 경력기술서를 중심으로 기술해 주시기 바랍니다.
- 포트폴리오 첨부 시, 하단 안내 사항을 확인해 주시기 바랍니다.
근무지
- 역삼 센터필드
고용형태
- 정규직
아래 안내 사항을 확인해주세요!
- 장애인 및 국가 유공자 등 취업 보호 대상자는 관계 법령에 따라 우대합니다.
- 지원서 내용 중 허위사실이 있는 경우에는 합격이 취소될 수 있습니다.
- 5개월의 수습기간을 적용합니다. 회사는 수습기간에 대한 평가 결과에 따라 본채용을 거부할 수 있으며, 수습기간 중이라도 중간평가 결과에 따라 수습기간을 조기 종료하고 본채용을 거부할 수 있습니다. 수습기간 내 고용형태 및 급여 조정은 없습니다.
- 채용 전형 중 궁금하신 사항은 크래프톤 채용 FAQ 내에서 확인하실 수 있습니다.
BE BOLD, LEARN AND WIN! 크래프톤의 성장과 도전의 스토리를 알아가고 싶다면?
- 크래프톤 제작 스튜디오
- 크래프톤 게임
- 크래프톤 비전 & 핵심가치
- 크래프톤 라이프 & 복리후생
- 크래프톤 공식 유튜브 채널
- 배틀그라운드 공식 유튜브 채널
- 크래프톤 인스타그램
- 크래프톤 블로그
Please check the information below
- Those eligible for an affirmative action program such as individuals with disabilities or with distinguished service to the state will be given hiring preference according to relevant laws
- False statements in your resume may lead to the withdrawal of the employment offer
- A 5-month probationary period applies. Based on the mid-term evaluation, employment may be terminated early or not continued. No changes in employment type or salary during this period.
- Please contact career@krafton.com for other inquiries
BE BOLD, LEARN AND WIN! Would you like to explore KRAFTON’s growth and adventure stories?
채용 공고 알림 생성
KRAFTON 에서 경력을 쌓고 싶으신가요? 향후 채용 정보를 이메일로 바로 받아보세요.
이 직무 지원하기
*
필수 입력 필드를 나타냅니다