AI Platform Engineer

Create Our Infrastructure

Pangyo, Gyeonggi, South Korea (On-site)

핵심어  #Backend, #GPU, #LLM Infrastructure


개요

신약개발 초기 단계(Discovery)는 여전히 경험과 감각에 크게 의존하는 탐색 문제로 남아있습니다. 수십만~수백만 개의 후보물질, 수천 편의 논문과 특허,

끊임없이 업데이트되는 실험 결과 속에서 연구자는 매 순간 어떤 가설을 세우고, 무엇을 먼저 검증할지 결정해야 합니다.


GAIA-BT는 이 의사결정 자체를 수행하는 AI-Agent를 만듭니다.


GAIA-BT에서 이 역할이 왜 중요한가요?

GAIA-BT의 AI-Agent는

  • 수백 개의 실험을 병렬로 실행하고

  • 대형 LLM과 도메인 모델을 넘나들며

  • 대규모 화합물·문헌 데이터를 지속적으로 읽고 씁니다.

이 시스템은 “잘 돌아가는 서버”가 아니라, 실험을 망치지 않는 인프라를 필요로 합니다.

“이런 실험을 해보고 싶다”라고 말했을 때, 이 포지션은 “그럼 이 구조로 가면 안전하고 빠르게 됩니다”라고 답할 수 있는 사람입니다.


신청 마감일: 채용 완료시 


당신이 맡게 될 역할

GAIA-BT의 AI Platform Engineer는 LLM·GPU·스토리지 중심의 연구 인프라 전체를 설계하고 운영합니다. 


1. LLM & AI-Agent 실행을 위한 백엔드 시스템 구축

  • AI-Agent 및 실험 워크플로우를 위한 Backend API 설계

  • 비동기·병렬 작업 처리 시스템 구축

  • 장시간 실행되는 에이전트 작업의 상태 관리 및 재시도 설계

  • 실험 재현성을 고려한 실행 환경 관리

2. GPU 서버 & 연산 자원 운영

  • 온프레미스 GPU 서버 또는 클라우드 GPU 인프라 운영

  • CUDA, NVIDIA Driver, Docker 기반 GPU 환경 구성

  • 실험 우선순위 및 자원 할당 전략 설계

  • LLM inference / fine-tuning 워크로드 최적화


3. NAS / 대용량 데이터 스토리지 설계

  • 화합물 데이터, 모델 아티팩트, 실험 로그 저장 구조 설계

  • NAS / Object Storage 기반 데이터 관리

  • 대규모 파일 I/O 성능 최적화

  • 데이터 버저닝 및 백업 전략 수립


4. 연구 친화적인 DevOps / MLOps 환경 구축

  • 모델, 프롬프트, 에이전트 버전 관리

  • 실험 로그 및 메트릭 수집

  • 실패해도 다시 돌아올 수 있는 실험 환경 설계

  • 보안과 접근 제어를 고려한 내부 연구 인프라 구축


5. AI Agent Engineer와의 밀접한 협업

  • 실험 설계 단계부터 인프라 관점의 피드백 제공

  • “이 실험은 비용이 너무 큼 / 이건 구조를 바꾸면 됨” 같은 현실적 제안

  • 새로운 모델·프레임워크 도입 시 기술 검증(PoC) 주도



핵심 기술 스택

  1. LLM / Agent

  • OpenAI, Claude, Gemini, LLaMA 계열 모델 활용 경험

  • LangChain, LangGraph, LlamaIndex 기반 에이전트 시스템 구축 경험

  • Tool calling, function calling, structured output 설계

  • Multi-agent coordination, reflection, self-critique 패턴

  • Retrieval & Knowledge System


  1. RAG 아키텍처 설계 및 고도화

  • Vector DB (FAISS, Milvus, Pinecone, Weaviate, chromaDB 등)

  • 문헌/특허 파싱 및 지식 그래프적 접근

  • Long-term memory, hierarchical memory 설계 경험

  • Scientific Computing / Bio-Chem Domain


  1. Python 기반 연구 코드 작성 능력

  • RDKit, Open Babel 등 cheminformatics 라이브러리

  • BioPython, Scanpy, AnnData 등 bioinformatics 툴


  1. LLM output 평가 프레임워크 설계

  • 자동 테스트, 시뮬레이션 기반 검증 파이프라인

  • Hallucination 억제 전략 및 scientific constraint 적용


  1. System / Infrastructure

  • FastAPI, Flask 등 API 서버 설계

  • 비동기 작업 처리 (Celery, Ray 등)

  • AWS/GCP 기반 인프라 활용

  • MLOps / LLMOps 파이프라인 구축



이런 분과 특히 잘 맞아요

  • “LLM으로 논문 요약하는 건 이제 재미없다”고 느끼는 분

  • AI가 가설을 세우고 실험 전략을 짜게 만들고 싶은 분

  • 코드, 논문, 데이터를 오가며 문제를 구조화하는 데 익숙한 분

  • 바이오/화학 도메인을 두려워하지 않고 파고들 수 있는 분

  • 연구와 제품 사이의 긴장을 즐기는 분


GAIA-BT에서 얻게 되는 것

  • AI for Drug Discovery의 핵심 문제를 직접 정의할 권한

  • 논문이 아니라 실제 신약개발 의사결정에 쓰이는 AI 시스템

  • LLM 에이전트의 한계를 몸으로 부딪히며 넘는 경험

  • 빠른 실험 → 실패 → 개선이 가능한 작은 팀의 밀도

  • “이건 아무도 안 해봤다”를 매일 마주하는 환경


[채용 절차] 서류 전형 > 기술 인터뷰 > 최종 합격 및 처우 협의

  • 인터뷰는 대면 진행을 원칙으로 합니다.

  • 기술 평가 단계에서는 과거 업무 경험과 프로젝트에 대한 10분 분량의 PPT 발표가 포함됩니다.

  • 최종 합격 시 3개월의 수습 기간이 있으며, 수습 기간 동안 급여나 처우에 차이는 없습니다.

  • 합격자에 한하여, 이메일로 개별 안내 드립니다.

유의사항

  • 본 채용은 상시 채용으로 합격자 발생 시 별도의 안내 없이 마감될 수 있습니다.

  • 해외여행에 결격사유가 없으며, 당사 내규에 따른 채용 결격사유에 해당하지 않는 분에 한해 지원이 가능합니다.

  • 입사 시, 사전 통보 없이 영리 활동이나 이중 취업(회사 직무와 관련 없는 업무)을 할 경우, 채용이 취소될 수 있습니다.

  • 청탁 또는 기타 부정한 행위를 통해 합격한 사실이 발견될 경우, 합격 및 채용이 무효 처리됩니다.

  • 지원서 내용에 대한 증빙 서류 제출을 요구하거나 관계 기관에 사실 여부를 확인할 수 있으며, 내용 중 허위사실 기재, 위조, 변조 등이 발견될 경우 불합격 및 채용이 취소될 수 있습니다.


근무지위치: (13453) 경기도 성남시 수정구 금토로 52, E동 714호 (경기스타트업브릿지)

기타 문의: 가이아비티 / 백예지 대리 (mbaek@gaia-bt.com)