← 求人一覧エンジニアリング
MLエンジニア(SRE×MLOps・本番AI基盤)
スリーシェイク
勤務地
東京都(フルリモート可)
リモート
給与
750万〜1,500万
言語
日本語
掲載日
2026年4月11日
必要スキル
PythonPyTorchKubernetesKubeflowVertex AIMLflowNeMoNIMPrometheusGrafanaOpenTelemetryAWSGCPTerraformDocker
職務概要
SREドメインで国内トップクラスの実績を持つ株式会社スリーシェイクが、生成AI・機械学習モデルの開発・運用支援を本格化するにあたり、MLエンジニアを募集しています。NVIDIA Inceptionプログラムに採択され、最新GPU環境やDLI研修など、AI開発に特化したリソースを活用できる環境です。モデルを「作る」だけでなく「本番環境で動かし続ける」MLOps視点を持つエンジニアを求めています。
主な業務内容
- NeMoを用いたLLM・画像・音声モデルのファインチューニング・カスタマイズ(LoRA・RAG・RLHF等)
- NIMでの推論マイクロサービス設計・実装・パフォーマンス最適化
- Python/PyTorchを中心としたモデル開発・評価・改良サイクルの推進
- Kubeflow・Vertex AI・MLflow等を活用したMLパイプライン構築・自動化・継続的デプロイ
- 本番モデルのパフォーマンス監視・ドリフト検知・再学習トリガーの設計・運用
- モデルの推論品質・レイテンシ・コストのモニタリング基盤構築(Prometheus・Grafana・OpenTelemetry連携)
- SREチームと連携したMLシステムの信頼性・可用性向上(SLI/SLO定義、インシデント対応)
応募条件
- 機械学習モデルの開発・運用経験
- Python/PyTorchを用いたモデル開発経験
- MLOps基盤(Kubeflow、MLflow、Vertex AI等)の構築・運用経験
- クラウド環境(AWS/GCP)でのインフラ構築・運用経験
- Kubernetes環境での開発経験があれば尚可