← 求人一覧エンジニアリング
LLM Inference Engineer(国産LLMサービング)
SB Intuitions
勤務地
東京都港区(フルリモート可)
リモート
給与
¥6.5M - ¥18M
言語
日本語
掲載日
2026年4月11日
必要スキル
Python分散システムLLM推論最適化AWS高性能サーバ
職務概要
ソフトバンク設立のSB Intuitionsにて、日本語特化型国産大規模言語モデルの高スループット・低レイテンシなサービング環境を実現するLLM Inference Engineerを募集しています。大規模分散システムの知見を活かし、AIモデルの本番推論基盤を構築するポジションです。
主な業務内容
- LLM推論環境の設計・開発・最適化
- 高スループット・低レイテンシなサービングアーキテクチャの構築
- 大規模分散推論システムのコンポーネント設計
- モデルサービングのパフォーマンスチューニング
応募要件
必須スキル
- 実務経験5年以上
- 大規模分散システムまたは高パフォーマンスサーバアプリケーションの設計・開発経験
- 抽象化を伴うコンポーネント設計能力
歓迎スキル
- LLM推論フレームワーク(vLLM, TensorRT-LLM等)の経験
- GPU活用の推論最適化経験
- KubernetesやGPUクラスタ運用経験