コンテンツにスキップ
← 求人一覧
リサーチ

Research Engineer - Post-training & Alignment / 事後学習

Third Intelligence

勤務地

東京都千代田区

ハイブリッド

給与

¥15M - ¥50M

言語

日本語 / 英語

掲載日

2026年4月14日

必要スキル

PythonPyTorchDeepSpeedFSDPLLMRLHFDPOSFTNLPFine-tuning

職務概要

株式会社Third Intelligenceは、Transformerを超える次世代AIアルゴリズムの創出と「遍在型AGI」の実現を目指しています。事前学習を終えた基盤モデルを実際に人間が使える知能へと仕上げる、Post-training & AlignmentのResearch Engineerを募集します。プロダクトとしてのAIの価値を直接左右する重要な工程を担います。

主な業務内容

  • SFT, RLHF, DPO等の手法を用いた、モデルの応答性能と推論能力の高度化
  • 特定タスク(会話、プログラミング、数学、論理推論等)における思考プロセスの最適化と精度向上
  • ハルシネーションの抑制や安全性確保のための学習手法、および独自の評価メトリクスの設計
  • 高品質な合成データの生成・選別パイプラインの構築と、データ効率の最大化

求める経験

  • 大規模言語モデル(LLM)のFine-tuningや、アラインメント手法に関する実務・研究経験
  • Python, PyTorch, Distributed Training Frameworks (DeepSpeed, FSDPなど) の深い知識
  • NLP領域の最新論文を自律的にキャッチアップし、その手法を迅速に再現・検証できる能力

歓迎する経験

  • 基盤モデルの事前学習に関する知識や経験
  • フロンティアモデルの開発・運用実績
  • 英語による技術議論およびグローバルな開発体制における業務経験
  • C++/CUDAなどの低レイヤー言語を用いた計算グラフ最適化
  • LLMの評価ベンチマークの設計、あるいはデータセットの構築に関する実績