← 求人一覧エンジニアリング
機械学習エンジニア(音声・言語・画像処理)
Rimo
勤務地
東京都渋谷区
リモート
給与
応相談
言語
日本語
掲載日
2026年3月27日
必要スキル
PythonPyTorch音声認識自然言語処理画像認識WhisperLLMGCPKubernetes
職務概要
Rimo合同会社にて、動画アップロードから文字起こし・話者分離・議事録作成を行うAIプロダクト「Rimo Voice」の機械学習エンジニアを募集しています。音声・言語・画像のいずれの領域でも活躍でき、GoogleやMicrosoftの精度を日本語で凌駕するプロダクト開発に携わります。
主な業務内容
音声認識
- 文字起こし精度向上(Whisperのファインチューニング等)
- 話者分離の高速化・高精度化
言語処理
- 要約・議事録生成(LLM活用・プロンプトエンジニアリング)
- ToDoの抽出・担当者推論
- 要約箇所のオリジナル位置特定
画像認識
- 動画からの情報抽出(資料共有シーン検出・内容反映)
- 顔認識を通じた話者分離
応募条件
- Kaggler、大学助教授、企業研究所、MLエンジニアのいずれかの経験
- 1ヶ月で実装方針が立ち、3-6ヶ月で成果を出せる実行力
- タスクをKaggleのように整理しデータセット準備ができれば歓迎
- 特定タスクに対して論文・実装済みコードを探索できれば歓迎
- 学会論文執筆・スポンサー活動ができれば歓迎