← 求人一覧

エンジニアリング

機械学習エンジニア（音声・言語・画像処理）

Rimo

勤務地

東京都渋谷区

リモート

給与

応相談

言語

日本語

掲載日

2026年3月27日

必要スキル

PythonPyTorch音声認識自然言語処理画像認識WhisperLLMGCPKubernetes

Rimoで応募するrimo.app で詳細を見る

職務概要

Rimo合同会社にて、動画アップロードから文字起こし・話者分離・議事録作成を行うAIプロダクト「Rimo Voice」の機械学習エンジニアを募集しています。音声・言語・画像のいずれの領域でも活躍でき、GoogleやMicrosoftの精度を日本語で凌駕するプロダクト開発に携わります。

主な業務内容

音声認識

文字起こし精度向上（Whisperのファインチューニング等）
話者分離の高速化・高精度化

言語処理

要約・議事録生成（LLM活用・プロンプトエンジニアリング）
ToDoの抽出・担当者推論
要約箇所のオリジナル位置特定

画像認識

動画からの情報抽出（資料共有シーン検出・内容反映）
顔認識を通じた話者分離

応募条件

Kaggler、大学助教授、企業研究所、MLエンジニアのいずれかの経験
1ヶ月で実装方針が立ち、3-6ヶ月で成果を出せる実行力
タスクをKaggleのように整理しデータセット準備ができれば歓迎
特定タスクに対して論文・実装済みコードを探索できれば歓迎
学会論文執筆・スポンサー活動ができれば歓迎

Rimoで応募するrimo.app で詳細を見る