コンテンツにスキップ
← 求人一覧
エンジニアリング

機械学習エンジニア(音声・言語・画像処理)

Rimo

勤務地

東京都渋谷区

リモート

給与

応相談

言語

日本語

掲載日

2026年3月27日

必要スキル

PythonPyTorch音声認識自然言語処理画像認識WhisperLLMGCPKubernetes

職務概要

Rimo合同会社にて、動画アップロードから文字起こし・話者分離・議事録作成を行うAIプロダクト「Rimo Voice」の機械学習エンジニアを募集しています。音声・言語・画像のいずれの領域でも活躍でき、GoogleやMicrosoftの精度を日本語で凌駕するプロダクト開発に携わります。

主な業務内容

音声認識

  • 文字起こし精度向上(Whisperのファインチューニング等)
  • 話者分離の高速化・高精度化

言語処理

  • 要約・議事録生成(LLM活用・プロンプトエンジニアリング)
  • ToDoの抽出・担当者推論
  • 要約箇所のオリジナル位置特定

画像認識

  • 動画からの情報抽出(資料共有シーン検出・内容反映)
  • 顔認識を通じた話者分離

応募条件

  • Kaggler、大学助教授、企業研究所、MLエンジニアのいずれかの経験
  • 1ヶ月で実装方針が立ち、3-6ヶ月で成果を出せる実行力
  • タスクをKaggleのように整理しデータセット準備ができれば歓迎
  • 特定タスクに対して論文・実装済みコードを探索できれば歓迎
  • 学会論文執筆・スポンサー活動ができれば歓迎