【Python/エンド直】音声合成モデルの開発・推論最適化におけるAIエンジニア

案件要件
- 職種
- エンジニア
- 業務内容
- データ分析・AI活用SES
- 報酬目安
- 8,750 ~ 9,375円/時 ※税抜表記
単価:140〜150万円/月 - 稼働時間目安
- 週5日 (時間目安 160時間)
- はたらく場所
- リモート併用東京都港区六本木6-1-25
- スキル
【案件概要】
大規模なエンタメプラットフォームにおける最先端の音声合成(TTS)モデルの開発や推論最適化を主導していただきます。
モデルの追加学習やカスタマイズから、GPU環境での効率化、サービスへの統合にいたるまで一連の工程に携わることができるポジションです。
【仕事内容】
下記の業務を担っていただく想定です。
・音声合成モデルを用いた追加学習や話者・感情の制御機能の実装
・GPU環境におけるバッチ処理やキャッシュ管理、量子化などによる推論の効率化
・リップシンクなどへの応用を見据えた、音素タイムライン生成機能のシステム統合
・推論基盤の設計・運用、および応答速度やサービス品質の管理
※詳細は面談時にお伝えします。
【必須スキル】
・音声合成モデルを用いた追加学習や実務での開発経験
・話者適応、感情制御、多言語対応などのカスタマイズ経験
・音声データセットの構築や前処理システムの開発経験
・PyTorchを用いたモデル学習や、効率的な追加学習手法の実装経験
・GPU環境における推論最適化(バッチ処理、キャッシュ管理、量子化、ストリーミング生成)の実務経験
・推論基盤(vLLM、TensorRT-LLMなど)の選定、導入、最適化の経験
・同時実行数の調整や応答速度の改善に関する実務経験
・CUDAの最適化やメモリ効率化に関する深い知見
・REST API、WebSocket、gRPCの設計や、ストリーミング配信の実装経験
・推論サービスの冗長化、自動拡張、監視基盤の構築経験
【尚可スキル】
・音素タイムライン生成を音声合成システムへ統合した経験
・リアルタイムでの音声対話やアバターのリップシンクなどの開発経験
・日本語能力試験1級相当の語学力、またはビジネスレベルの英語力
・大手IT企業や音声AI専門企業における音声合成モデルの開発・運用経験
【作業環境】
Windows/Mac選択可
【就業時間】フレックス
【契約更新】初月単月(以降複数月更新)
【商流】エンド→当社
【精算幅】140〜180
【面談回数】1
【服装】カジュアル
【最寄駅】六本木駅
【管理番号】anken_46008_252
株式会社アイデンティティー
私達は、ITフリーランス特化の案件情報サイト、テクフリ(https://freelance.techcareer.jp/ )
を運営しており、これまでに10,000名様以上へのご支援実績があります。
主な特徴は以下の3つです。
■「高単価」:エンド直案件が95%以上&中間マージン10%案件多数!
■「福利厚生」:働けなくなったときは最大15万円(/月)給付!正社員並みの安心感
■「手厚いサポート」:案件のご紹介はもちろんのこと、案件参画中も当社専属カウンセラーが徹底サポートいたします!
