【Python/週5日/フルリモート】音声合成(TTS)モデルエンジニア

案件要件
- 職種
- エンジニア
- 業務内容
- データ分析・AI活用SES
- 報酬目安
- 5,500 ~ 6,875円/時 月額:〜110万円※スキル見合い
- 稼働時間目安
- 週5日 (時間目安 160時間)
- はたらく場所
- フルリモート
- スキル
■業務内容
音声生成(TTS)技術の中核エンジニアとして、モデルのFine-tuning・推論最適化からサービス統合まで一気通貫で推進していただきます。
日本最大級のエンタメプラットフォームで、世界に通用する音声AIを創り上げる挑戦的なポジションです。
TTSモデル(Qwen-TTS、Orpheus等)のFine-tuning・話者/感情制御の実装
GPU上での推論効率化(バッチング、KV cache、量子化、同時実行数チューニング)
音素タイムライン生成のTTSパイプラインへの統合(アバターのリップシンク等への応用)
推論基盤の構築・運用、レイテンシ(TTFS)とサービス品質の管理
■求めるスキル(必須)
TTS/音声合成モデル
・TTSモデル(Qwen-TTS、Orpheus、VITS、Fish-Speech等)のFine-tuning・追加学習の実務経験
・話者適応・感情/プロソディ制御・多言語対応などのカスタマイズ経験
・音声データセットの構築・前処理パイプライン(音声/テキストアライメント等)の開発経験
・PyTorchでのモデル学習、LoRA等の効率的Fine-tuning手法の実装経験
推論効率化
・GPU上での推論最適化(バッチング、KV cache管理、量子化、ストリーミング生成)の実務経験
・推論基盤(vLLM、TensorRT-LLM、SGLang等)の選定・導入・最適化経験
・同時実行数(concurrency)のチューニング、レイテンシ(TTFS等)改善の実務経験
・CUDA最適化、メモリ効率化に関する深い理解
サービス化技術
・REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装経験
・推論サービスのレプリカ構成、オートスケーリング、監視・可観測性基盤の構築経験
■求めるスキル(尚可)
・音素タイムライン(phoneme timestamp)生成をTTSに統合した経験 ※優先採用
・リアルタイム音声対話・AIアバターのリップシンク等の開発経験
・言語:日本語能力検定1級、英語ビジネス会話レベル
・BigTech、音声AI特化企業でのTTS/音声生成モデルの開発・運用経験
■開発環境
■開発体制
■言語/技術
Python
■面談回数:確認中
■最低稼働日数:週5日
■PC貸し出し:有
■業務時間:
■リモート状況:フルリモート(地方可能)
■勤務地:六本木
■備考
■案件番号:794517293769
株式会社senyou
①SRDU開発(ラボ型開発支援)事業
スタートアップや新規事業を立ち上げたい企業の多くは「優秀なエンジニアを採用できない」 「社内のエンジニア体制が脆弱」「立ち上げに必要な人材が確保できない」という悩みを抱えています。
Senyouではこうした悩みを抱えた企業様に向けた開発支援を行っています。
私たちのコミュニティには、数多くのサービス開発やプロジェクトを遂行してきたエンジニアやPM、デザイナーが多数在籍しており、事業のフェーズや規模に応じて柔軟な開発体制を提案できることが強みです。
②フリーランスエージェント事業
世の中には数多くのフリーランスエージェントがありますが、Senyouでは、エンジニアとの長期的な信頼関係を前提としたキャリア支援や提案を大切にしています。
大手企業、メガベンチャーからスタートアップまで、幅広い企業様と直接的に関係を築いていることが強みで、これまでの豊富な経験から適切な情報やサポート体制の提供が可能です。
③フリーランスコミュニティプラットフォーム事業
Senyou Membersというフリーランスコミュ二ティを運営しています。現在(2021年3月)数十名の方に参加していただいています。
