【フルリモート/週5/Python】最先端のAIモデルを最速で社会実装する次世代MLOps・機械学習基盤エンジニア お任せしたいこと [役割]MLOpsエンジニア・バックエンドエンジニアとして、データサイエンティストが開発した最先端の機械学習モデル(画像認識、自然言語処理、推薦システム等)を、大規模トラフィックが流れる商用プロダクトへ安定的かつ高速にデプロイ・運用するための次世代MLOps基盤の設計および開発をお任せします。 [役割に対して求める成果]「AIモデルの精度は高いが、本番環境で動かすと遅い・落ちる」という機械学習プロジェクト特有の死の谷(PoC死)をエンジニアリングの力で乗り越え、Pythonとコンテナ技術を駆使して、推論APIの極限のパフォーマンス最適化と、モデルの自動再学習・デプロイメント(CT/CD)パイプラインを堅牢に構築すること。 具体的な業務内容 ・Python(Python 3.11以降)およびFastAPI、BentoML等を用いた、フロントエンドやバックエンドシステムから呼び出される超低遅延・高スループットな機械学習推論API(REST / gRPC)の設計・実装 ・ONNX Runtime、TensorRT、Triton Inference Server等を利用した、GPU/CPUリソースの極限の最適化およびディープラーニングモデルの推論高速化 ・MLflow、Kubeflow、Vertex AI等を利用した、データの前処理からモデル学習、評価、モデルレジストリ管理に至る一連の機械学習パイプライン(DAG)の構築・自動化 ・本番環境におけるデータの傾向変化(データドリフト)やモデルの精度低下(コンセプトドリフト)をリアルタイムに検知する、高度なモニタリング基盤の設計・運用 ・Docker/Kubernetes環境(AWS EKS等)での負荷に応じた推論APIのオートスケール設計、およびカナリアリリース・A/Bテスト環境の構築 ・GitHub ActionsやArgo CDを利用した、機械学習モデルの継続的インテグレーション・継続的デリバリー(CI/CD)パイプラインの運用 必須スキル・経験 ・Pythonを用いたWebアプリケーション(API)またはデータ処理バックエンドの開発・運用経験(3年以上) ・機械学習モデル(Scikit-Learn, PyTorch, TensorFlow等)をAPIとして本番環境にデプロイ・運用した経験 ・Docker、Kubernetesなどのコンテナ技術に関する基礎知識および実務での利用経験 ・Git/GitHubを用いたチーム開発およびPull Requestベースのコードレビュー経験 歓迎スキル・経験 ・MLOps関連ツール(MLflow, Kubeflow, DVC, Argo Workflows等)の導入・運用経験 ・推論の高速化技術(ONNX, TensorRT, 量子化, 蒸留など)に関する深い知識および実装経験 ・大規模なトラフィック(秒間数千リクエスト以上)を捌くバックエンドシステムのパフォーマンスチューニング経験 ・AWSまたはGCP環境におけるクラウドネイティブなアーキテクチャ設計・運用経験 ・Terraform等のIaC(Infrastructure as Code)ツールを用いたインフラ自動化の経験 ・データサイエンティストやAIリサーチャーと密に協業し、数理モデルの要件をソフトウェア設計に落とし込んだ経験 開発環境 言語・フレームワーク:Python 3.11+, FastAPI, BentoML, PyTorch, ONNX MLOps・データ基盤:MLflow, Kubeflow (または Vertex AI / SageMaker), DVC, Apache Airflow インフラ・ミドルウェア:AWS (EKS, EC2 GPUインスタンス, S3) または GCP, Docker, Kubernetes, NVIDIA Triton CI/CD・監視:GitHub Actions, Argo CD, Datadog, Prometheus, Grafana, Slack 開発チームについて プロダクトマネージャー1名、テックリード1名、MLOpsエンジニア5名(今回募集枠含む)、データサイエンティスト・AIエンジニア6名、SRE3名の体制です。「研究室のノートブック(Jupyter)で動くコードを、そのまま本番には出させない」という強いエンジニアリングのプライドを持ち、数理的な専門家(データサイエンティスト)とソフトウェアの専門家(MLOps/バックエンド)が互いにリスペクトし合いながら、AIの真の価値をユーザーに届けるための泥臭い議論を厭わないカルチャーです。 求める人物像 ・「AIモデルを作る」こと以上に、そのモデルを「スケーラブルで安定したソフトウェア・インフラとしてどう動かすか」というアーキテクチャ設計に強い情熱を持てる方 ・データサイエンティストの書いたコードを読み解き、アルゴリズムの意図を壊すことなく、Pythonicで高速・堅牢な本番用コードへリファクタリングする知的な作業を楽しめる方 ・フルリモート環境下において、研究職気質の強いメンバーや他職種とも自発的かつ円滑にテキストや通話でコミュニケーションが取れる方 仕事の魅力 PoC(実証実験)フェーズを終え、いよいよAIを本格的なビジネスインフラとして稼働させるフェーズにおいて、最も重要かつ不足している「MLOps」という領域を牽引できる非常にエキサイティングなポジションです。高度な数理モデルとクラウドネイティブなバックエンド技術の交差点に立ち、GPUチューニングから分散処理システムまでを網羅する経験を積むことで、市場価値が極めて高い「AI時代のトップティア・ソフトウェアエンジニア」としてのキャリアを確固たるものにすることができます。 働き方 リモート環境 [フルリモート] フルリモートで働いていただけます。