エンジニアフルリモート

【フルリモート/週5/AWS】数千万人の熱狂を支える大規模配信・エンタメプラットフォームのSRE(Site Reliability Engineer)

【フルリモート/週5/AWS】数千万人の熱狂を支える大規模配信・エンタメプラットフォームのSRE(Site Reliability Engineer)

案件要件

職種
エンジニア
業務内容
システム開発・運用
SES
報酬目安
5,800 ~ 6,900円/時
稼働時間目安
週5日 (時間目安 160時間)
はたらく場所
フルリモート
スキル

【フルリモート/週5/AWS】数千万人の熱狂を支える大規模配信・エンタメプラットフォームのSRE(Site Reliability Engineer)

お任せしたいこと

[役割]SRE(Site Reliability Engineer)として、月間数千万人が利用するエンターテインメント・動画配信プラットフォームのAWSインフラアーキテクチャ設計、および信頼性(Reliability)と開発生産性の両立を主導していただきます。
[役割に対して求める成果]突発的なトラフィックスパイク(人気コンテンツの配信時など)においても絶対にサービスを落とさない極めて可用性の高いシステム基盤の実現と、SLI/SLOに基づいたデータ駆動な運用によって、開発チームが安心して高速にコードをデプロイできる環境を構築すること。

具体的な業務内容

・Amazon EKS(Kubernetes)またはECSをベースとした、マイクロサービスアーキテクチャ向けのコンテナ実行環境の設計・構築・運用
・TerraformやAWS CDKを用いたインフラストラクチャのコード化(IaC)と、レビュープロセスを組み込んだセキュアなインフラ変更プロセスの推進
・Datadog等のオブザーバビリティ(可観測性)ツールを活用したSLI/SLOの策定、計測、およびダッシュボードの構築
・トラフィックの急増に耐えうるCDN(Amazon CloudFront)の最適なキャッシュ戦略の設計と、DB(Amazon Aurora, ElastiCache)のパフォーマンスチューニング
・GitHub ActionsやArgo CDを利用したCI/CDパイプラインの高度化と、カナリアリリース等の安全なデプロイ手法の導入
・GoやPythonを用いた、トイル(手作業の運用業務)を撲滅するための社内自動化ツールの開発、およびカオスエンジニアリング等の障害テストの実施

必須スキル・経験

・AWS環境における大規模なインフラ設計、構築、運用経験(3年以上)
・Terraform、AWS CDK、またはAWS CloudFormation等を用いたIaCの実務経験
・Docker等のコンテナ技術を利用した本番環境での運用経験
・Linux環境における高度なトラブルシューティング能力、およびネットワークの基礎知識
・Git/GitHubを用いたバージョン管理およびチーム開発経験

歓迎スキル・経験

・SREとしての実務経験、またはSLI/SLOの策定とそれに基づいた運用経験
・Kubernetes(Amazon EKS等)を用いた大規模なクラスタの設計・運用・チューニング経験
・大規模トラフィック(秒間数万リクエスト等)を扱うWebサービスのパフォーマンス改善・負荷対策の経験
・Go、Python等のプログラミング言語を用いたバックエンド開発、または自動化ツールの開発経験
・Datadog、New Relic、Prometheus等を用いた高度なオブザーバビリティ基盤の構築経験

開発環境

クラウド・インフラ:AWS (EKS, ECS, Aurora, ElastiCache, CloudFront, S3, Lambda, Route53 等)
コンテナ・IaC:Docker, Kubernetes, Terraform, AWS CDK
CI/CD・監視:GitHub Actions, Argo CD, Datadog, PagerDuty
言語・ツール:Go, Python, Bash, GitHub, Jira, Slack, Notion

開発チームについて

CTO直下のSREグループに所属し、マネージャー1名、SRE6名(今回募集枠含む)の体制です。「障害は個人のミスではなくシステムの問題である」というBlameless(非難しない)なポストモーテムの文化が根付いており、アプリケーションエンジニアと対等な立場でアーキテクチャの議論を行いながら、システムのレジリエンス向上に取り組んでいます。

求める人物像

・「インフラエンジニア」という枠に囚われず、ソフトウェアエンジニアリングの力でインフラや運用の課題を解決していくことに情熱を持てる方
・夜間や休日のアラート対応といった「運用による疲弊」を極度に嫌い、根本原因の解決と徹底した自動化に執念を持てる方
・フルリモート環境下において、開発エンジニアやPdMなど他職種とも自発的かつ円滑にテキストや通話でコミュニケーションが取れる方

仕事の魅力

国民的なエンターテインメントサービスの裏側を支え、「決してサービスを止めない」という極度のプレッシャーと大きなやりがいを同時に味わえるポジションです。秒間数万リクエストを超えるトラフィックスパイクを捌くための高度なCDN設計やKubernetesのチューニングなど、大規模トラフィック環境下でしか得られないエッジの効いた技術的課題に挑むことで、SREとして国内トップクラスの市場価値と専門性を確立することができます。

働き方

リモート環境

[フルリモート] フルリモートで働いていただけます。


SNSでこの案件をシェア

株式会社Kaizen Tech Agent

株式会社Kaizen Tech Agent

株式会社Kaizen Tech Agentは、「人と技術をつなぐ」ことを企業理念に掲げ、日々向上していく『技術』と『人』を最適な形でむつび付け提供することで、
お客様にとって真にプラスとなる価値でありたいと考えております。
私たちはそれぞれの個性を尊重し、ほっとする和みの社風でありながら、変化する時代に対して受け身にならず、未来への挑戦心を宿しています。
事業領域は、WEBアプリ開発、業務システム開発、スマホアプリ開発、インフラ構築など幅広く展開しており、
フリーランス様に対して最適な案件をご提案させて頂いております。どんな些細な事でも結構ですので是非いつでもお気軽にご相談ください。

案件を公開しました

案件をシェアしませんか?(SNSシェアをすることで、求職者の応募数アップが期待できます。)

案件を公開しました

この案件は限定公開です。案件のURLを知っている人のみが案件情報を見ることができます。

応募が完了しました

アピールしたいポイントがあれば積極的にメッセージを送ってみましょう。