【フルリモート/週5】AWS SRE・インフラエンジニア(EKS / Kubernetes・大規模トラフィック基盤運用)

案件要件
- 職種
- エンジニア
- 業務内容
- システム開発・運用SES
- 報酬目安
- 4,900 ~ 5,600円/時
- 稼働時間目安
- 週5日 (時間目安 160時間)
- はたらく場所
- フルリモート
- スキル
【フルリモート/週5】AWS SRE・インフラエンジニア(EKS / Kubernetes・大規模トラフィック基盤運用)
お任せしたいこと
自社で展開する大規模Webサービスにおいて、AWS上のコンテナオーケストレーション基盤(主にAmazon EKS)の設計・構築・運用保守、およびサイト信頼性エンジニアリング(SRE)の実践をお任せします。
「流行っているからとりあえずKubernetesを導入する」といったオーバーエンジニアリングは避け、マイクロサービス化によって複雑に絡み合ったシステムを確実にコントロールし、突発的な高トラフィックに対してもサービスを絶対に落とさないための「スケーラビリティ」と「オブザーバビリティ(可観測性)」の向上に泥臭く取り組んでいただきます。
具体的な業務内容
・Amazon EKS(Kubernetes)を中心とした、大規模トラフィックを捌くためのコンテナインフラ環境の設計・構築・運用保守
・KarpenterやCluster Autoscaler等を利用した、コスト効率とパフォーマンスを両立させるオートスケーリング戦略の策定・実装
・Terraformを用いたインフラ構成のコード化(IaC)、およびArgo CD等を利用したGitOpsベースのデプロイメントパイプラインの構築
・DatadogやPrometheusを利用した、マイクロサービス間の分散トレーシング導入およびSLI/SLOの定義・運用
・本番環境におけるカオスエンジニアリングや負荷テストの実施、およびボトルネックの事前検知とキャパシティプランニング
・障害発生時のインシデントコマンダーとしての初動対応、および「非難を伴わないポストモーテム(Blameless Post-mortem)」の実施と再発防止策の徹底
・アプリケーションエンジニア(開発チーム)に対する、コンテナのベストプラクティス啓蒙および技術支援
必須スキル・経験
・AWSを利用したインフラストラクチャの構築、および実運用環境での保守経験(目安として3年以上)
・本番環境におけるKubernetes(EKS, GKE, またはオンプレミス等)の運用・トラブルシューティング経験
・Docker等のコンテナ技術、およびLinuxのネットワーク(名前空間、iptables等)に関する深い知識
・Terraform等を用いたインフラ構成のコード化(IaC)経験
・Git / GitHubを用いた構成管理・チーム開発経験
歓迎スキル・経験
・Go、Python、Node.js等を用いたバックエンドアプリケーションの開発経験
・IstioやAWS App Mesh等のサービスメッシュを利用した、高度なトラフィック制御の経験
・Datadog、New Relic等のAPMツールを用いたオブザーバビリティの向上・パフォーマンス改善経験
・24時間365日の稼働が求められるシステムにおける、オンコール対応やインシデント管理体制の構築経験
・CKA(Certified Kubernetes Administrator)、またはAWS認定ソリューションアーキテクト – プロフェッショナル等の資格
開発・業務環境
クラウド・インフラ:AWS (EKS, EC2, ALB, Route 53, VPC, IAM等)
コンテナ・オーケストレーション:Kubernetes, Docker
IaC・CI/CD:Terraform, Argo CD, GitHub Actions
監視・管理:Datadog, Prometheus, Grafana
コミュニケーション・管理:GitHub, Jira, PagerDuty, Slack, Zoom
プロジェクトチームについて
インフラ統括部門内のSREチームへの配属となります。
「開発チームを監視・統制するインフラ部門」ではなく、「開発者が安全に高速にデプロイできるための舗装された道(Paved Road)を作る」というマインドを大切にしています。Kubernetes特有の謎のPodのクラッシュやネットワークの断断といった難解なトラブルに対しても、文句を言うのではなく「どこにメトリクスを仕込めば原因が特定できるか」を事実ベースで議論し、トイル(手作業)の撲滅に向けて地道に自動化を進める実直なメンバーが集まっています。
求める人物像
・華やかな新規機能開発よりも、バックグラウンドでシステムが「当たり前に動き続ける」ための泥臭い信頼性向上にやりがいを感じる方
・障害発生時にパニックにならず、ログやメトリクスという事実に基づいて冷静に原因を切り分けられる方
・「インフラだけを守る」のではなく、アプリケーションのコードやアーキテクチャの設計にまで踏み込んで、開発チームと建設的な議論ができる方
仕事の魅力
大量のトラフィックと複雑なマイクロサービスが交差する、事業の心臓部をSREとしてダイレクトに支えるポジションです。Kubernetesという非常に強力でありながら難解なエコシステムをAWS上で極限まで使いこなし、高度な自動化とオブザーバビリティを構築する経験は、クラウドネイティブ時代のインフラエンジニアとして圧倒的な市場価値を生み出し、息の長い実務スキルを着実に磨くことができます。
働き方
リモート環境
[フルリモート] 基本的にフルリモートで働いていただけます(※システムの安定稼働を担保するため、PagerDuty等を利用したオンコール当番が発生しますが、チーム内でローテーションを組み、特定の個人に負荷が偏らないように調整しています。また、アラートのノイズを極限まで減らし、睡眠を阻害しない仕組み作りに注力しています)。
株式会社Kaizen Tech Agent
株式会社Kaizen Tech Agentは、「人と技術をつなぐ」ことを企業理念に掲げ、日々向上していく『技術』と『人』を最適な形でむつび付け提供することで、
お客様にとって真にプラスとなる価値でありたいと考えております。
私たちはそれぞれの個性を尊重し、ほっとする和みの社風でありながら、変化する時代に対して受け身にならず、未来への挑戦心を宿しています。
事業領域は、WEBアプリ開発、業務システム開発、スマホアプリ開発、インフラ構築など幅広く展開しており、
フリーランス様に対して最適な案件をご提案させて頂いております。どんな些細な事でも結構ですので是非いつでもお気軽にご相談ください。
