📝ノート

スケーラビリティと高可用性の解説

Tony Duong

Tony Duong

3月 21, 2026 · 1

他の言語:🇫🇷
#aws#scalability#high-availability#ec2#rds#zcloudops#cloud
スケーラビリティと高可用性の解説

概要

スケーラビリティ高可用性 の短い講義 — クラウドアーキテクチャと資格試験で必須の概念。コールセンターの比喩と AWS 例で、垂直・水平スケーリングの違いと高可用性の位置づけを説明している。

スケーラビリティ vs 高可用性

スケーラビリティ は、システムが適応してより大きな負荷を扱えることを意味する。高可用性 とは異なるが関連する概念。

高可用性 は、データセンターの喪失を乗り越えるため、少なくとも2つのデータセンターまたはアベイラビリティゾーンでアプリを稼働させること。

垂直スケーラビリティ(スケールアップ)

  • 定義: インスタンスの サイズ を増やす(スケールアップ/ダウン)。
  • コールセンターの比喩: ジュニアオペレーターは5コール/分、シニアは10コール/分。スケールアップ=1人のオペレーターを強化する。
  • AWS 例: EC2 — t2.micro から t2.large へ。インスタンスは t2.nano(0.5 GB RAM、1 vCPU)から u-12tb1.metal(12.3 TB RAM、450 vCPUs)まで。
  • 使いどころ: RDS、ElastiCache など 非分散システム のDBで、インスタンスタイプを上げてスケールする。ハードウェアの上限で垂直スケールには限界がある。

水平スケーラビリティ(スケールアウト / Elasticity)

  • 定義: インスタンスやシステムの 台数 を増やす。
  • コールセンターの比喩: 1人のオペレーターが過負荷 → 2人目、3人目、6人目を雇う。オペレーターを増やしてキャパシティを伸ばす。
  • AWS 用語: スケールアウト=インスタンスを増やす;スケールイン=減らす。Auto Scaling Groups やロードバランサーと組み合わせる。
  • 前提: 分散システム であること。すべてのアプリが分散できるわけではない。
  • 典型的使用: Webアプリやモダンアプリ。EC2 などのクラウドではインスタンスを容易に増やせる。

高可用性(HA)

  • 定義: データセンター障害を乗り越えるため、少なくとも2つのデータセンターまたはアベイラビリティゾーン で同じアプリを稼働させる。
  • コールセンターの比喩: ニューヨークに3人、サンフランシスコに3人。NY が接続を失っても SF でコールを受ける。
  • パッシブ HA: 1台 active、1台 standby(例:RDS Multi AZ)。
  • アクティブ HA: 全インスタンスが能動的にトラフィックを処理(例:複数 AZ で水平スケール)。
  • AWS: Auto Scaling Group やロードバランサーで マルチ AZ を有効化。

要点

  • 垂直スケーリング=インスタンスを大きくする;DBなどの非分散システム向け。
  • 水平スケーリング=インスタンス数を増やす;Webアプリなどの分散システム向け。スケールアウト=増やす、スケールイン=減らす。
  • 高可用性=複数 AZ(またはデータセンター)で同じ負荷を扱い、障害を乗り越える。
  • HA はパッシブ(standby)かアクティブ(全ノードがトラフィックを処理)のいずれか。

Claudeによる翻訳

Tony Duong

著者: Tony Duong

デジタル日記。思考、経験、そして人生についての考え。