📝ノート
スケーラビリティと高可用性の解説
Tony Duong
3月 21, 2026 · 1 分
他の言語:🇫🇷
#aws#scalability#high-availability#ec2#rds#zcloudops#cloud
概要
スケーラビリティ と 高可用性 の短い講義 — クラウドアーキテクチャと資格試験で必須の概念。コールセンターの比喩と AWS 例で、垂直・水平スケーリングの違いと高可用性の位置づけを説明している。
スケーラビリティ vs 高可用性
スケーラビリティ は、システムが適応してより大きな負荷を扱えることを意味する。高可用性 とは異なるが関連する概念。
高可用性 は、データセンターの喪失を乗り越えるため、少なくとも2つのデータセンターまたはアベイラビリティゾーンでアプリを稼働させること。
垂直スケーラビリティ(スケールアップ)
- 定義: インスタンスの サイズ を増やす(スケールアップ/ダウン)。
- コールセンターの比喩: ジュニアオペレーターは5コール/分、シニアは10コール/分。スケールアップ=1人のオペレーターを強化する。
- AWS 例: EC2 —
t2.microからt2.largeへ。インスタンスはt2.nano(0.5 GB RAM、1 vCPU)からu-12tb1.metal(12.3 TB RAM、450 vCPUs)まで。 - 使いどころ: RDS、ElastiCache など 非分散システム のDBで、インスタンスタイプを上げてスケールする。ハードウェアの上限で垂直スケールには限界がある。
水平スケーラビリティ(スケールアウト / Elasticity)
- 定義: インスタンスやシステムの 台数 を増やす。
- コールセンターの比喩: 1人のオペレーターが過負荷 → 2人目、3人目、6人目を雇う。オペレーターを増やしてキャパシティを伸ばす。
- AWS 用語: スケールアウト=インスタンスを増やす;スケールイン=減らす。Auto Scaling Groups やロードバランサーと組み合わせる。
- 前提: 分散システム であること。すべてのアプリが分散できるわけではない。
- 典型的使用: Webアプリやモダンアプリ。EC2 などのクラウドではインスタンスを容易に増やせる。
高可用性(HA)
- 定義: データセンター障害を乗り越えるため、少なくとも2つのデータセンターまたはアベイラビリティゾーン で同じアプリを稼働させる。
- コールセンターの比喩: ニューヨークに3人、サンフランシスコに3人。NY が接続を失っても SF でコールを受ける。
- パッシブ HA: 1台 active、1台 standby(例:RDS Multi AZ)。
- アクティブ HA: 全インスタンスが能動的にトラフィックを処理(例:複数 AZ で水平スケール)。
- AWS: Auto Scaling Group やロードバランサーで マルチ AZ を有効化。
要点
- 垂直スケーリング=インスタンスを大きくする;DBなどの非分散システム向け。
- 水平スケーリング=インスタンス数を増やす;Webアプリなどの分散システム向け。スケールアウト=増やす、スケールイン=減らす。
- 高可用性=複数 AZ(またはデータセンター)で同じ負荷を扱い、障害を乗り越える。
- HA はパッシブ(standby)かアクティブ(全ノードがトラフィックを処理)のいずれか。
Claudeによる翻訳