반응형
반응형
반응형

서버의 전력 시스템은 데이터 센터 내에서 서버 장비에 안정적이고 효율적인 전력을 공급하기 위한 핵심 인프라입니다. 아래는 서버 전력 시스템의 주요 구성 요소와 그 역할을 설명하는 다이어그램입니다.

1. 전력 공급원 (Power Source):

  • 전력망 (Utility Power): 데이터 센터는 일반적으로 지역 전력망으로부터 전력을 공급받습니다.
  • 비상 발전기 (Backup Generators): 전력망 장애 시를 대비하여 디젤 또는 가스 발전기를 통해 비상 전력을 공급합니다.

2. 무정전 전원 공급 장치 (UPS, Uninterruptible Power Supply):

  • 전력망의 순간적인 전압 강하나 정전 시에도 서버에 지속적으로 전력을 공급하기 위해 배터리를 사용합니다.

3. 전력 분배 장치 (PDU, Power Distribution Unit):

  • UPS나 발전기로부터 받은 전력을 각 서버 랙이나 장비에 분배하는 역할을 합니다.

4. 서버 랙 내부 전력 구성:

  • 랙 장착형 PDU (Rack-mounted PDU): 각 서버 랙 내에서 개별 서버에 전력을 분배합니다.
  • 전원 케이블 관리: 효율적인 전력 공급과 유지보수를 위해 케이블을 정리하고 관리합니다.


전력 변환 과정

  1. 외부 전력 공급 (100V~240V AC)
    • 데이터센터는 전력망(Utility Power) 또는 비상 발전기(Generator) 에서 AC(교류) 전력을 공급받습니다.
    • 일반적인 상용 전압은 국가마다 다르며, 미국은 110~120V AC, 한국 및 유럽은 220~240V AC입니다.
  2. UPS (무정전 전원 공급 장치)
    • 순간적인 전압 변동이나 정전이 발생했을 때 서버 가동을 유지하기 위해 UPS 배터리(DC 기반) 를 사용합니다.
  3. PDU (Power Distribution Unit)
    • UPS에서 나오는 전력을 서버 랙(Rack) 단위로 배분합니다.
    • 일부 PDU는 AC 전압을 그대로 전달하지만, 고효율 전력 분배를 위해 DC 전력으로 변환하는 경우도 있습니다.
  4. AC-DC 변환 (Power Supply Unit, PSU)
    • 서버 내부의 전원 공급 장치(PSU)AC 전력을 48V DC로 변환합니다.
    • 고출력 서버(예: AI 서버, HPC 서버)의 경우, 48V DC 전력 시스템을 직접 사용하여 전력 손실을 줄입니다.
  5. DC-DC 변환 (VRM, Voltage Regulator Module)
    • 서버 내부에서는 48V → 12V, 5V, 3.3V, 1.8V 등으로 변환하여 CPU, GPU, 메모리 등에 적절한 전압을 공급합니다.

🔹 왜 48V DC를 사용할까?

  • 전력 효율성 증가
    • 높은 전압(48V)은 같은 전력을 공급할 때 전류(Ampere) 를 줄여서 전력 손실(Watts)을 최소화할 수 있음.
  • 서버 냉각 효율 향상
    • 낮은 전류를 사용하면 전력 손실에 따른 발열이 줄어들어 냉각 비용 절감.
  • 고출력 서버(예: AI/ML 서버, 데이터센터)
    • 최신 AI 서버는 GPU가 여러 개 장착되므로 대량의 전력을 필요로 함 → 12V보다 48V 전력 공급이 더 효율적.

🔹 정리

✅ 데이터센터의 전력 공급은 일반적으로 100~240V AC → 48V DC → 12V/5V/3.3V DC로 변환됨.
✅ 48V DC를 사용하는 이유는 전력 손실을 줄이고 서버의 전력 효율을 높이기 위해서임.
✅ 최신 AI 서버와 HPC 시스템에서는 48V 전원 시스템이 점점 더 보편화되고 있음. 🚀

 


서버에서 48V DC를 직접 사용하는 이유는 높은 전력 효율을 유지하고 전력 손실을 줄이기 위해서입니다. 하지만, 대부분의 반도체는 3V 이하의 전압에서 동작하기 때문에 48V를 직접 사용하는 부품은 거의 없으며, 특정 전력 변환 장치(PSU, VRM 등)가 이를 낮은 전압으로 변환하여 사용합니다.


📌 48V 전력을 직접 사용하는 부품

서버 내에서 48V DC를 직접 사용하는 경우는 제한적이지만, 다음과 같은 전력 관련 부품이 48V를 처리합니다:

  1. 서버 전원 공급 장치 (PSU, Power Supply Unit)
    • 48V를 받아서 12V, 5V, 3.3V, 1.8V 등의 낮은 전압으로 변환.
    • 서버용 고출력 PSU는 기존의 12V 출력 대신 48V 입력을 지원하여 전력 손실을 줄임.
  2. DC-DC 컨버터 및 전압 조절 모듈 (VRM, Voltage Regulator Module)
    • CPU, GPU, 메모리 등은 1V~3V로 동작하므로, 48V를 직접 사용할 수 없음.
    • 따라서 48V → 12V → 1V~3V로 단계적으로 변환하는 DC-DC 컨버터를 사용.
    • AI 서버 및 고성능 컴퓨팅(HPC) 서버의 VRM은 직접 48V 입력을 받아 1V대 전압으로 변환하는 방식이 늘어나고 있음.
  3. 서버용 냉각 장치 (팬, 워터쿨링 시스템 등)
    • 일부 데이터센터에서는 48V 팬을 사용하여 고출력 냉각 시스템을 구성.
    • 12V 팬보다 전류를 줄일 수 있어 전력 손실이 적음.
  4. PoE (Power over Ethernet) 네트워크 장비
    • PoE를 지원하는 네트워크 장비 (예: 고출력 스위치, PoE 카메라, AP 등)
    • PoE는 최대 48V 전력 공급 가능.

📌 48V가 필요한 이유 (서버 설계 관점)

전류(A) 감소 → 전력 손실(발열) 최소화

  • 전력 공식: P = V × I
  • 같은 전력을 공급할 때 전압(V)을 높이면 전류(I)를 줄일 수 있음 → 배선에서 발생하는 저항 손실 감소
  • 예:
    • 12V 전원으로 1,200W 공급하려면 100A 필요
    • 48V 전원으로 같은 1,200W를 공급하면 25A로 충분

서버 랙 내 전력 효율성 증가

  • 기존 서버는 12V로 동작하지만, 대형 AI 서버, 데이터센터에서는 48V 전원이 점점 보편화됨.
  • Google, Facebook(메타), Microsoft 등 대형 데이터센터는 48V 기반 아키텍처로 전환 중.
  • AI 서버에서 GPU 8개를 연결하면 3,000W 이상 전력을 소비하므로, 48V 전원이 필수적.

AI 및 HPC 시스템에서 GPU VRM의 효율성 증가

  • AI 가속기(GPU, TPU, FPGA 등)는 일반적으로 0.8V~1.2V에서 동작.
  • 기존 서버에서는 12V → 1V 변환(비효율적)
  • 최신 서버에서는 48V → 1V 변환 VRM 사용 (전력 손실 최소화)

📌 48V 전력 공급이 적용된 최신 서버 사례

  • Google TPU 데이터센터: 48V 전원 아키텍처 적용
  • NVIDIA DGX 서버: GPU용 48V VRM 사용
  • Facebook(메타) 데이터센터: 48V 전력 시스템 도입
  • Open Compute Project (OCP): 데이터센터 48V 전력 공급 표준화 추진

✅ 결론

48V를 직접 사용하는 반도체는 거의 없지만, 서버의 전력 공급 및 변환 시스템(PSU, VRM, DC-DC 컨버터)이 이를 활용함.
고전류(100A 이상) 전송을 피하기 위해 서버에서 48V를 사용한 후, 필요한 부품에 맞게 낮은 전압(12V, 5V, 3.3V, 1V 등)으로 변환하여 공급.
AI 서버 및 데이터센터에서는 48V 전력이 점점 더 보편화되고 있음. 🚀


서버에서 48V를 낮은 전압(12V, 5V, 3.3V, 1V 등)으로 변환할 때 일반적으로 Buck Converter(강압형 DC-DC 컨버터)를 사용합니다. 하지만, 고성능 서버에서는 일반적인 Buck 컨버터만 사용하지 않고, 여러 가지 고효율 변환 기술이 함께 적용됩니다.


📌 일반적인 DC-DC 변환 방식

1️⃣ Buck Converter (강압형 컨버터)

  • 동작 방식: 입력 전압(예: 48V)을 낮은 전압(예: 12V, 5V, 1V)으로 변환하는 스위칭 레귤레이터.
  • 장점:
    • 효율이 높음 (90% 이상)
    • 간단한 회로 구성 가능
  • 단점:
    • 대전류(100A 이상) 변환 시 발열과 손실 증가
    • 낮은 전압(1V 이하)까지 변환할 경우 효율 저하
  • 서버 적용 예시:
    • 48V → 12V 변환 (서버용 VRM에서 많이 사용)
    • 12V → 1V 변환 (CPU/GPU용 VRM)

서버 전력 시스템에서 기본적으로 사용되지만, 고성능 AI 서버에서는 단독으로 사용하기 어려운 경우가 많음.


2️⃣ 두 단계 DC-DC 변환 (48V → 12V → 1V)

서버에서는 48V를 1V까지 직접 변환하는 것이 비효율적이기 때문에, 중간 단계(12V)를 거치는 방식이 일반적입니다.

📌 변환 과정

  1. 1차 변환: 48V → 12V (고출력 Buck Converter 사용)
    • 효율: 약 96%
  2. 2차 변환: 12V → 1V (멀티페이즈 Buck Converter 사용)
    • 효율: 약 85~90%

💡 왜 48V → 12V → 1V로 변환할까?

  • 48V → 1V를 한 번에 변환하면 전력 손실이 큼.
  • 12V 단계에서 전력 분배 및 관리가 용이.
  • 서버 보드에서 기존 12V 기반 VRM을 재활용 가능.

현재 대부분의 AI 서버 및 데이터센터에서 이 방식을 사용하고 있음.

반응형
반응형

클라우드 서버에서 AI 시스템을 구축할 때 핵심이 되는 세 가지 하드웨어 요소:

  1. 디지털 인터페이스 (Digital Interfaces)
  2. 전력 시스템 (Power Systems)
  3. 고성능 컴퓨팅 하드웨어 (HPC Hardware)

1. 디지털 인터페이스 (Digital Interfaces)

디지털 인터페이스는 서버 내부 및 서버 간 데이터 전송을 담당하는 연결 기술입니다.
AI 서버에서는 엄청난 양의 데이터를 GPU, CPU, 메모리, 스토리지, 네트워크 간에 빠르게 주고받아야 합니다.
따라서 속도대역폭이 매우 중요한 요소입니다.

📌 주요 인터페이스 종류

PCIe (PCI Express) CPU ↔ GPU 연결 가장 널리 사용되는 고속 인터페이스. 최신 버전인 PCIe 5.0/6.0은 데이터 전송 속도가 매우 빠름.
NVLink GPU ↔ GPU 연결 NVIDIA의 독자적인 인터페이스로, 여러 개의 GPU가 빠르게 데이터를 주고받을 수 있도록 설계됨.
CXL (Compute Express Link) CPU ↔ 메모리, 가속기 차세대 인터커넥트로, PCIe를 기반으로 하지만 더 빠르고 효율적인 데이터 공유 가능.
NVMe (Non-Volatile Memory Express) CPU ↔ SSD (스토리지) 기존 SATA보다 훨씬 빠른 고속 스토리지 인터페이스. AI 모델 학습 시 대규모 데이터를 빠르게 불러오는 데 필수.
InfiniBand 서버 ↔ 서버 연결 AI 클러스터 간 네트워크 연결을 위한 초고속 인터페이스.
RDMA (Remote Direct Memory Access) 서버 ↔ 서버 연결 CPU 개입 없이 메모리 데이터를 직접 주고받아 AI 시스템의 성능을 향상.

PCI Express - Wikipedia

💡 AI 시스템에서 중요한 이유

  • AI 훈련을 위해서는 GPU 간 빠른 데이터 전송이 필요 → NVLink 사용
  • 여러 서버에서 데이터를 공유할 때 지연 시간(Latency)을 최소화해야 함 → InfiniBand + RDMA 사용
  • AI 모델을 저장하고 불러오는 속도를 높이기 위해 고속 SSD 필요NVMe 사용

2. 전력 시스템 (Power Systems)

AI 서버는 일반적인 컴퓨터보다 훨씬 많은 전력을 소비합니다.
특히 AI 가속기(GPU, TPU)는 전력 소모가 크기 때문에 효율적인 전력 관리 시스템이 필수적입니다.

📌 주요 전력 시스템 구성 요소

48V 전력 공급 (Rack Power Distribution) 서버 랙 전체 전력 공급 일반적인 컴퓨터는 12V를 사용하지만, AI 서버는 전력 효율을 높이기 위해 48V DC 전원을 사용.
VRM (Voltage Regulator Module) CPU/GPU 전압 조절 CPU와 GPU가 원하는 전압(예: 1V~1.8V)을 제공하는 전력 변환 회로.
DC-DC 컨버터 전압 변환 48V 전원을 12V, 5V, 3.3V 등으로 변환하여 서버 내 부품에 공급.
BMC (Baseboard Management Controller) 전력 모니터링 서버의 전력 소비를 실시간으로 모니터링하고 최적화.
UPS (Uninterruptible Power Supply) 비상 전원 공급 정전이 발생해도 서버가 꺼지지 않도록 하는 백업 전원.

💡 AI 시스템에서 중요한 이유

  • AI 학습을 위해서는 GPU 여러 개가 동시에 작동대량의 전력 소비 발생
  • AI 서버는 24시간 가동되므로 전력 효율성 최적화 필요고효율 DC-DC 변환 사용
  • 전력 사용량을 실시간으로 관리하여 비용 절감 & 서버 안정성 유지BMC 사용

서버의 전력 시스템은 데이터 센터 내에서 서버 장비에 안정적이고 효율적인 전력을 공급하기 위한 핵심 인프라입니다. 아래는 서버 전력 시스템의 주요 구성 요소와 그 역할을 설명하는 다이어그램입니다.

1. 전력 공급원 (Power Source):

  • 전력망 (Utility Power): 데이터 센터는 일반적으로 지역 전력망으로부터 전력을 공급받습니다.
  • 비상 발전기 (Backup Generators): 전력망 장애 시를 대비하여 디젤 또는 가스 발전기를 통해 비상 전력을 공급합니다.

2. 무정전 전원 공급 장치 (UPS, Uninterruptible Power Supply):

  • 전력망의 순간적인 전압 강하나 정전 시에도 서버에 지속적으로 전력을 공급하기 위해 배터리를 사용합니다.

3. 전력 분배 장치 (PDU, Power Distribution Unit):

  • UPS나 발전기로부터 받은 전력을 각 서버 랙이나 장비에 분배하는 역할을 합니다.

4. 서버 랙 내부 전력 구성:

  • 랙 장착형 PDU (Rack-mounted PDU): 각 서버 랙 내에서 개별 서버에 전력을 분배합니다.
  • 전원 케이블 관리: 효율적인 전력 공급과 유지보수를 위해 케이블을 정리하고 관리합니다.

이러한 구성 요소들은 함께 작동하여 데이터 센터 내 서버들이 안정적으로 운영될 수 있도록 전력을 공급하고 관리합니다.


3. 고성능 컴퓨팅 하드웨어 (HPC Hardware)

고성능 컴퓨팅(HPC, High-Performance Computing)은 AI 모델 학습과 추론을 빠르게 수행할 수 있도록 설계된 하드웨어입니다.
AI 서버는 일반적인 서버보다 훨씬 강력한 연산 능력이 필요하므로 GPU, 고속 메모리, 네트워크 가속기 등이 중요합니다.

📌 주요 하드웨어 구성 요소

AI 가속기 (GPU, TPU, FPGA) AI 연산 수행 NVIDIA A100, H100, AMD MI300, Google TPU 등 고성능 가속기 사용.
고속 메모리 (HBM, DDR5, CXL Memory) 데이터 캐시 일반적인 RAM보다 훨씬 빠른 메모리 사용 (예: HBM3, DDR5).
고속 스토리지 (NVMe SSD, Optane SSD) 데이터 저장 AI 모델 훈련 데이터 로딩 속도를 극대화.
고속 네트워크 (InfiniBand, NVSwitch) 서버 간 데이터 전송 여러 서버가 동시에 학습할 때 필수.

💡 AI 시스템에서 중요한 이유

  • 대형 AI 모델 (예: ChatGPT, LLaMA) 학습에는 수천 개의 GPU 필요고속 GPU 가속기 사용
  • 훈련 데이터를 빠르게 불러와야 하므로 고속 메모리 & SSD 필수
  • 여러 개의 서버가 협력하여 학습해야 하므로 초고속 네트워크 필요

🔎 정리

요소역할AI 시스템에서의 중요성

디지털 인터페이스 데이터 전송 고속 인터커넥트 (PCIe, NVMe, InfiniBand) 필요
전력 시스템 전력 공급 대량 전력 소비 최적화 (48V DC, VRM, BMC) 필요
HPC 하드웨어 연산 가속 AI 학습을 위한 고성능 GPU, 메모리, 네트워크 필수
반응형

+ Recent posts