HBM CXL 온디바이스 AI 테마를 한 덩어리로 묶어 보는 경우가 많습니다. 세 키워드는 모두 AI 반도체와 연결되지만 쓰이는 장소와 해결하는 문제가 다릅니다. HBM은 AI 가속기 가까이 붙는 초고대역폭 메모리이고, CXL은 서버 안팎에서 메모리와 장치를 더 유연하게 연결하는 인터페이스입니다. 온디바이스 AI는 스마트폰·PC·엣지 기기처럼 사용자 기기 안에서 AI를 직접 돌리는 것을 뜻합니다.
2026년 6월 기준 삼성전자와 삼성반도체 공식 자료를 보면를 보면, HBM은 데이터센터 AI 성능 경쟁의 중심에 있고, CXL은 메모리 확장과 자원 공유를 위한 기반 기술로 계속 진화 중이며, 온디바이스 AI는 NPU와 저전력 메모리 발전에 힘입어 빠르게 현실 제품으로 확장되는 중입니다. 쉽게 말하면 HBM은 ‘대형 AI 인프라의 속도’, CXL은 ‘인프라의 연결과 확장’, 온디바이스 AI는 ‘기기 안에서 AI를 돌리는 사용 경험’에 더 가깝습니다.
목차
- HBM 테마: HBM 수요가 증가하는 이유
- CXL 테마: 메모리 확장 인프라가 주목 받는 이유
- 온디바이스 AI 테마: 스마트폰·PC·엣지 기기에서 커지는 이유
- 세 테마를 함께 볼 때 체크할 포인트
- 자주 묻는 질문 FAQ
HBM 테마: HBM 수요가 증가하는 이유

HBM은 High Bandwidth Memory의 약자로, 아주 넓은 통로로 데이터를 빠르게 주고받도록 만든 적층형 메모리입니다.
일반 D램과 달리 여러 개의 메모리 다이를 수직으로 쌓고, 프로세서와 매우 가깝게 붙여 대역폭을 크게 높이는 방식이 핵심입니다. 처음 보는 분들은 이 부분이 헷갈릴 수 있는데, HBM의 포인트는 저장 용량 자체보다 ‘짧은 시간에 얼마나 많은 데이터를 공급하느냐’에 있습니다.
2026년 들어 HBM은 차세대 AI 가속기 경쟁과 더 강하게 연결되고 있습니다. 삼성전자는 2026년 5월 HBM4E 샘플 출하를 발표하면서 스택당 최대 3.6TB/s 대역폭과 HBM4 대비 20% 이상 향상된 성능을 제시했습니다.
같은 해 2월에는 HBM4 상용 출하와 양산 개시를 알리며 AI 인프라용 메모리 세대 전환을 강조했습니다. 마이크론도 HBM4 제품 페이지에서 차세대 AI 플랫폼 통합을 전면에 두고 있으며, 2026년 3월 12단 36GB HBM4의 양산 출하를 발표했고, 16단 48GB 제품도 고객 샘플링을 진행했다고 밝혔습니다
이 흐름이 뜻하는 바는 분명합니다. HBM 테마는 단순한 메모리 업종 이슈가 아니라, GPU·AI 가속기·첨단 패키징까지 이어지는 데이터센터 투자 사이클과 함께 봐야 한다는 점입니다. 다시 말해 AI 학습과 추론 수요가 커질수록 HBM 수요가 따라붙을 가능성이 큽니다. 다만 모든 메모리 업체가 같은 속도로 수혜를 보는 구조는 아니며, 실제 공급은 고객 인증과 패키징 역량 같은 조건을 함께 통과해야 한다는 점은 구분해서 봐야 합니다.
CXL 테마: 메모리 확장 인프라가 주목 받는 이유
CXL은 Compute Express Link의 약자입니다.
CPU, 가속기, 메모리 장치를 더 효율적으로 연결해 자원을 공유하고 확장하도록 돕는 표준입니다. 쉽게 말하면 HBM이 ‘칩 바로 옆의 초고속 메모리’라면, CXL은 ‘시스템 전체에서 메모리를 더 유연하게 쓰게 해주는 연결 규칙’에 가깝습니다.
2026년 2월 공개된 CXL 4.0 평가본과 2025년 11월 발표문을 보면, CXL은 더 높은 대역폭과 메모리 풀링, 패브릭 확장, RAS 기능 강화 방향으로 발전하고 있습니다. 여기서 메모리 풀링은 여러 서버나 장치가 메모리 자원을 보다 효율적으로 나눠 쓰는 개념입니다. 초보자 입장에서는 HBM과 CXL이 경쟁한다고 느낄 수 있지만, 실제로는 쓰임새가 꽤 다릅니다. HBM은 지연시간과 대역폭이 극도로 중요한 AI 가속기 근접 메모리이고, CXL은 서버 수준에서 메모리 활용률과 확장성을 높이는 기술입니다.
비교가 필요한 이유는 같은 ‘AI 메모리’로 묶이면 투자 포인트가 흐려지기 때문입니다.
| 항목 | HBM | CXL |
|---|---|---|
| 주요 역할 | AI 가속기 근처의 초고속 메모리 | 시스템 차원의 연결·확장 인터페이스 |
| 강점 | 매우 높은 대역폭 | 메모리 확장, 자원 공유, 유연성 |
| 주 활용처 | GPU, AI 가속기, HPC | 서버, 데이터센터, 메모리 풀링 환경 |
| 관계 | 성능 중심 | 확장성과 효율 중심 |
이 차이를 알면 이해가 훨씬 쉽습니다. CXL 테마는 HBM을 바로 대체하는 이야기보다, AI 데이터센터가 커질수록 메모리 구조를 어떻게 효율화할지에 대한 이야기로 읽는 편이 자연스럽습니다. 즉, HBM이 성능 병목을 줄이는 카드라면 CXL은 인프라 운영 효율을 높이는 카드에 더 가깝습니다.
온디바이스 AI 테마: 스마트폰·PC·엣지 기기에서 커지는 이유
온디바이스 AI는 데이터를 클라우드로 보내지 않고 스마트폰, PC, 자동차, 로봇 같은 기기 안에서 AI 연산을 직접 처리하는 흐름입니다. 여기에는 NPU가 중요합니다. NPU는 AI 연산에 특화된 프로세서로, CPU나 GPU보다 전력 효율을 높이면서 AI 작업을 빠르게 처리하도록 설계됩니다.
최근 흐름에서 주목할 부분은 메모리와 NPU가 함께 발전하고 있다는 점입다. 삼성 반도체는 온디바이스 AI 소개 페이지에서 생성형 AI가 이미지와 언어를 넘어 오디오·비디오까지 기기 내부에서 가능해지고 있다고 설명합니다.
또 2026년 CES 혁신상 관련 LPDDR6 소개에서는 온디바이스 AI에 최적화된 차세대 저전력 D램이라는 점을 앞세웠고, 삼성전자는 LPDDR6가 최대 10.7Gbps의 데이터 전송 속도를 지원하고, I/O 수를 확대해 전체 대역폭을 높였다고 설명했습니다. 최대 16GB 용량과 향상된 전력 관리 기능을 바탕으로 모바일·엣지·온디바이스 AI 환경을 겨냥한 제품입니다.
퀄컴도 2026년 발표에서 퍼스널 AI와 엣지 기기용 플랫폼 확장을 강조하며, 일부 제품은 최대 40 TOPS급 NPU 성능을 제시했습니다.
그래서 온디바이스 AI 테마는 단순히 AI 앱이 많아진다는 이야기만은 아닙니다. 실제로는 저전력 메모리, 모바일 AP, NPU, 소프트웨어 최적화가 한 번에 맞물려야 체감 성능이 나옵니다. 처음 접하는 사람이라면 서버용 AI와 같은 방식으로 이해하기 쉬운데, 여기서는 전기 소모와 발열, 배터리 시간, 개인정보 처리 같은 요소가 훨씬 중요합니다. 쉽게 말하면 온디바이스 AI는 ‘얼마나 큰 모델을 돌리느냐’보다 ‘사용자 손안에서 얼마나 자연스럽고 빠르게 돌아가느냐’가 더 중요한 테마입니다.
세 테마를 함께 볼 때 체크할 포인트

| 테마 | 주요 시장 | 2026년 확인 지표 | 주요 위험 |
|---|---|---|---|
| HBM | AI 가속기·데이터센터 | 양산 물량, 고객 인증, 가속기 출하, 첨단 패키징 생산능력 | 수율, 고객 의존도, 데이터센터 투자 둔화 |
| CXL | 서버·메모리 확장 인프라 | CPU 플랫폼 지원, CXL 메모리 모듈·스위치 탑재, 실제 데이터센터 도입 | 표준 발표와 매출 발생 사이의 시차 |
| 온디바이스 AI | 스마트폰·PC·자동차·로봇 | NPU 탑재 기기 출하, 실제 AI 기능 사용, AP·저전력 메모리 채택 | 발열·전력·소프트웨어 최적화 한계 |
HBM, CXL, 온디바이스 AI를 하나의 AI 반도체 흐름으로 묶어 볼 수는 있지만, 투자나 산업 해석에서는 질문을 나눠서 던지는 편이 훨씬 정확합니다.
첫째, HBM은 실제 양산과 고객 채택이 얼마나 이어지는지 봐야 합니다. 샘플 출하와 양산 개시는 분명 긍정적이지만, 최종 수요는 AI 가속기 출시와 데이터센터 투자 속도에 영향을 받습니다.
둘째, CXL은 표준 진화와 생태계 확장이 중요합니다. 표준 문서가 발표됐다고 바로 대중적인 매출이 생기는 구조는 아닙니다. CPU, 서버 플랫폼, 메모리 장치, 소프트웨어 스택이 함께 맞물려야 실제 도입이 커집니다. 그래서 CXL은 뉴스 헤드라인보다 실제 제품 탑재와 데이터센터 채택 사례를 차분히 보는 편이 맞습니다.
셋째, 온디바이스 AI는 사용자가 체감하는 기능 확산이 중요합니다. 번역, 이미지 생성, 음성 처리처럼 기기 안에서 돌아가는 기능이 늘수록 관련 반도체 가치가 커질 가능성이 높습니다. 다만 이 분야도 성능 숫자만 보면 오해가 생길 수 있습니다. 같은 TOPS라도 실제 사용자 경험은 메모리 대역폭, 발열 제어, 소프트웨어 최적화에 따라 크게 달라질 수 있기 때문입니다.
여기서 봐야 할 부분은 이렇습니다. HBM은 현재 AI 인프라 확대의 직접 수혜 영역으로 읽히고, CXL은 중장기 인프라 효율화의 축으로, 온디바이스 AI는 기기 교체 수요와 사용자 경험 변화의 축으로 읽힙니다. 세 키워드를 한 줄로 묶기보다, 어느 시장을 겨냥한 기술인지 먼저 구분하면 뉴스와 기업 발표를 훨씬 덜 헷갈리게 볼 수 있습니다.
자주 묻는 질문 FAQ
Q.HBM과 CXL은 서로 경쟁하는 기술인가요?
직접적인 대체 관계라기보다 서로 다른 문제를 해결하는 보완적 기술에 가깝습니다. HBM은 가속기 가까이에서 높은 대역폭을 제공하고, CXL은 서버 시스템 차원에서 메모리 용량과 자원 활용률을 높입니다.
Q.CXL 4.0 발표가 바로 관련 기업의 매출 증가로 이어지나요?
표준 발표만으로 즉시 매출이 발생하는 것은 아닙니다. CPU와 서버 플랫폼 지원, 메모리 모듈과 스위치 출시, 소프트웨어 호환성, 실제 데이터센터 도입이 함께 진행돼야 합니다.
Q.온디바이스 AI에서는 NPU 성능만 보면 되나요?
TOPS 수치만으로 실제 성능을 판단하기는 어렵습니다. 메모리 용량과 대역폭, 전력 소모, 발열, 모델 경량화, 운영체제와 애플리케이션 최적화를 함께 확인해야 합니다.
Q.2026년에는 세 테마 중 HBM이 가장 직접적인 수혜 분야인가요?
현재로서는 HBM이 AI 가속기와 데이터센터 투자에 가장 직접적으로 연결되는 편입니다. 다만 고객 인증, 양산 수율, 공급 물량과 가격 조건에 따라 기업별 실적 차이가 크게 나타날 수 있습니다.
2026년 6월 기준으로 보면 HBM, CXL, 온디바이스 AI는 모두 살아 있는 AI 반도체 키워드지만 같은 종류의 테마는 아닙니다. HBM은 데이터센터 AI 성능 경쟁의 최전선에 있고, CXL은 메모리와 시스템 확장의 기반을 다지는 쪽이며, 온디바이스 AI는 모바일·엣지 기기에서 실제 사용 경험을 바꾸는 방향으로 움직이고 있습니다.
처음 보는 사람이라면 세 단어가 모두 유망해 보이지만, 실제로는 적용 시장과 확인해야 할 지표가 다르다는 점이 중요합니다. HBM은 양산과 고객사 채택, CXL은 생태계와 플랫폼 도입, 온디바이스 AI는 NPU와 저전력 메모리 기반의 체감 기능 확산을 중심으로 읽으면 이해가 한결 쉬워집니다.
AI 테마주에 대한 이해도를 높여서 당신의 성공적인 투자를 응원합니다.
감사합니다.

참고 자료
- Samsung Global Newsroom — Samsung Electronics Begins Shipment of Industry-First HBM4E Samples
- Samsung Semiconductor Newsroom — The HBM4 Infographic: Key Specs and Performance Leap
- Micron — HBM4
- CXL Consortium — CXL Specification Revision 4.0 Evaluation Copy
- CXL Consortium — CXL Consortium Releases the Compute Express Link 4.0 Specification
- Samsung Semiconductor — On-device AI
- Samsung Semiconductor — LPDDR6: World’s First Next-Gen LPDDR Optimized for High-Performing On-Device AI
- Qualcomm — Personal AI | Ecosystem of You
- Qualcomm — Arduino Announces Arduino VENTUNO Q, Powered by Qualcomm Dragonwing IQ8 Series










