표시할 기사가 없습니다.
Nvidia의 네트워킹 사업부가 최근 분기에 약 110억 달러의 매출을 기록했음에도 GPU 사업에 가려 주목받지 못하고 있다. InfiniBand 및 Ethernet 네트워킹 솔루션을 포함한 이 사업부는 AI 데이터센터 인프라 붐과 함께 급성장했으며, Nvidia를 단순 칩 공급업체에서 AI 인프라 전체 솔루션 제공업체로 탈바꿈시키고 있다. GTC 2026에서는 Spectrum-X Ethernet 플랫폼과 차세대 InfiniBand 솔루션을 추가 발표하며 AI 컴퓨팅 스택 전반에 걸친 가치 창출 전략을 강화했다.
핵심 인사이트
- Nvidia 네트워킹 사업부의 분기 매출 약 110억 달러는 독립 기업으로도 테크 섹터 최상위권에 해당하는 규모이다.
- AI 클러스터 내 인터커넥트의 중요성 부각으로 네트워킹 시장이 GPU 시장과 함께 폭발적으로 성장 중이다.
- CUDA 소프트웨어 전략과 마찬가지로, 독점 프로토콜·드라이버·관리 소프트웨어가 고객 전환 비용을 높여 강력한 해자를 형성한다.
- AI 컴퓨팅 스택 전반 장악 전략은 Nvidia의 장기 수익 다각화 및 경쟁 방어력을 동시에 강화하는 핵심 포석이다.
Nothing CEO Carl Pei가 SXSW 2026에서 스마트폰 앱이 AI 에이전트로 대체될 것이라는 대담한 예측을 내놓았다. 그는 미래의 스마트폰은 개별 앱 실행이 아닌 사용자의 의도를 파악해 자율적으로 여러 서비스에 걸쳐 작업을 수행하는 지능형 중개자로 진화할 것이라고 주장했다. Apple, Google, Microsoft 모두 에이전틱 AI 역량에 대규모 투자 중인 상황에서, Nothing 역시 앱 생태계 의존도가 낮아지는 패러다임 전환에 맞춰 하드웨어 차별화 전략을 재고해야 하는 시점에 놓여 있다.
핵심 인사이트
- Carl Pei의 "AI 에이전트가 앱을 대체할 것"이라는 주장은 SXSW 2026에서 제시한 스마트폰 패러다임 전환의 핵심이다.
- Apple Siri, Google Gemini, Microsoft Copilot 등 주요 빅테크 모두 에이전틱 AI 역량에 집중 투자 중이다.
- 앱 중심 모바일 패러다임이 약화되면 하드웨어 제조사는 앱 생태계 외의 새로운 가치를 제공해야 한다.
- Nothing과 같은 스타트업에게 에이전트 AI 시대는 기존 강자와의 격차를 좁힐 새로운 기회이자 위기가 될 수 있다.
Patreon CEO Jack Conte가 SXSW 2026 연설에서 AI 기업들의 공정 사용(fair use) 주장을 "터무니없다"고 직격하며, 크리에이터의 콘텐츠가 AI 학습에 활용될 경우 반드시 보상이 이루어져야 한다고 주장했다. Conte는 AI 기업들이 주요 출판사와는 유료 라이선스 계약을 체결하면서 개인 창작자들의 콘텐츠는 무료로 활용하는 이중 잣대를 비판했다. Patreon은 20만 명 이상의 크리에이터를 보유하고 있으며, 이들 대부분은 대형 출판사와 달리 법적 대응 능력이 부족하다.
핵심 인사이트
- Patreon CEO의 "fair use 주장은 터무니없다" 발언은 플랫폼 최고위 경영자 중 가장 강력한 수위의 AI 학습 데이터 비판이다.
- AI 기업들이 출판사에는 라이선스 비용을 지불하면서 개인 창작자는 무보상 활용하는 이중 기준이 법적·윤리적 논란의 핵심이다.
- Patreon이 호스팅하는 20만 명 이상의 크리에이터는 법적 자원 부족으로 AI 학습 데이터 무단 사용에 가장 취약한 집단이다.
- 음악 출판사의 로열티 모델처럼 AI 학습 데이터 사용에 대한 보상 체계 도입이 크리에이터 이코노미의 새로운 비즈니스 모델로 부상할 수 있다.
FBI 국장 Kash Patel이 의회 증언에서 FBI가 영장 없이 상업적 위치 데이터를 구매해 미국 시민을 추적하고 있음을 공식 인정했다. 이 관행은 제3자 데이터 브로커로부터 위치 정보를 구매하는 방식으로 수정헌법 제4조의 영장 요건을 우회한다. FBI 외에도 국토안보부(DHS), 관세국경보호청(CBP), 국세청(IRS)도 유사한 방식으로 상업적 위치 데이터를 구매해온 것으로 보고되고 있으며, 상원의원 Ron Wyden 등이 이를 차단하는 입법을 추진 중이다.
핵심 인사이트
- FBI 국장의 공식 인정은 영장 없는 위치 데이터 구매를 통한 감시 관행이 제도화되어 있음을 확인하는 중요한 증거다.
- 수정헌법 제4조의 영장 요건이 데이터 브로커 구매 방식으로 실질적으로 우회되고 있어 헌법적 해석 논쟁이 불가피하다.
- FBI, DHS, CBP, IRS 등 복수의 연방기관이 동일 관행을 사용 중으로, 감시 생태계 전반에 걸친 구조적 문제임이 드러났다.
- ACLU, EFF 등 시민자유단체와 Wyden 의원의 입법 압박으로 연방 프라이버시 법안 논의가 가속화될 전망이다.
Google이 Gemini AI를 Gmail, Docs, Sheets, Slides, Meet 등 Workspace 전 제품에 걸쳐 통합하며 실무에서 실질적으로 유용한 기능들을 선보이고 있다. Gmail에서는 긴 이메일 스레드 요약, 맥락 기반 답장 초안 작성, 자연어 이메일 검색 기능이 주목받는다. Google Docs는 문서 초안 작성 및 "Help me write" 기능이 인기를 끌고 있으며, Sheets는 자연어 기반 데이터 분석과 공식 생성, Meet는 실시간 회의록 작성 및 사후 요약 기능으로 분산 팀의 생산성을 높이고 있다.
핵심 인사이트
- Gemini의 Gmail, Docs, Sheets, Slides, Meet 전 제품 통합은 Google Workspace가 AI 네이티브 생산성 플랫폼으로 전환하는 핵심 신호다.
- 자연어 기반 데이터 분석(Sheets)과 이메일 요약(Gmail)은 비전문 사용자의 업무 효율을 실질적으로 높이는 대표 사례다.
- Meet의 실시간 회의록·사후 요약 기능은 원격·분산 팀 환경에서 발생하는 정보 공유 공백을 직접 해소한다.
- Microsoft Copilot과의 직접 경쟁 구도에서 Google Workspace의 AI 통합 범위와 깊이는 기업 고객 유지·확장의 핵심 경쟁 요소가 된다.
Nikola 전기트럭 스타트업 설립자 Trevor Milton이 대통령 사면을 받은 후 AI 기반 자율 항공기 사업으로 복귀하며 10억 달러(1B 달러) 투자 유치를 추진 중이다. Milton 본인은 월스트리트저널 인터뷰에서 "자율 비행기는 Nikola보다 10배 더 어렵다"고 인정했다. 이 사업은 FAA 인증, 대중 신뢰, 복잡한 엔지니어링 등 막대한 장벽을 가지고 있으며, Archer Aviation, Joby Aviation, Wisk Aero 등 기존 에어택시·자율 항공 기업과의 경쟁도 불가피하다.
핵심 인사이트
- 증권사기로 유죄 판결을 받은 Milton의 재기 시도는 10억 달러 목표 투자 유치라는 매우 공격적인 규모로 추진되고 있다.
- Milton 스스로 "Nikola보다 10배 더 어렵다"고 인정한 자율 항공기 분야는 FAA 인증과 안전 규제가 특히 까다로운 고위험 고난도 시장이다.
- Archer Aviation, Joby Aviation, Wisk Aero 등 수년간 FAA 인증을 준비해 온 경쟁자들과의 기술·규제 격차가 매우 크다.
- AI 기반 자율 항공 시장에 대한 투자자 관심 속에 Milton의 과거 전력은 자금 조달 과정에서 핵심 리스크 요인으로 작용할 전망이다.
Discord가 연령 인증 시스템 글로벌 롤아웃을 발표했다가 사용자 반발로 연기한 사건을 계기로, 온디바이스 얼굴 나이 추정 기술의 현황이 주목받고 있다. 핵심 기술 제공사 Privately는 바이오메트릭 데이터가 기기 밖으로 전혀 나가지 않는 방식으로 연간 1,000만 건 이상의 검증을 처리하며, NIST 인증에서 평균 오차 1.94세를 기록했다. 경쟁사 Yoti는 하루 100만 건을 처리하지만 서버에 사진을 전송하는 방식으로 프라이버시 우려를 낳고 있다. k-ID의 AgeKeys 이니셔티브는 Meta(Instagram), Konami 등이 참여해 크로스 플랫폼 재사용 가능한 연령 키를 제공하며, 100만 건 검증 비용이 3,000달러에 불과해 비용 효율성도 높다. EFF는 온디바이스 방식도 근본적으로 프라이버시 침해라는 입장이다.
핵심 인사이트
- Discord 전 파트너사의 데이터 유출로 7만 명의 정부 신분증이 유출되며 연령 인증 시스템에 대한 신뢰가 급격히 하락했다.
- NIST에 제출된 얼굴 나이 추정 프로토타입 개발사 수가 2년 새 6개에서 23개로 4배 증가해 시장 성장세가 뚜렷하다.
- OpenAge Initiative의 AgeKeys는 FIDO 패스키 기반의 이중 블라인드 시스템으로, 플랫폼과 연령 인증 제공사 모두에게 사용자 신원이 노출되지 않는 구조를 제공한다.
- 미국 캘리포니아 등 각국 법제화가 가속화되면서 연령 인증 시장이 폭발적으로 성장할 것으로 예상되나, 규제 리스크와 프라이버시 우려가 동시에 증가하고 있다.
유럽의회 내부시장위원회 및 시민자유위원회가 AI 누디파이(nudify) 앱 금지를 포함한 AI법 개정안을 101대 9(기권 8표)로 가결했다. 이는 Elon Musk의 xAI가 운영하는 Grok이 실제 인물의 성적 이미지와 아동 성착취 물을 생성하는 데 이용되었음에도 사용자 책임으로 전가하며 플랫폼 차원의 안전장치 도입을 거부한 것에 대한 직접적인 대응이다. EU법이 통과되면 이르면 2026년 8월부터 동의 없이 실제 인물의 성적 이미지를 생성하는 AI 시스템은 금지되며, xAI는 Grok을 수정하거나 전 세계 연간 매출의 최대 7%에 달하는 벌금을 감수해야 한다. 미국에서는 2026년 5월 발효되는 Take It Down Act도 xAI에 수십억 달러의 벌금 위험을 부과할 수 있다.
핵심 인사이트
- EU 의회가 101대 9의 압도적 찬성으로 AI 누디파이 앱 금지 개정안을 가결하며, AI 플랫폼에 대한 직접 규제로 패러다임이 전환됐다.
- xAI는 Grok의 유해 출력에 대해 사용자를 법적으로 책임지게 하는 전략을 채택했으나, EU·미국 양측 법제화로 플랫폼 책임 회피가 어려워지고 있다.
- EU AI법 위반 시 전 세계 연간 매출의 최대 7% 벌금 부과 가능성이 있어, 치열한 AI 경쟁에서 막대한 투자를 요하는 xAI에게 심각한 재정적 리스크가 된다.
- Grok 사태는 AI 생성 딥페이크 성적 이미지 문제를 주류화하여 미국(Take It Down Act), EU(AI법 개정) 등 글로벌 규제 강화의 촉매제 역할을 했다.
트럼프 행정부의 에너지부(DOE)가 워싱턴주 Centralia 석탄 발전소에 긴급 운영 명령을 내려 폐쇄를 막았지만, 실제로 해당 발전소는 거의 가동되지 않은 것으로 나타났다. 에너지정보청(EIA) 데이터에 따르면 2026년 1월~2월에 TransAlta Centralia 석탄 발전소는 단 8메가와트시(MWh)만 발전했으며, 이는 개인 가정용 태양광 패널이 약 8개월 만에 생산할 수 있는 양에 불과하다. 도지 발전소는 천연가스로 전환하기 위해 2025년 폐쇄 예정이었으나 DOE 긴급 명령으로 운영이 지속되고 있으며, 최신 명령은 2026년 6월 중순까지 연장됐다. 민주당 하원의원 120명은 트럼프 행정부의 재생에너지 정책에 반대하는 법안을 발의했다.
핵심 인사이트
- DOE가 전력망 안정성을 명분으로 Centralia 석탄 발전소 운영을 강제했으나, 실제 발전량은 1~2월 합산 단 8MWh로 사실상 유휴 상태임이 드러났다.
- 트럼프 행정부는 Federal Power Act와 에너지 비상 선언을 활용해 경제성을 잃은 석탄 발전소 폐쇄를 조직적으로 막고 있으나, 실질적 효과에 의문이 제기되고 있다.
- 운영되지도 않는 발전소 유지 비용을 지역 전기 요금 납부자들이 부담하고 있어 경제적 불합리성이 부각되고 있다.
- 민주당은 "에너지 요금 경감법(Energy Bills Relief Act)"을 통해 DOE의 비상 선언 권한을 제한하려 하며, 공화당의 반대를 2026년 하원 선거에서 정치적으로 활용하려는 전략을 취하고 있다.
쾰른대·옥스퍼드대 공동 연구팀이 네안데르탈인이 사용한 자작나무 타르(birch tar)가 피부 감염 원인균 Staphylococcus aureus에 대한 항균 효과를 실험적으로 입증했다. 자작나무 타르는 은자작나무(Betula pendula)에서 추출한 경우 가장 강력한 항균 효과를 보였으나 균주와 농도에 따라 효과가 달랐으며, Escherichia coli에는 효과가 없었다. 네안데르탈인은 자작나무 타르를 이미 무기 접착제로 사용했음이 고고학적으로 알려져 있으며, 이번 연구는 의약용으로도 활용했을 가능성을 제시한다. 캐나다 원주민 Mi'kmaq 등 여러 민족이 수천 년간 자작나무 타르를 상처 치료에 써온 전통 지식과도 일치하며, 연구팀은 항생제 내성 위기 시대에 전통 의약 연구의 중요성을 강조했다.
핵심 인사이트
- 쾰른대·옥스퍼드대 연구팀이 자작나무 타르의 S. aureus 대상 항균 효과를 실험으로 처음 정량화했으며, 은자작나무 추출물이 가장 강력한 반응을 보였다.
- 항균 효과는 페놀 유도체, 테르펜, 테르페노이드 등 복합 화학성분에 기인하며, 수종과 개체에 따라 성분 비율이 달라 효능 차이가 발생하는 것으로 분석된다.
- 네안데르탈인이 자작나무 타르를 의약용으로 사용했다면, 이는 현생 인류와 독립적으로 약용 식물 지식을 발전시켰음을 의미하며 인지적·문화적 복잡성을 재평가하게 한다.
- 항생제 내성 증가(MRSA 포함) 위기 속에서 자작나무 타르 성분의 정밀 분석은 새로운 천연 항균 물질 발굴을 위한 현대 의학적 연구 가치가 있다.
Cloudflare가 이탈리아 저작권 규제 당국 AGCOM으로부터 부과받은 1,420만 유로(약 1,640만 달러)의 벌금에 대해 2026년 3월 8일 항소를 제기했다. 이 벌금은 Cloudflare가 불법 스트리밍 차단을 위한 이탈리아의 Piracy Shield 제도에 등록하고 30분 내 DNS 차단 명령을 이행하는 것을 거부했기 때문에 부과됐다. Cloudflare는 벌금이 이탈리아 매출이 아닌 전 세계 매출 기준으로 산정되어 법적 상한액(약 14만 유로)의 약 100배에 달한다고 주장한다. 또한 사법 감독 없이 운영되는 Piracy Shield가 2025년 구글 드라이브를 포함해 수백 개의 합법 사이트를 잘못 차단하는 등의 문제를 야기했다며, EU 디지털서비스법(DSA) 위반이라고 주장하고 있다.
핵심 인사이트
- AGCOM이 Cloudflare의 전 세계 매출 기준으로 1,420만 유로 벌금을 부과했으나, Cloudflare는 법적 상한인 이탈리아 매출의 2%인 14만 유로로 제한되어야 한다고 반박했다.
- Piracy Shield는 사법 감독 없이 Serie A 등 주요 미디어 기업이 30분 내 차단 명령을 내릴 수 있는 구조로, 2025년 10월 구글 드라이브를 포함해 합법 사이트 수백 개를 잘못 차단한 전례가 있다.
- Cloudflare는 DNS 필터 설치가 이탈리아뿐 아니라 전 세계적 검열로 이어진다는 기술적 주장을 내세우며, 30분 내 이행 요건이 인터넷 핵심 구조를 훼손한다고 주장하고 있다.
- 유럽집행위원회도 2025년 6월 Piracy Shield의 감독 부재에 우려를 표명했으며, 항소 결과에 따라 EU 차원의 저작권 집행 제도에 대한 선례가 될 수 있다.
성균관대학교 권석준 교수는 2030년까지 "중국판 ASML"이 등장할 수 있다고 전망했다. 중국은 미국의 EUV 수출 규제를 우회하기 위해 국산 DUV 리소그래피 장비 개발을 가속하고 있으며, Huawei는 광저우 동관 시설에서 EUV 리소그래피 부품을 테스트 중이다. 2025년 Q2 시험 생산 개시, 2026년 본격 양산을 목표로 하며, 레이저 방전 유도 플라즈마(13.5nm 파장) 방식을 채택해 ASML 대비 저비용 접근을 추구한다. 한편 Hua Hong 그룹 산하 Huali Microelectronics는 상하이 팹에서 7nm 생산을 준비 중이며, 국산 장비 공급사 SiCarrier를 활용해 2026년 말까지 월 수천 장 웨이퍼 생산을 목표로 한다. 이는 SMIC에 이어 중국의 두 번째 7nm 파운드리 부상을 의미한다.
핵심 인사이트
- 중국이 EUV 우회 전략으로 레이저 방전 유도 플라즈마 방식 EUV 장비를 자체 개발 중이며 2026년 양산을 목표로 함
- Huali(Hua Hong 계열)의 7nm 진입 시 SMIC 독점 구도가 깨지며 중국 파운드리 경쟁 구도가 변화함
- 중국은 10nm 이상 성숙 공정에서 서방과 거의 동등한 수준에 도달했으며 소재·부품·장비 전반 확장 중
- 삼성·SK하이닉스 등 한국 기업 입장에서 중국의 고급 공정 자립은 장기적 시장 경쟁 위협 요소로 작용 가능
NVIDIA GTC 2026에서 차세대 데이터센터 플랫폼 Vera Rubin 및 Feynman 아키텍처를 둘러싼 공급망 구조가 구체화됐다. Samsung은 HBM4 공급자에서 NVIDIA LPU(언어 처리 유닛) 파운드리 역할까지 확대하며 NVIDIA 생태계 내 입지를 강화했다. Micron은 HBM4 공급 파트너에서 배제됐다는 루머를 불식하며 Vera Rubin용 HBM4가 현재 대량 양산 단계에 있음을 공식 확인했다. 또한 NVIDIA는 Rosa(노벨상 수상 물리학자 Rosalyn Sussman의 이름을 딴) 아키텍처 기반의 차세대 데이터센터 CPU를 발표했다. Intel, TSMC 등 주요 파트너사의 역할도 재확인되며 NVIDIA 중심의 AI 반도체 공급망 결집이 가속화되고 있다.
핵심 인사이트
- Samsung이 HBM4 공급 + NVIDIA LPU 파운드리 이중 역할로 NVIDIA Vera Rubin 플랫폼의 핵심 파트너로 자리매김, 반도체 사업 다각화 성과 확인
- Micron이 Vera Rubin HBM4 대량 양산 돌입을 공식화하면서 SK하이닉스 독주 체제에 균열, HBM4 시장 경쟁 구도 재편 가속화
- NVIDIA의 Rosa CPU 아키텍처 공개는 GPU뿐 아니라 AI 인프라 전체를 NVIDIA 플랫폼으로 통합하려는 전략의 연장선
- Vera Rubin→Feynman으로 이어지는 NVIDIA 로드맵이 공급망 파트너 전체에 장기적 대규모 수주 기회를 제공하며 투자 가시성 제고
Samsung Electronics가 2025년 12월 12일 출시한 Galaxy Z Tri-Fold(세 번 접히는 폴더블폰)의 국내 판매를 출시 약 3개월 만인 2026년 3월 17일부로 종료하기로 결정했다. 미국 시장은 기존 재고 소진 시까지 판매를 유지한다. 동아일보 보도에 따르면 메모리 원가 급등이 생산 원가 상승의 주요 원인으로 지목됐다. 메모리 가격 상승으로 스마트폰 BOM에서 메모리 비중이 높아진 상황에서, 고가 폴더블 기기에서조차 마진 확보가 어려워졌음을 시사한다. 이번 조기 단종 결정은 삼성 모바일 사업부 전반의 수익성 위기와 맞닿아 있다.
핵심 인사이트
- Galaxy Z Tri-Fold 출시 3개월 만의 국내 판매 종료는 메모리 원가 급등이 프리미엄 폴더블 제품 마진도 잠식할 정도로 심각함을 입증
- 메모리 가격 상승이 스마트폰 BOM 원가 구조를 근본적으로 변화시키며, 고가 신제품 전략마저 흔드는 구조적 압박으로 작용
- Samsung MX(모바일 경험) 사업부가 폴더블·플래그십 라인업에서도 수익성을 확보하지 못하는 상황은 반도체 부문과의 극명한 내부 온도 차를 심화
- 삼성 반도체 부문 입장에서는 내부 고객(MX 사업부) 수요 위축 가능성이 생기며, HBM·모바일 DRAM 수요 전망에 미묘한 변수 추가
Meta가 AI 인프라 투자 비용 상쇄를 위해 전체 인력의 20% 이상을 감축하는 대규모 구조조정을 검토 중이다. 이는 2022~2023년 "효율의 해" 이후 최대 규모로, Meta는 약 7만 9천 명을 고용 중이다. Meta는 2028년까지 데이터센터 구축에 6,000억 달러를 투자할 계획이며, AI 에이전트 전용 소셜 플랫폼 Moltbook 인수와 중국 AI 스타트업 Manus 인수(최소 20억 달러)도 진행 중이다. Amazon도 약 1만 6천 명(전체의 10%) 감축 계획을 발표했다. 반도체 장비 기업 ASML은 기술·IT 부문 관리직 1,700명을 감축할 예정으로, 네덜란드 1,400명, 미국 300명이 대상이며 전체 인력의 약 4%에 해당한다. ASML은 동시에 Eindhoven 인근에 2만 명 규모의 제2 캠퍼스를 신설하는 확장도 병행한다.
핵심 인사이트
- Meta의 20% 감원은 AI 인프라에 6,000억 달러 투자 계획과 맞물린 비용 구조 재편 전략임
- ASML의 1,700명 감원은 관리직 중심으로, 확장 계획과 동시에 진행되는 효율화 구조조정임
- Oracle도 21억 달러 규모 구조조정 충당금을 적립하는 등 AI 기반 인력 대체가 빅테크 전반으로 확산 중
- ASML의 인력 감축 및 재편은 반도체 장비 납기·지원 품질에 영향을 줄 수 있어 한국 고객사 주의 필요
Samsung Electronics가 기존의 분기·연간 단위 메모리 계약 방식을 3~5년의 장기 계약으로 전환하는 방안을 검토 중이다. Co-CEO 전영현 사장이 3월 18일 주주총회에서 이 같은 방향성을 밝혔다. AI 메모리 수요가 2026년까지 지속 증가할 것으로 전망되는 가운데, 안정적 공급 확보와 공급 부족 우려 해소가 주된 목적이다. 한편 1월에는 Samsung과 SK하이닉스 모두 Microsoft·Google 등 주요 고객에게 1분기 서버 DRAM 가격을 전 분기 대비 60~70% 인상 제안했으나, 고객들은 2~3년 장기 계약을 거부하고 분기 계약을 고수했다. SK그룹 최태원 회장은 메모리 가격 안정화를 위한 구체적 조치 출시를 시사했으며, 반도체 웨이퍼 공급 부족이 2030년까지 20% 이상 격차로 지속될 것이라 전망했다. Micron도 HBM4 및 장기 계약 가시성 개선으로 분기 HBM 매출 약 15억 달러 전망이 제기된다.
핵심 인사이트
- Samsung의 3~5년 장기 계약 전환 검토는 AI 수요 급증기를 활용해 안정적 현금흐름을 확보하려는 전략적 전환이며, 업계 전반의 수요 예측 불확실성을 줄이는 효과가 있음
- 장기 계약 보편화 시 메모리 가격의 경기 순환적 급락 완충 효과가 약화되어, 다운턴 시 수요 기업들의 비용 절감 여지가 축소될 수 있음
- Samsung이 2028년 메모리 시장 반전 리스크를 선제 평가 중이라는 점은 현재 AI 붐의 사이클 정점 인식과 과잉 생산 방지를 위한 공급 규율 강화를 시사함
- Micron의 분기 HBM 매출 15억 달러 전망은 SK하이닉스 중심의 HBM 시장 경쟁 구도를 흔들 변수로, 한국 기업들의 HBM 시장 점유율 방어 전략이 더욱 중요해짐
Samsung Electronics 메모리 개발 총괄 황상준 부사장이 NVIDIA GTC에서 차세대 HBM 로드맵을 공개했다. HBM5의 베이스 다이는 HBM4·HBM4E의 4nm 대비 Samsung Foundry의 2nm 공정을 채택하고, HBM5E의 코어 스택 메모리로는 현재 HBM4·HBM4E에 사용 중인 1c DRAM보다 진화한 1d DRAM을 적용할 계획이다. 1d DRAM은 현재 개발 단계이나 강력한 성능·수율을 확보했다고 밝혔다. Samsung은 올해 HBM4 생산량이 전년 대비 3배 이상 증가를 목표로 하며, HBM4가 전체 HBM 생산의 50% 이상을 차지하도록 계획하고 있다. 또한 Samsung Foundry의 평택 캠퍼스에서 NVIDIA CEO 젠슨 황이 기여를 인정한 추론 전용 칩 Groq 3(LPU)를 생산 중이며, 올해 3Q 후반~4Q 초반 양산 목표로 수주량이 기대치를 초과했다. Groq 3 칩은 700mm² 초과 대형 다이로 웨이퍼당 약 64개만 생산 가능하며 SRAM이 70~80% 구성된다.
핵심 인사이트
- HBM5 베이스 다이에 2nm 공정 적용은 삼성 파운드리가 메모리-파운드리 시너지를 극대화하는 핵심 전략으로, 내부 수직 계열화의 경쟁 우위가 외부 파운드리 의존 경쟁사 대비 뚜렷해짐
- 올해 HBM4 생산량 3배 이상 증대 계획은 SK하이닉스가 선점한 HBM 시장에서 Samsung의 본격 점유율 회복 신호로, 2026~2027년 HBM4 시장 경쟁이 본격화될 전망
- Groq 3 LPU 생산으로 Samsung은 HBM 공급에서 LPU 제조로 역할을 확장, NVIDIA AI 가속기 공급망 내 수직 통합도를 높여 단순 부품 공급사에서 핵심 플랫폼 파트너로 격상
- 1d DRAM 기반 HBM5E는 비용 상승을 수반하지만 고성능 요구를 충족하기 위한 필수 경로로, 차세대 AI 가속기 플랫폼(Feynman 이후)에서의 선점 포지셔닝이 중장기 수익성을 좌우할 핵심 변수
NVIDIA GTC에서 2027년 출시 예정인 Rubin Ultra와 2028년 Feynman 아키텍처 계획이 공개되면서, TSMC의 SoIC(System on Integrated Chips) 기술 수요가 급증할 것으로 전망된다. SoIC는 구리-구리 하이브리드 본딩으로 다이를 수직 적층해 기존 2.5D 패키징인 CoWoS 대비 고대역폭·저전력을 구현하는 차세대 패키징 기술이다. Rubin Ultra는 7개 칩과 5개 랙 구성을 가지며, Feynman은 커스텀 HBM과 고밀도 칩렛 설계를 채택할 예정이다. TSMC는 2026년까지 월 SoIC 캐파를 1만~1만5천 웨이퍼로 확충하고, 2027년 이후 NVIDIA·Broadcom·AMD 수요를 지원하기 위해 추가 확장을 계획한다. SoIC 캐파 1만 웨이퍼당 투자 비용은 약 68~70억 달러로 CoWoS 대비 현저히 높다. 한편 Apple도 M5 Pro·Max에 TSMC SoIC-MH 2.5D 패키징을 최초 적용하며 칩렛 설계로 전환했다.
핵심 인사이트
- TSMC SoIC 캐파를 2026년 월 1만~1만5천 웨이퍼로 확충하는 계획은 AI 가속기 패키징 병목이 SoIC로 이동함을 의미하며, 웨이퍼당 68~70억 달러의 막대한 투자 규모가 진입 장벽이 됨
- Feynman 아키텍처부터 SoIC 채택이 본격화되면 Besi·Applied Materials·TEL 등 프론트엔드 장비·하이브리드 본딩 공급사가 직접적 수혜를 입는 반면, 한국의 관련 장비·소재 기업들은 공급망 진입 기회를 탐색해야 함
- Apple의 M5 시리즈가 SoIC-MH 패키징을 최초 채택한 것은 SoIC가 AI 서버를 넘어 모바일·PC 플래그십으로 확산되는 신호로, TSMC SoIC 생태계의 고객 다변화를 가속화함
- CoWoS 대비 단위 투자 비용이 압도적으로 높은 SoIC는 TSMC의 수익성 개선에 기여하며, NVIDIA·Broadcom·AMD 세 거인이 동시에 수요를 창출하는 구조는 TSMC의 패키징 사업 협상력을 크게 높임
NVIDIA가 중국 수출 규제를 우회하기 위해 중국 시장용 Groq 기반 AI 칩(LPU)을 이르면 2026년 5월 출시할 준비를 하고 있다. 이 중국판 칩은 성능 저하 버전이 아닌 다양한 시스템 구성에 적응 가능한 형태로 개발 중이다. NVIDIA CEO 젠슨 황은 GTC에서 H200 칩 생산을 재개했다고 밝혔으며, 트럼프 행정부로부터 수출 허가를 취득하고 중국 고객들로부터 구매 주문을 확보한 상태다. 2024년 초 수출 규제로 NVIDIA는 55억 달러 규모의 손실을 기록했으며, 중국은 과거 NVIDIA 데이터센터 매출의 최소 5분의 1을 차지했다. 트럼프 행정부는 2024년 12월 H200 수출 재허용을 결정했으며, 미국이 매출의 25%를 가져가는 구조다. NVIDIA의 Blackwell·Rubin AI 칩 2027년까지 1조 달러 이상 매출 전망에는 중국 판매분이 포함되지 않아 중국 시장 재진출이 추가적인 상방 요인이 된다.
핵심 인사이트
- NVIDIA의 중국 시장 복귀는 H200 수출 재허가와 Groq LPU 중국판 출시 이중 채널로 진행되며, 2027년까지 1조 달러 매출 전망에 미포함된 중국 수요가 NVIDIA의 실질 상방 잠재력이 됨
- 중국 내 Baidu Kunlunxin·Huawei·Cambricon 등 자체 추론 칩 진영이 성장 중인 상황에서 NVIDIA의 신속한 중국판 LPU 공급은 중국 AI 칩 시장의 자립 흐름을 억제하는 경쟁 대응 조치임
- H200 수출 재개 구조(미국 25% 매출 공유)는 지정학적 리스크와 수익성 사이의 절충점으로, 향후 중국 AI 반도체 수출 정책의 선례로 작용할 가능성이 있음
- Samsung 4nm 기반의 Groq 3 LPU가 중국 시장 진출의 핵심 제품이 됨에 따라, Samsung Foundry의 NVIDIA 공급망 내 전략적 위상이 더욱 높아지고 관련 수주 증가 기대
Co-packaged Optics(CPO) 기술이 AI 데이터센터의 구조를 근본적으로 변화시키고 있다. 기존 구리 배선 대신 칩 패키지 위에 광학 연결을 직접 통합함으로써, 신호 전송 거리를 PCB 기준 15~30cm에서 수 밀리미터 수준으로 대폭 단축한다. 개별 칩이 최대 35킬로와트를 소모하는 고발열 환경에서 열 관리가 핵심 과제로 부상했으며, Ring resonator는 파장 안정성 유지를 위해 소자당 1~10밀리와트를 상시 소모한다. CPO 구현을 위해 Photonic Integrated Circuit(PIC)과 Electronic Integrated Circuit(EIC)을 결합한 이종 칩렛 통합이 필수적이며, Cadence, Keysight, Siemens, Synopsys 등 주요 EDA 기업들이 CPO 전용 설계 도구를 출시하고 있다.
핵심 인사이트
- CPO는 AI 데이터센터의 전력·대역폭 병목을 광학 연결로 해소하는 핵심 기술로 상용화 단계에 진입 중이다.
- 개별 칩 최대 35kW 발열 환경에서 광학 소자 온도 안정성 확보가 CPO 양산의 최대 기술 관문이다.
- CPO 구현에는 전기·열·광학·기계적 특성을 동시에 고려하는 멀티 피직스 설계 방법론이 필수적이다.
- Cadence·Synopsys 등 EDA 기업들의 CPO 전용 툴 투자가 확대되어 관련 EDA 시장 성장이 가속화될 전망이다.
Backside Power Delivery Network(BSPDN)은 웨이퍼 후면에서 트랜지스터로 직접 전력을 공급하는 아키텍처로, 전압 강하를 최대 30% 감소시키고 최대 주파수를 2~6% 향상시키며 코어 면적을 5~15% 줄인다. Intel은 이미 18A 공정에서 PowerVia를 통해 마스크 수와 스텝 수를 40% 이상 줄였으며, Samsung은 2nm(SF2), TSMC는 A16 노드에 도입 예정이다. 그러나 BSPDN은 새로운 제조 과제를 동반한다. 웨이퍼 박막화 후 warpage로 인한 정밀 정렬 문제가 있으며, imec 시뮬레이션에 따르면 열 페널티가 최대 14°C에 달해 설계 단계의 열 관리가 필수적이다. AI 가속기, 게이밍 칩 등 고전력 워크로드에 특히 중요한 기술이다.
핵심 인사이트
- BSPDN은 셀 밀도 5~10% 향상, 주파수 2~6% 증가, 코어 면적 15% 절감 등 성능·면적 동시 개선 효과를 제공한다.
- Intel 18A(양산), Samsung SF2(2nm), TSMC A16(16Å) 순으로 3대 파운드리 모두 2~3년 내 BSPDN 도입이 확정됐다.
- 열 페널티(최대 14°C) 및 나노TSV 정렬 문제 해결을 위해 새로운 EDA 툴과 공정 장비 투자가 필수적으로 요구된다.
- AI 가속기와 HPC 칩 수요 증가가 BSPDN 기술 상용화를 가속시키며, Synopsys·IBM 등 IP 공급사에 새로운 사업 기회를 창출한다.
반도체 첨단 노드에서 '오염'의 정의가 입자 중심에서 원자 수준의 표면 화학 문제로 근본적으로 변화하고 있다. 7nm 이하 노드에서 잔류 화학 물질, 계면 상태, 엘라스토머 씰에서의 산소 분자 투과가 수율 손실을 일으키며, 수율 영향이 오염 발생 훨씬 후에 전기적 이상으로만 나타난다. Lam Research, Synopsys, Greene Tweed 전문가들은 앙스트롬 시대에 '청결'은 이진 개념이 아닌 공정 의존적·맥락적 개념임을 강조한다.
핵심 인사이트
- 앙스트롬 시대에 오염 = 가시 잔류물이 아닌 표면 화학·인터페이스 상태—ALD 공정의 원자 수준 감수성
- 엘라스토머 씰에서 대기 산소가 분자 투과로 유입되어 ALD 박막 품질 변화—장비 내 보이지 않는 오염원
- 오염 발생 후 수율 손실까지 다단계 공정을 거쳐 지연 발현—실시간 감지·분류 체계 구축이 시급
- 분광 분석·잔류물 특성화·인라인 전기 계측으로 전통 광학 검사를 보완하는 새로운 계측 생태계 필요
AI를 반도체 설계 워크플로우에 통합하면서 기업들은 데이터 관리 방식을 근본적으로 재편해야 하는 상황에 직면했다. EDA 툴이 사용하는 독점적 언어와 포맷은 표준 AI 모델이 처리하기 어려우며, 엔지니어링 데이터가 SharePoint·Confluence 등 여러 시스템에 분산되어 AI 출력의 환각(hallucination) 문제를 유발한다. ChipAgents CEO William Wang은 "병목은 모델 품질이 아니라 데이터 품질"이라고 강조했다. 구현 전략으로는 ①RAG 기반 코파일럿, ②맞춤형 파인튜닝 파이프라인, ③중앙화된 데이터 레이크의 세 가지 접근법이 제시된다. Fraunhofer IIS/EAS의 Martin Neumann-Kipping은 방대한 데이터 축적보다 잘 묘사되고 연결된 '정보화된 데이터(informed data)'의 중요성을 역설했다. EDA 데이터 사서(data librarian)라는 새로운 직군도 부상하고 있다.
핵심 인사이트
- EDA 독점 포맷과 분산된 엔지니어링 데이터가 반도체 AI 도입의 핵심 기술 장벽으로, 데이터 통합 인프라 투자가 선행 과제다.
- "데이터 품질이 모델 품질보다 중요하다"는 원칙 하에 RAG 파이프라인·파인튜닝·데이터 레이크 구축의 세 가지 전략이 병행 추진되고 있다.
- 조직 내 사일로 해소와 시맨틱 기술·지식 그래프 기반 공통 데이터 언어 확립이 반도체 AI 애플리케이션 실질적 잠재력 실현의 전제 조건이다.
- EDA 데이터 사서라는 신직군 부상은 반도체 설계에서 데이터 거버넌스가 독립적 엔지니어링 분야로 진화하고 있음을 시사한다.
엣지 AI 구현은 클라우드 기반 AI를 단순히 소형화하는 것이 아니라 전력 소비를 최우선 설계 변수로 삼는 근본적 아키텍처 재설계를 요구한다. 배터리와 제한된 폼팩터로 인해 모든 밀리와트가 소자 생존과 수명에 직결된다. 특히 외부 메모리에서 1바이트를 로드하는 것보다 다수의 바이트를 온칩에서 재연산하는 것이 더 전력 효율적이라는 역설적 원칙이 강조되어, 온칩 SRAM 활용과 외부 메모리 접근 최소화가 아키텍처의 핵심이 된다. 컴퓨팅 아키텍처, 메모리 계층, 신경망 모델을 설계 초기부터 동시에 최적화하는 하드웨어-소프트웨어-모델 공동 설계가 필수적이다. 자동차·스마트폰 등 고성능 엣지 애플리케이션은 전용 설계가 필요하며, 범용 소비자 기기는 보다 유연한 접근이 가능하다.
핵심 인사이트
- 엣지 AI에서 외부 메모리 접근 1바이트보다 온칩 재연산이 더 효율적이라는 원칙이 메모리 아키텍처 설계를 재정의하고 있다.
- 전력·열 예산 내에서 컴퓨팅·메모리·모델을 동시 최적화하는 공동 설계 역량이 엣지 AI 반도체의 핵심 경쟁력이다.
- 자동차·스마트폰 등 고성능 엣지와 범용 소비자 기기 간 요구사항 격차가 커져 전용 칩 수요가 세분화될 전망이다.
- 가상의 미래 AI 모델을 위한 과잉 설계보다 현재 전력·열 예산 내 유연성 확보가 엣지 AI 칩 투자의 실질적 기준이 되고 있다.
AI·HPC 워크로드를 위한 데이터센터 확장 전략이 기존 Scale-Up, Scale-Out에 이어 Scale-Across라는 세 번째 패러다임으로 확장되고 있다. Scale-Up은 단일 랙 내에서 모든 프로세서가 동일 메모리 공간에 접근하는 메모리 시맨틱 기반으로 최소 지연 시간을 추구하며 구리 인터커넥트가 적합하다. Scale-Out은 랙을 넘어 데이터센터 내에서 RDMA 시맨틱과 동적 자원 할당을 활용하며, Nvidia의 InfiniBand 대신 Ethernet이 주류로 자리잡았다. Scale-Across는 지리적으로 분산된 복수 데이터센터를 연결하는 최신 카테고리로, Scale-Out의 네트워킹 기반을 공유하되 장거리에 맞춘 혼잡 제어 알고리즘을 적용한다. 중국의 GPU 성능 제한, 일본의 전력 제약 등 지역별 요인으로 인해 카테고리 간 경계가 점차 흐려지는 추세다.
핵심 인사이트
- Scale-Across의 등장은 AI 인프라가 단일 데이터센터를 넘어 지리적 분산 클러스터로 진화함을 의미한다.
- Scale-Out에서 Nvidia InfiniBand 대신 Ethernet이 주류가 된 것은 AI 네트워킹 생태계의 중요한 전환점이다.
- 중국 GPU 제재·일본 전력 규제 등 지역 변수가 데이터센터 확장 전략을 재정의하는 새로운 요인으로 부상했다.
- 세 가지 확장 전략의 경계가 모호해지면서 유연한 인터커넥트·네트워킹 솔루션 수요가 증가할 전망이다.
첨단 노드와 멀티칩 패키지에서 수율 손실의 주요 원인이 육안 결함에서 재료 내 화학적 변동으로 이동하고 있다. 박막 조성 변화, 계면 결합 불규칙성, 공정 잔류물, 미세한 화학 구조 변화 등이 기존 검사 장비로는 보이지 않는 형태로 소자 특성에 영향을 미친다. ASM CEO Hichem M'Saad는 두꺼운 막에서는 계면이 무의미하지만, 5Å 두께의 ALD 막에서는 계면이 결정적 요소가 된다고 설명했다. 이러한 화학적 변동은 임계 전압 이동, 캐리어 이동도 감소, 전기이동(electromigration), 바이어스 온도 불안정(BTI) 등의 전기적 이상으로 나타난다. 해결책으로는 재료 표면 분자 특성 분석, 회로 레벨 전기적 모니터링, 웨이퍼 스케일 AI 기반 상관관계 분석의 3단계 접근이 제시됐으며, proteanTecs의 Nir Sever는 "고전적 결함 감지가 '고장 여부'를 답한다면, 딥 텔레메트리는 '불안정해지고 있는지, 왜인지'를 답한다"고 설명했다.
핵심 인사이트
- 첨단 노드 수율 관리가 육안 결함 검사에서 분자·원자 레벨 화학 변동 감지로 전환, 2026년 이후 신규 계측 장비 시장 형성
- 이종 통합(Heterogeneous Integration) 확산으로 폴리머 유전체·접합 금속·RDL 등 복합 소재 계면 관리가 수율의 핵심 변수로 부상
- BTI·electromigration 등 신뢰성 메커니즘이 화학 변동에서 촉발됨을 인식, EDA 기반 공정-신뢰성 공동 최적화 도구 수요 증가
- 분자 계측+전기 모니터링+AI 웨이퍼 분석의 3단계 솔루션 통합 플랫폼이 팹 수율 관리 시장의 새로운 투자 축
반도체 팹에서 장비 간 일치도(Tool-to-Tool Matching, TTTM)를 유지하는 것이 첨단 노드로 갈수록 급격히 어려워지고 있다. 웨이퍼 한 장은 약 600~800개 공정 단계를 3개월에 걸쳐 거치며, 각 단계에서 모든 장비가 일관된 결과를 내야 한다. Onto Innovation의 PeiFen Teh 이사는 최신 기술 노드가 멀티패터닝, High-k/Metal Gate, 복잡한 에치 화학, 선택적 증착, 매립형 전원 레일 등 수백 개의 긴밀히 연결된 공정 단계를 요구하며, 미세한 공정 불완전성이 복합 효과로 수율에 영향을 준다고 설명했다. 머신러닝(ML) 기술이 장비 '핑거프린팅'에 도입되어 고해상도 파라메트릭 데이터, 파형 서명, 타이밍 측정값을 분석해 복잡한 비선형 장비 편차를 모델링하고 있다. Fractilia CTO Chris Mack은 계측에서 정확도보다 정밀도가 더 중요한 실질적 기준임을 지적하며, 업계가 NIST 추적 가능 기준보다 장비 간 통계적 정렬에 집중하고 있음을 밝혔다.
핵심 인사이트
- 공정 단계 600~800개, 3개월 제조 사이클에서 TTTM 요구가 강화되어 ML 기반 장비 핑거프린팅 기술이 2026년 핵심 솔루션으로 부상
- 첨단 패키징(Advanced Packaging) 확산으로 더 많은 다이가 결합되면서 장비 재현성 요구 수준이 단칩 대비 급격히 높아짐
- Teradyne·Advantest·Onto Innovation 등이 ML 모델 기반 비선형 장비 편차 보정 기술에 집중 투자, 테스트 장비 시장의 소프트웨어화 가속
- 팹 레벨 계측 데이터와 기능 테스트 결과를 통합한 장치 수준 데이터 요구가 증가하여 EDA·MES 통합 플랫폼 수요 확대
Microsoft가 AI 조직을 재편하며 Mustafa Suleyman CEO를 Copilot 책임에서 분리해 초지능(Superintelligence) 연구 전담으로 전환했다. Copilot 총괄은 Jacob Andreou Corporate VP가 맡아 Satya Nadella에게 직접 보고하는 체계로 변경됐다. Suleyman은 2024년 Microsoft AI CEO로 임명된 뒤 Copilot 사업을 이끌었으나 시장에서 기대만큼 성과를 거두지 못했다는 평가가 나온다. 이번 개편으로 Copilot Leadership Team이 신설되고 Charles Lamanna, Perry Clarke, Ryan Roslansky가 합류했다. Suleyman은 "향후 5년간 Microsoft를 위한 세계적 수준의 모델 제공"에 집중한다고 밝혔으며, 초지능 팀은 2025년 11월에 이미 발표된 바 있다.
핵심 인사이트
- Suleyman의 Copilot → 초지능 전환은 AI 투자 수익 증명 부담에서 벗어나기 위한 조직적 안배로 해석 가능하다.
- Copilot의 시장 침투율 저조가 이번 조직 개편의 핵심 원인으로, Microsoft의 AI 전략 전환점을 시사한다.
- Andreou의 Nadella 직보 구조는 Copilot 사업에 최고경영진의 직접 통제를 강화하는 의미를 갖는다.
- Microsoft는 Copilot 추진과 별개로 자체 AI 모델 개발을 병행 중이며, OpenAI 의존도 축소 전략을 지속하고 있다.
Linux Foundation이 AI가 자동 생성한 저품질 보안 버그 리포트로 인해 오픈소스 메인테이너들이 과부하에 시달리는 문제를 해결하기 위한 이니셔티브를 출범했다. Anthropic, AWS, GitHub, Google, Microsoft, OpenAI 등 6개 기업이 총 1,250만 달러의 보조금을 공동 출연했다. Alpha-Omega와 OpenSSF(오픈소스 보안 재단)가 공동으로 운영하며, 메인테이너들이 AI 생성 보고서를 효율적으로 분류·처리할 수 있는 도구와 지원책을 개발한다. Python Software Foundation은 2024년 말, cURL 메인테이너는 AI 생성 기여 폭증을 이유로 버그 바운티 프로그램을 종료한 사례가 있어 문제의 심각성이 이미 업계에서 인식되고 있었다.
핵심 인사이트
- AI 도구를 제공한 기업들이 그로 인해 발생한 오픈소스 생태계 피해를 자금 지원으로 보완하는 구조적 역설이 발생하고 있다.
- 1,250만 달러 규모 투자는 AI 생성 콘텐츠의 오픈소스 오염 문제가 산업 전반의 공통 위협으로 공식 인정됐음을 의미한다.
- cURL 버그 바운티 종료 사례는 AI 슬롭이 오픈소스 기여 인센티브 구조 자체를 훼손할 수 있음을 보여준다.
- Alpha-Omega + OpenSSF 공동 운영 체계는 오픈소스 보안 공급망 강화를 위한 장기적 거버넌스 모델로 발전할 가능성이 있다.
미국 오하이오주 주민들이 25MW를 초과하는 대형 데이터센터를 금지하는 주 헌법 개정 청원을 제출했다. Adams, Brown 카운티 주민 약 1,800명이 서명에 참여했으며(법적 요건은 1,000명), 주 검찰총장실에 제출됐다. 이 지역 Brown 카운티 Mount Orab에 추진 중인 데이터센터 시설이 반발의 직접적 계기가 됐고, 지역 의회 의원들이 주민에게 세부 정보를 공개하지 못하도록 비밀유지협약(NDA)을 체결한 사실이 주민 반발을 심화시켰다. Pew Research Center 조사에 따르면 미국인들은 대형 서버팜이 환경에 부정적 영향을 미치고 에너지 요금을 인상시킨다고 인식하고 있으며, CBRE는 2025년 하반기 주요 미국 시장의 신규 데이터센터 착공량이 지역사회 반발로 감소했다고 발표했다.
핵심 인사이트
- 25MW 초과 금지라는 구체적 수치 기반 입법 시도는 지역사회가 데이터센터 규제에 과학적·기술적 근거를 활용하기 시작했음을 보여준다.
- NDA 체결 관행이 지역사회 신뢰를 훼손해 대규모 반발을 촉발하고 있으며, 빅테크의 비밀주의가 인허가 리스크를 높이고 있다.
- CBRE 데이터 기준 2025년 하반기부터 지역사회 반발이 실제 착공량 감소로 이어지고 있어 데이터센터 확장 계획에 실질적 차질이 발생 중이다.
- Trump 행정부의 AI 인프라 우선 정책과 지역 주민 권익 보호 간의 충돌이 미국 에너지·토지 정책의 핵심 갈등으로 부상하고 있다.
Alibaba Cloud가 다수의 서비스 요금을 최대 34% 인상한다고 발표했다. 일반 인스턴스는 5% 인상, GPU 고성능 인스턴스는 25~34% 인상, 가속기 사용료는 5~30% 인상된다. 자사 개발 AI ASIC인 Pingtouge Zhenwu 810E 기반 서비스도 인상 대상에 포함됐다. Alibaba는 "글로벌 AI 수요 급증과 공급망 비용 상승으로 핵심 하드웨어 조달 비용이 크게 증가했다"고 인상 배경을 설명했다. 2026년 4월 18일 이전에 구매한 서비스는 현재 결제 주기에 영향을 받지 않으며 갱신 시부터 신요금이 적용된다. 한편 AWS도 올해 1월 초 주말에 특정 머신러닝 자원 요금을 15% 인상한 바 있어 클라우드 업계 전반의 AI 인프라 비용 전가 흐름이 뚜렷해지고 있다.
핵심 인사이트
- GPU 인스턴스 최대 34% 인상은 메모리 가격 상승과 AI 수요를 반영하나, 컴퓨트 인상은 수요 독점 상황을 활용한 기회주의적 측면도 있다.
- 자사 AI ASIC(Zhenwu 810E)까지 인상 대상에 포함한 것은 Nvidia 의존 감소 전략의 비용 절감 효과가 제한적임을 시사한다.
- AWS, Alibaba Cloud 등 주요 하이퍼스케일러가 잇달아 AI 관련 요금을 인상하며 클라우드 기반 AI 개발 비용 상승이 구조화되고 있다.
- 기존 고객 대상 유예 기간 제공(4월 18일 기준)은 고객 이탈 방지를 위한 관리 조치이나, 장기 계약 고객의 갱신 시점 협상력 약화가 우려된다.
독립 연구자 Claudio Lorenzo La Rosa가 FPGA 위에 구현한 24-트리트(trit) 균형 3진(balanced ternary) RISC 프로세서 '5500FP'를 발표했다. 이 프로세서는 120개 명령어 세트(ISA), 원자적 동기화 명령어를 지원하며 오픈 하드웨어 개발 보드를 함께 제공한다. 3진 컴퓨팅은 비트 대신 트리트(-1, 0, +1)를 사용하며, 트리트 하나는 이론적으로 비트보다 약 1.58배 더 많은 정보를 담을 수 있다. 1950년대 말 모스크바 국립대학의 Setun 컴퓨터 이후 약 65년 만에 등장한 범용 3진 하드웨어로, FPGA를 사용하기 때문에 맞춤형 실리콘 없이도 비이진 아키텍처 연구가 가능하다. 단, 현재 구현 방식은 트리트마다 두 개의 비트 게이트를 사용하므로 이론적 밀도 이점이 실현되지는 않는다.
핵심 인사이트
- FPGA 기반 구현으로 커스텀 실리콘 없이 3진 아키텍처 연구의 진입 장벽을 대폭 낮춰 학술·산업 연구 가속이 기대된다.
- 1트리트 = 약 1.58비트의 정보 밀도 이점은 AI 추론·메모리 집약 워크로드에서의 에너지 효율 혁신 가능성을 열어 둔다.
- 현재 2비트/트리트 구현의 밀도 낭비 문제는 실제 3진 CMOS 등 새로운 소자 기술과 결합 시 해결될 수 있는 과제다.
- 비이진 컴퓨팅은 AI 가속기 설계의 대안 패러다임으로, 장기적으로 Nvidia GPU 중심 산업 구조를 다변화할 수 있는 연구 방향이다.
유럽 클라우드·디지털 서비스 제공사 24개 기업 CEO들이 EU 클라우드 및 AI 개발법(CADA) 입법에 앞서 유럽 집행위원회에 공개서한을 제출했다. CISPE(유럽 클라우드 인프라 서비스 제공사 협회) 소속 기업들은 '소버린티 워싱(sovereignty washing)', 즉 미국계 하이퍼스케일러가 EU 내 시설 운영만으로 디지털 주권 요건을 충족시키는 허위 주권 주장을 막아야 한다고 촉구했다. 이들은 주권을 기술 소유와 역외법(예: 미국 CLOUD Act) 면제로 정의할 것, 민감 데이터 처리에서 유럽 공급사에 예약 조달 할당을 부여할 것 등을 요구했다. 현재 AWS, Azure, Google Cloud는 유럽 클라우드 시장의 약 70%를 점유하고 있으며, 전문가들은 미국 클라우드 의존 탈피에 최대 20년이 걸릴 수 있다고 전망한다.
핵심 인사이트
- Microsoft가 프랑스 법원에서 EU 고객 데이터 주권을 보장할 수 없다고 인정한 사례는 현행 법 체계의 실질적 허점을 드러낸다.
- AWS·Azure·GCP의 유럽 시장 70% 독점 구도에서 CADA가 미흡하게 설계되면 유럽 클라우드 생태계의 구조적 종속이 고착화될 위험이 있다.
- Trump 행정부 출범 이후 EU의 미국 기술 인프라 의존 감소 논의가 정치적 우선순위로 급부상하고 있어 CADA의 입법 방향이 중요한 분기점이 된다.
- 탈의존화에 20년이 필요하다는 전문가 전망은 단기 법안만으로는 구조 변화가 불가능하며, 반도체·메모리 등 핵심 부품의 유럽 내 공급망 구축을 위한 장기 투자가 병행되어야 함을 시사한다.
Google DeepMind가 AGI(범용 인공지능) 달성 기준을 과학적으로 측정하기 위한 인지 분류 체계(cognitive taxonomy)를 개발하고, 이를 구체화할 Kaggle 해커톤을 개최한다. 분류 체계는 인간 인지의 8가지 기본 요소(지각, 생성, 주의, 학습, 기억, 메타인지, 실행 기능, 사회적 인지)와 이를 조합한 문제 해결 및 사회적 인지 등 복합 기능으로 구성된다. 해커톤은 평가 격차가 가장 큰 5개 능력(학습, 메타인지, 주의, 실행 기능, 사회적 인지)의 평가 방법론 설계를 목표로 하며, 총 상금은 20만 달러(분야별 2개 팀 각 1만 달러, 전체 우승 4개 팀 각 2만 5천 달러)다. 최종 수상자 발표는 6월로 예정돼 있다.
핵심 인사이트
- AGI 정의의 모호성을 해소하기 위한 실증적·과학적 벤치마크 프레임워크 구축은 AI 능력 측정의 표준화 논의를 앞당길 수 있다.
- 인간 인지와 AI를 동일 기준으로 비교하는 방법론은 향후 AGI 주장의 신뢰성 검증 수단이 되어 규제 및 안전 기준 설정에 활용될 가능성이 있다.
- 커뮤니티 참여 방식의 해커톤을 통한 평가 체계 개발은 DeepMind가 독점적 AGI 정의 논쟁을 외부로 개방하는 전략적 선택으로 볼 수 있다.
- 총 20만 달러 상금 규모는 오픈 연구 커뮤니티를 활용한 저비용 고효율 R&D 전략으로, AGI 측정 분야 선점 효과를 노린 투자다.
수처리 스타트업 Waterline Development가 LLM의 오류로 4개월과 20만 달러를 낭비한 경험을 계기로 자체 다중 모델 추론 시스템 'Rozum'을 개발하고 이를 독립 AI 스타트업으로 스핀아웃했다. Grok, ChatGPT 등 LLM이 재료과학 문제에서 탄소 전극 소재 선택을 잘못 권고해 파일럿 스케일 실패로 이어진 것이 직접적 계기였다. Rozum은 추론 시점(inference time)에서 상용 모델, 오픈 웨이트 모델, 도메인 특화 모델을 병렬 실행한 뒤 검증 레이어를 통해 오류·환각·잘못된 인용을 탐지·수정하는 방식으로 작동한다. PhD 수준 1,000개 벤치마크 문제에서 Rozum의 검증 레이어는 프론티어 모델 응답의 76.2%에서 미검증 주장을, 21.3%에서 인용 출처 확인 불가 사례를 발견했으며, GPT-4·Grok 4·Gemini 3.1 Pro 대비 대부분 카테고리에서 높은 정확도를 기록했다.
핵심 인사이트
- 고신뢰성 도메인(재료과학, 의료, 법률 등)에서 단일 LLM의 환각 위험은 실질적 비즈니스 손실로 직결되며, 앙상블+검증 아키텍처의 수요가 커지고 있다.
- 프론티어 모델 응답의 76.2%에서 미검증 주장이 발견된 데이터는 현재 LLM의 신뢰성 한계를 정량적으로 보여주는 중요한 근거다.
- 추론 시점 다중 모델 오케스트레이션은 단일 모델 파인튜닝 대비 도메인 특화 없이도 높은 정확도를 달성할 수 있는 실용적 접근법이다.
- Waterline의 스핀아웃 전략은 내부 도구의 상업화를 통한 기업 가치 창출 모델로, AI 신뢰성 문제를 해결하는 B2B SaaS 시장의 성장을 예고한다.
Microsoft가 Microsoft 365 Copilot 앱의 기업 사용자 대상 자동 설치 계획을 한시적으로 중단했다. 원래 2025년 10월 시작 예정이었던 배포가 12월로 연기됐다가 이번에 기한 미정으로 재차 연기됐다. 해당 배포는 사용자가 별도로 설치하지 않아도 Microsoft 365 데스크톱 앱 사용자에게 Copilot 앱이 시작 메뉴에 자동 추가되는 방식으로, 관리자가 명시적으로 거부(opt-out)해야만 배포를 막을 수 있었다. 기업 IT 관리자들이 관리 부담 증가와 기업 일정에 맞지 않는 일방적 배포 방식에 강하게 반발했다. 유럽경제지역(EEA) 고객은 처음부터 적용 제외 대상이었으며, 기존 설치분은 영향을 받지 않는다.
핵심 인사이트
- 반강제적 opt-out 방식의 소프트웨어 배포는 기업 IT 거버넌스와 충돌하며, Microsoft의 Copilot 채택 강제 전략이 역효과를 낳고 있음을 보여준다.
- Copilot 자동 배포 재연기는 AI 어시스턴트 보급 속도보다 기업 준비도와 ROI 입증이 더 중요하다는 시장의 신호다.
- EEA 사전 제외 조치는 EU 디지털 시장법(DMA) 등 규제 환경이 제품 배포 전략에 직접적 영향을 미치고 있음을 보여주는 사례다.
- Windows 11에서도 Copilot 전면 통합 전략이 재검토 중이라는 점은 Microsoft의 AI 수익화 모델 전반에 대한 재평가가 진행 중임을 시사한다.
Nvidia CEO Jensen Huang이 GTC 2026 행사에서 H200 GPU의 중국 판매 재개와 생산 램프업을 공식 확인했다. Trump 행정부가 2025년 12월 H200에 대한 수출 금지를 해제한 이후 중국 정부가 한때 국내 기업의 H200 구매를 비공식적으로 억제했으나, 현재는 해당 압박이 완화된 것으로 파악된다. Nvidia CFO Colette Kress는 직전 분기 실적 발표에서 2027 회계연도 1분기 매출 전망에 중국 데이터센터 매출을 전혀 반영하지 않았다고 밝혔으나, Huang은 이미 다수의 중국 고객으로부터 구매 주문을 받았다고 발표했다. Huang은 Trump 대통령의 무역 정책을 긍정적으로 평가하며, Nvidia가 세계 시장에서 경쟁을 이어가야 한다는 정책 방향을 지지했다.
핵심 인사이트
- H200의 중국 판매 재개는 Nvidia에게 수십억 달러 규모의 추가 매출 기회를 열어주며, 기존 CFO의 보수적 가이던스를 상향 수정하게 하는 핵심 변수다.
- 중국 정부의 자국산 GPU 우선 정책이 단기 완화됐지만, 이는 지정학적 협상 카드로 언제든 재개될 수 있어 Nvidia의 중국 매출 가시성이 여전히 불안정하다.
- H200은 Nvidia의 최신 Blackwell 대비 구형이지만 중국 로컬 GPU 대비 우위를 유지하고 있어 AI 인프라 수요가 있는 중국 기업들에게 여전히 매력적인 선택지다.
- Nvidia의 중국 재진입은 화웨이·캠브리콘 등 중국 AI 반도체 기업의 내수 시장 점유율 확대 전략에 직접적인 압박 요인이 될 것이다.
Nvidia가 AI 추론(inference) 가속에 특화된 Groq 3 LPU(Language Processing Unit)를 출시하며 AI 컴퓨팅 시장의 무게중심이 훈련(training)에서 추론(inference)으로 이동하고 있음을 신호하고 있다. 기존 GPU 아키텍처 대비 언어 처리 태스크에서 월등한 성능을 보이는 이 칩은, 대규모 AI 모델을 실 서비스(production) 환경에서 저지연·고처리량으로 운용하는 데 최적화되어 있다. IEEE Spectrum은 이 칩이 AI 인프라 구성 방식의 전환점을 상징하며, 추론 전용 하드웨어 시장의 본격적인 경쟁을 예고한다고 평가한다.
핵심 인사이트
- [기술 성숙도] Groq 3 LPU는 GPU 범용 아키텍처 대비 언어 추론 작업에서 지연 시간과 처리 효율을 대폭 개선, 전용 추론 칩 설계의 기술 성숙을 보여준다.
- [시장·산업 영향] AI 워크로드의 중심이 훈련에서 추론으로 이동함에 따라 LPU·NPU 등 추론 전용 칩 수요가 급성장하며 반도체 시장 구조가 재편되고 있다.
- [기술적 의미] 범용 GPU가 아닌 목적별 특화 프로세서(domain-specific processor)가 AI 인프라의 핵심 구성 요소로 자리잡는 아키텍처 전환이 가속화되고 있다.
- [투자·비즈니스 관점] Nvidia가 GPU 독점 지위를 넘어 추론 전용 칩 영역까지 포트폴리오를 확장함으로써, 경쟁사인 Groq(인수 전)·Cerebras 등 스타트업의 시장 입지가 압박받을 가능성이 크다.
Nvidia가 얼굴 인식을 단 787마이크로초(1밀리초 미만)에 수행하는 전용 SoC(System-on-Chip)를 개발했다. 이 칩은 자율주행차량과 로보틱스 등 임베디드 시스템을 겨냥하며, 범용 GPU 대비 극적으로 낮은 전력 소비를 달성했다. 얼굴 검출 태스크에 특화된 설계로 속도와 에너지 효율을 동시에 확보한 이번 기술은, AI 전용 가속기(domain-specific accelerator)가 엣지(edge) 환경에서도 실용 배치 단계에 진입했음을 보여주는 사례로 평가된다.
핵심 인사이트
- [기술 성숙도] 787마이크로초의 얼굴 검출 속도는 기존 GPU 기반 대비 수십 배 빠른 수준으로, 임베디드 AI SoC 설계 기술이 실시간 처리 임계값을 이미 돌파했음을 증명한다.
- [시장·산업 영향] 자율주행·로보틱스·보안 카메라 등 엣지 AI 시장에서 저전력 고속 얼굴인식 칩 수요가 급증하며, 전용 SoC 시장이 빠르게 확대될 것으로 예상된다.
- [기술적 의미] 범용 연산 대신 특정 태스크(얼굴 검출)에 최적화된 하드웨어 설계가 속도·전력 양면에서 압도적 우위를 보임으로써, domain-specific architecture 패러다임의 유효성을 재확인했다.
- [투자·비즈니스 관점] Nvidia가 데이터센터 GPU를 넘어 엣지 임베디드 AI SoC 영역으로 사업을 확장함에 따라, Qualcomm·MediaTek 등 기존 모바일 SoC 업체와의 경쟁이 심화될 전망이다.
Google DeepMind가 조류 울음소리로 훈련된 foundation model인 Perch 2.0을 개발했으며, 이 모델은 전이학습(transfer learning)을 통해 고래 울음소리까지 인식하는 데 성공했다. 조류 음성 데이터로 학습한 모델이 완전히 다른 종(해양 포유류)의 발성을 인식하는 범(汎)종(cross-species) 일반화 능력을 입증한 것으로, 종별 대규모 레이블링 데이터 없이도 AI 기반 생물음향학(bioacoustics) 연구가 가능해졌다. 야생동물 모니터링, 보전 생물학, 동물 커뮤니케이션 연구에 폭넓게 활용될 수 있다는 평가다.
핵심 인사이트
- [기술 성숙도] Perch 2.0의 cross-species 전이학습 성공은 foundation model이 음향 도메인에서도 강력한 범용 표현(representation)을 학습할 수 있음을 실증하며, 생물음향학 AI의 기술 성숙을 알린다.
- [시장·산업 영향] 종별 레이블 데이터 수집 비용이 대폭 절감되어, 멸종위기종 모니터링·해양 환경 조사 등 보전 생태학 분야에서 AI 도입이 가속화될 전망이다.
- [기술적 의미] 언어·이미지에서 검증된 foundation model의 전이학습 패러다임이 동물 발성(bioacoustics) 영역으로 확장되어, 자연어 처리 기법이 비언어 음성 분석에도 유효함을 확인했다.
- [투자·비즈니스 관점] 환경 모니터링·생물다양성 보전 분야의 AI 적용 수요가 커지면서, Google DeepMind가 과학 커뮤니티와 협력하며 비상업 연구 분야에서도 영향력을 강화하는 전략으로 해석된다.
Penn State 대학 연구진이 최고 250°C 고온에서도 작동하며 기존 커패시터 대비 에너지 밀도를 4배 높인 폴리머 블렌드 커패시터를 개발했다. 폴리머 혼합(polymer blend)과 고유전율(high-K) 유전체 소재를 결합한 이 기술은 극한 열환경에서의 에너지 저장 문제를 해결하며, 항공우주·전기차(EV) 전력전자·산업용 장비 등 고온 응용 분야에 적합하다. 기존 커패시터의 고온 성능 저하 문제를 근본적으로 극복한 것으로, 차세대 전력전자 소자의 소형화·고효율화에 기여할 것으로 평가된다.
핵심 인사이트
- [기술 성숙도] 250°C 동작·4배 에너지 밀도 달성은 소재 공학 측면에서 상당한 성과로, 실험실 단계를 벗어나 파일럿 양산 검증이 다음 과제로 부상했다.
- [시장·산업 영향] 고온 전력전자 부품은 EV 인버터, 항공기 전원계통, 산업용 모터드라이브 등에서 수십억 달러 규모 시장을 형성하며, 4배 에너지 밀도 개선은 부품 소형화·원가 절감으로 직결된다.
- [기술적 의미] Polymer blend + high-K dielectric 조합은 기존 세라믹 또는 전해 커패시터의 한계를 극복하는 새로운 소재 설계 방향을 제시하며, 유연 전자기기에도 응용 가능성이 있다.
- [투자·비즈니스 관점] EV 확산과 항공기 전동화(MEA, More Electric Aircraft) 추세가 고온 에너지저장 소재 수요를 견인하며, 관련 소재·소자 분야의 스타트업 및 대기업 투자가 가속화될 전망이다.
유럽은 클라우드 인프라 시장에서 AWS(Amazon Web Services), Microsoft Azure, Google Cloud 등 미국 빅테크에 거의 전적으로 의존하고 있으며, 자국산 대형 클라우드 사업자가 사실상 부재한 상황이다. IEEE Spectrum은 EURO-3C(European Cloud Computing Competitiveness Center) 구상을 포함한 유럽의 클라우드 주권 확보 노력을 분석하며, 기술적 역량 격차, 규제 환경, 투자 생태계 미성숙이 복합적으로 작용하는 구조적 문제를 짚는다. Gaia-X 프로젝트 등의 실패 원인을 돌아보고, 실질적 경쟁력을 갖춘 유럽 클라우드 사업자 육성 가능성을 검토한다.
핵심 인사이트
- [기술 성숙도] 유럽은 하이퍼스케일 데이터센터 구축·운영 경험이 미국 대비 5~10년 뒤처져 있으며, Arm 기반 서버 칩 설계 역량과 소프트웨어 스택 표준화가 선결 과제다.
- [산업 적용] EURO-3C 같은 컨소시엄 모델은 단기 상용화보다 공공 조달 시장 진입을 목표로 하며, 정부·군·의료 등 민감 데이터 영역에서 틈새 시장을 먼저 공략하는 전략이 유력하다.
- [상용화 시기] 2030년 이전 유럽산 하이퍼스케일 클라우드 플랫폼의 시장 경쟁력 확보는 현실적으로 어렵고, 2030~2035년을 목표로 한 장기 국가 프로젝트 형태가 현실적인 경로로 분석된다.
- [투자·정책 함의] EU의 디지털 주권 정책과 GDPR 역외 데이터 이전 규제가 유럽 클라우드 육성의 제도적 지렛대로 작용하지만, 민간 투자 유인 없이는 지속 불가능하다는 한계가 지적된다.
NERC(North American Electric Reliability Corporation)가 주관하는 대규모 전력망 보안 훈련 GridEx의 최신 결과를 IEEE Spectrum이 분석했다. 이번 훈련에서 드론(무인 항공기)이 변전소·송전선 등 물리 인프라에 가하는 위협이 핵심 과제로 부각되었다. AI가 드론 탐지·방어에 활용되는 동시에 공격 수단으로도 사용될 수 있다는 양면성이 제기되었으며, 기존의 사이버 보안 중심 대응 체계로는 물리적 드론 위협에 효과적으로 대응하기 어렵다는 결론이 도출됐다. 전력 유틸리티들의 드론 탐지·무력화 전략 수립이 시급한 과제로 떠올랐다.
핵심 인사이트
- [기술 성숙도] 드론의 접근성·능력이 빠르게 향상되면서 전통적 물리 보안(울타리·경비) 체계가 더 이상 충분하지 않으며, 레이더·RF 탐지 기반의 드론 방어 시스템이 성숙 단계에 진입 중이다.
- [시장·산업 영향] GridEx 결과는 전력 유틸리티들이 드론 방어 인프라에 대규모 투자를 단행할 가능성을 높이며, 반(反)드론(counter-drone) 기술 시장의 성장 모멘텀이 강화되고 있다.
- [기술적 의미] AI가 드론 탐지·식별에 활용되는 한편 적대적 드론의 자율 비행·타격 정밀도 향상에도 기여한다는 양면성은 에너지 인프라 보안의 복잡성을 한 차원 높이고 있다.
- [투자·비즈니스 관점] 미국 에너지부와 NERC의 규제 강화 방향에 따라 전력 유틸리티들의 물리 보안 예산이 증가하고, 관련 counter-drone·AI 모니터링 기업에 대한 투자 기회가 확대될 전망이다.
AI 데이터센터가 대역폭 병목을 해소하기 위해 DWDM(Dense Wavelength Division Multiplexing) 공동패키징 광학(co-packaged optics) 기술을 채택하고 있다. Scintil Photonics의 SHIP(Silicon-based photonic integration platform) 기술은 레이저를 실리콘 포토닉 칩에 직접 집적해 AI 가속기와 함께 패키징하며, 이를 통해 단일 광섬유로 복수의 DWDM 채널을 동시 전송해 대역폭을 대폭 늘리고 지연 시간을 줄인다. 고속 전기 인터커넥트 대비 전력 소비도 절감되어 대규모 AI 훈련 클러스터의 인프라 비용 구조를 개선할 것으로 기대된다.
핵심 인사이트
- [기술 성숙도] 실리콘 포토닉스 기반 co-packaged optics와 DWDM의 결합은 데이터센터 인터커넥트 기술의 중요한 전환점으로, 상용 AI 인프라 적용이 시작 단계에 진입했다.
- [시장·산업 영향] AI 가속기 간 초고대역폭 연결 수요가 급증하면서 silicon photonics 및 co-packaged optics 시장이 빠르게 성장하고 있으며, 관련 팹리스·소부장 기업의 수혜가 예상된다.
- [기술적 의미] DWDM+SHIP 조합은 단일 광섬유당 전송 용량을 수배 이상 늘리면서도 광학-전자 부품 간 신호 경로를 극적으로 단축, 지연 시간과 에너지 효율이 동시에 개선되는 핵심 기술이다.
- [투자·비즈니스 관점] Scintil Photonics 같은 실리콘 포토닉스 스타트업이 대형 AI 클라우드 사업자의 공급망에 편입될 가능성이 높아지며, M&A 및 전략적 투자 대상으로 주목받을 전망이다.
IEEE Spectrum의 주간 로봇 비디오 큐레이션 코너 'Video Friday'에서 다족(legged) 모듈형 로봇과 다양한 지형 적응 보행 기술을 집중 소개했다. 단일 다리부터 4족 보행까지 다양한 구성의 모듈형 로봇들이 험지·평지를 가리지 않고 이동하는 영상 12개가 수록되었으며, 귀여운 외형의 로봇 판다 등 실용성과 심미성을 결합한 디자인도 포함됐다. 모듈 교체로 태스크·지형에 따라 재구성 가능한 로봇 플랫폼의 최신 발전상을 보여주는 편집본이다.
핵심 인사이트
- [기술 성숙도] 다양한 지형에서 안정적으로 작동하는 다족 모듈형 로봇의 영상들은 학술 프로토타입을 넘어 실제 환경 적용 단계에 근접하고 있음을 보여준다.
- [시장·산업 영향] 모듈형 설계는 물류·구조·군사 등 다양한 산업에 동일한 플랫폼을 재활용할 수 있어 로봇 하드웨어의 TCO(총 소유비용)를 크게 낮출 수 있는 잠재력을 지닌다.
- [기술적 의미] 험지 보행(legged locomotion)과 모듈화의 결합은 기존 바퀴형 로봇이 진입하기 어려운 비정형 환경 대응 능력을 높이며, 강화학습 기반 보행 제어 알고리즘의 발전이 핵심 동인이다.
- [투자·비즈니스 관점] 구조·재난 대응 로봇 시장과 방위 분야의 자율 이동 로봇 수요가 증가하면서, 모듈형 다족 로봇 플랫폼 개발 스타트업에 대한 벤처 투자 관심이 높아지고 있다.
GTC 2026에서 Jensen Huang은 Nvidia를 단순 하드웨어 공급자가 아닌 에이전틱 AI 생태계의 기반 주체로 재정의했다. Nvidia는 오픈소스 AI 파운데이션 모델에 5년간 $26B를 투자하며, Nemotron 3 계열 신모델로 Nemotron 3 Ultra(NVFP4 포맷, Blackwell GPU 최적화)·Omni(오디오·비전·언어 통합)·VoiceChat(실시간 동시 대화)·NemoClaw(OpenClaw 보안 레퍼런스 모델)를 공개했다. Nemotron 3 Super는 120B 총 파라미터와 12B 활성 파라미터를 가지며 표준 대비 최대 15배 더 많은 토큰을 생성해 멀티에이전트 시스템의 "컨텍스트 폭발" 문제를 해소한다. Nemotron Coalition(Nemotron 4)에는 Mistral AI·LangChain·Perplexity 등이 참여해 DGX Cloud 기반 협업 모델을 개발한다.
핵심 인사이트
- Nvidia의 $26B 오픈소스 모델 투자는 하드웨어 판매 수익을 유지하면서 모델 생태계까지 장악하는 수직 통합 전략으로, GPU 수요를 직접 창출하는 에이전틱 AI 킬러앱 포지션을 확보하는 데 핵심이다.
- Nemotron 3 Super의 15배 토큰 생성 능력은 멀티에이전트 오케스트레이션 시 발생하는 컨텍스트 드리프트 문제를 직접 겨냥한 것으로, 엔터프라이즈 에이전트 도입의 기술적 장벽 해소에 기여할 전망이다.
- NemoClaw라는 OpenClaw 보안 레퍼런스 모델 출시는 오픈소스 에이전트의 "insecure by default" 취약점을 Nvidia가 인프라 수준에서 해결하려는 시도로, 엔터프라이즈 시장 침투 속도를 높일 수 있다.
- Nemotron Coalition에 Mistral AI·Perplexity 등이 참여해 DGX Cloud에서 베이스 모델을 공동 개발하는 구조는 Nvidia가 오픈소스 AI 생태계의 훈련 인프라 표준으로 자리잡는 전략적 포석이다.
Nvidia가 GTC 2026 기조연설에서 $20 billion 규모의 Groq "acquihire"의 실제 이유를 공식 인정했다. Groq의 LP30 LPU(Language Processing Unit) 데이터플로우 엔진은 저지연 AI 추론에 특화된 아키텍처로, Cerebras·SambaNova 등 추론 스타트업들의 시장 진입을 방어하기 위한 선제적 대응이다. Nvidia는 삼성과 협력해 3세대 LP30 칩을 2026년 하반기(Q3 유력)에 출시하며, 이를 Vera-Rubin 플랫폼의 추론 랙으로 통합할 계획이다. 완전한 acquihire 형태를 택한 것은 정식 인수 시 독점규제 심사에 1~2년이 소요될 수 있기 때문이다.
핵심 인사이트
- Nvidia의 $20B Groq acquihire는 저지연 AI 추론 시장 방어를 위한 전략적 선제 조치로, LP30 LPU 칩을 Vera-Rubin 플랫폼에 통합해 추론 포트폴리오를 완성한다.
- Cerebras, SambaNova 등 고대역폭 SRAM 기반 추론 스타트업들이 시장 점유율을 빠르게 확대하며 Nvidia의 GPU 독점 체제를 실질적으로 위협하고 있다.
- LP30은 삼성 파운드리를 통해 생산되며 2026년 Q3 출시 예정으로, Nvidia가 추론 전용 아키텍처를 GPU와 별도로 운영하는 이중 전략을 채택했음을 시사한다.
- 규제 우회를 위한 acquihire 구조는 AI 반도체 M&A 시장에서 새로운 거래 패턴으로 자리잡을 가능성이 높으며, 향후 유사 사례의 선례가 될 전망이다.
오픈소스 에이전틱 AI 플랫폼 OpenClaw가 4개월 만에 GitHub 스타 250,000개를 돌파하며 React를 제치고 역대 최다 스타 비애그리게이터 소프트웨어 프로젝트가 됐다. 주간 조회수 200만 회를 기록하는 폭발적 성장세를 보인 OpenClaw는 WhatsApp·Telegram·Discord와 연동해 회의 예약·코드 실행·비행 예약 등 자율 작업을 수행하는 자기 호스팅 AI 에이전트다. Jensen Huang은 GTC 2026에서 OpenClaw가 "사상 가장 중요한 소프트웨어 릴리즈"라며 에이전틱 AI에 있어 GPT가 챗봇에 했던 역할을 한다고 평가했다. OpenAI CEO Sam Altman은 창업자 Peter Steinberger를 영입해 핵심 제품에 통합할 계획이다.
핵심 인사이트
- OpenClaw는 GitHub 스타 250K 돌파와 React 추월이라는 성장 지표로, 에이전틱 AI가 챗봇에서 자율 행동 에이전트로 패러다임 전환하는 변곡점을 상징한다.
- Gartner의 "기본 설계가 불안전(insecure by default)" 지적과 Cisco의 "보안 악몽" 평가는 자율 에이전트의 엔터프라이즈 도입에 앞서 해결해야 할 보안 아키텍처 과제를 명확히 드러낸다.
- Nvidia가 OpenClaw를 사내 전사 도구·코드 작성에 실제 운영 중이며, Jensen Huang이 직접 홍보함으로써 에이전틱 AI를 GPU 인프라 수요 확대의 새로운 킬러앱으로 포지셔닝하고 있다.
- OpenAI의 창업자 영입과 오픈소스 재단 전환 계획이 동시에 진행되면서, 상업적 통합과 커뮤니티 독립성 간의 긴장이 향후 에이전틱 AI 생태계 구조를 결정짓는 변수로 부상한다.
IBM이 양자-고전 HPC 통합 컴퓨팅의 청사진을 공개하며, 상용 내결함성 양자컴퓨터가 클라우드 서비스 형태로 기존 CPU·GPU 슈퍼컴퓨터의 가속기 노드로 통합되는 미래를 제시했다. Nvidia는 양자-고전 연계 고속 인터커넥트 NVQLink와 플랫폼 CUDA-Q를 개발 중이며, 스타트업 Quantum Machines는 고전 프로세스와 양자 제어 스택을 통합하는 오픈 액셀러레이션 스택을 출시했다. CSIS는 이를 미국 기술 리더십 유지를 위한 국가 안보 전략 과제로 규정했으며, 유럽 대비 통합 진행도 지연을 경고했다.
핵심 인사이트
- IBM이 제시한 양자-고전 HPC 통합 모델은 양자컴퓨터를 독립 시스템이 아닌 고성능 클러스터의 가속기 노드로 규정하며, GPU 병렬 패러다임의 연장선에서 양자 활용 경로를 구체화한다.
- Nvidia의 NVQLink·CUDA-Q, Quantum Machines의 오픈 액셀러레이션 스택 등 플랫폼 레이어 표준화 경쟁이 본격화되며, 향후 양자-고전 인터페이스 표준 선점이 시장 지배력을 결정할 전망이다.
- 실시간 오류 수정과 큐비트 캘리브레이션이 상용 내결함성 양자 시스템의 핵심 병목으로 부상하며, 이를 해결하는 소프트웨어 스택 기업에 대한 투자 가치가 높아지고 있다.
- CSIS의 국가 안보 전략 경고는 양자-HPC 통합이 순수 기술 경쟁을 넘어 지정학적 경쟁 영역으로 진입했음을 시사하며, 정부 주도 투자 확대와 수출 규제 강화를 예고한다.
영국 축구협회(FA)가 Google Cloud와 협력해 여성 선수의 생리·심리 건강 데이터를 분석하는 인프라를 구축했다. 2024년 937편의 스포츠과학 논문 감사 결과 79%가 남성 코호트 중심이었고, 여성 전용 연구는 4%에 불과했으며 성별 차이 방법론을 포함한 논문은 2%에 그쳤다. FA는 영국 최초로 전 축구 리그에 여성 건강 교육을 의무화하고, Female Athlete Health Framework를 시행하며 Google Cloud 기반 데이터 인프라로 코치와 퍼포먼스 스태프의 의사결정을 지원한다.
핵심 인사이트
- 스포츠과학 데이터의 남성 편향(79% 남성 코호트, 여성 전용 4%)이 여성 운동선수의 훈련·회복 최적화를 구조적으로 저해해왔으며, 데이터 인프라 투자가 성과 격차 해소의 핵심 수단으로 부상하고 있다.
- FA의 Google Cloud 파트너십은 스포츠 기관이 퍼포먼스 분석 인프라를 클라우드로 전환하는 모델 사례로, 엔터프라이즈급 데이터 파이프라인이 스포츠 도메인에 본격 침투하는 흐름을 보여준다.
- 전 리그 여성 건강 교육 의무화는 데이터 기반 의사결정 문화를 조직 전체에 내재화하는 거버넌스 접근으로, 기술 도입에 앞선 인적 변화 관리의 중요성을 시사한다.
- 여성 운동선수 특화 데이터 수집·분석 시장은 초기 단계로, 호르몬 사이클·근육 조성 등 여성 특유 생리 변수를 반영한 AI 모델 개발 수요가 급증할 전망이다.
하버드 대학 양자연구소에서 2017년 스핀오프한 Zapata Computing이 파산 및 부채 구조조정을 거쳐 2025년 9월 Zapata Quantum으로 재건됐다. 2024년 10월 운영 중단 이전 AI-지향 SPAC을 통해 1억 달러 자금 조달을 시도했으나 실질적 자본 유입은 0에 그쳤고 2,000만 달러 이상의 부채만 발생했다. 재건 후 60개 이상의 특허와 양자 중간 표현(QIR) 등 핵심 IP를 보호하며 양자 스택 상위 애플리케이션 레이어에 재집중하고 있다. CEO Sumit Kapur는 파트너십 기반의 양자 소프트웨어 생태계 구축을 새로운 전략으로 제시했다.
핵심 인사이트
- Zapata의 실패-재건 사례는 양자컴퓨팅 하드웨어 성숙도가 소프트웨어 기업의 생존을 결정하는 핵심 변수임을 보여주며, 시장 타이밍 미스매치가 스타트업 생사를 좌우함을 입증한다.
- AI-지향 SPAC 피벗 실패는 양자 기업이 AI 붐에 편승해 본업에서 이탈할 때 전략적 차별성을 잃고 오히려 자본 조달 능력이 약화되는 역설적 결과를 낳을 수 있음을 경고한다.
- 60개 이상 특허 및 QIR 등 핵심 IP를 파산 과정에서 온전히 보호한 것은 딥테크 스타트업의 무형자산 관리가 청산 시에도 재기의 발판이 될 수 있음을 보여주는 사례다.
- Zapata의 재진입 시점은 양자-고전 HPC 통합 수요가 급증하는 시기와 맞물리며, 상위 애플리케이션 레이어 소프트웨어 전문성이 IBM·Nvidia 같은 대형 플랫폼 벤더와의 파트너십에서 레버리지로 작용할 가능성이 높아졌다.
네트워킹 스타트업 Eridu가 스텔스 모드를 벗어나며 Series A에서 $200M 이상을 조달하고, AI 클러스터용 초고-radix 스위치 시스템을 개발한다고 발표했다. AI 클러스터 하드웨어 총 취득 비용(TCA)에서 네트워킹이 차지하는 비중이 20%를 상회하는 반면, 하이퍼스케일러의 목표는 10% 이하다. Eridu의 고-radix 스위치는 네트워크 계층을 평탄화해 랙스케일·로우스케일 AI 클러스터 내부와 클러스터 간 스케일아웃 네트워크의 지연 시간을 낮추고 비용을 절감하는 것을 목표로 한다. 텔레콤 업계에서 발전한 기술을 데이터센터 AI 인프라로 이전하는 방식을 채택했다.
핵심 인사이트
- AI 클러스터에서 네트워크 비용이 TCA의 20~30%를 차지한다는 현실은, 고-radix 스위치처럼 네트워크 계층을 줄이는 기술이 인프라 투자 효율화의 핵심 레버로 부상하고 있음을 의미한다.
- Eridu의 $200M+ Series A는 AI 네트워킹 인프라 스타트업에 대한 투자자 신뢰가 높아졌음을 보여주며, Nvidia의 Spectrum-X나 Broadcom의 AI 패브릭과 직접 경쟁하는 대안 생태계 형성 가능성을 시사한다.
- 스케일업(랙 내부 GPU 메모리 연결)과 스케일아웃(수천~수만 랙 간 MPI 기반 연결) 양방향 고-radix화는 AI 슈퍼컴퓨터 아키텍처 전반의 네트워크 재설계를 촉진할 전망이다.
- 텔레콤 출신 기술자들이 데이터센터 AI 네트워킹에 진입하는 패턴은 초고-radix, 초저지연 스위치 혁신의 원천이 되고 있으며, 기존 이더넷·InfiniBand 진영 외부의 신규 표준 등장 가능성을 높인다.
HPE(Hewlett Packard Enterprise)의 Q1 F2026 데이터센터 핵심 시스템 사업 매출이 $7.81B으로 전년 대비 16.2% 성장했으며, 영업이익은 $997M을 기록했다. GenAI 붐과 Juniper Networks 인수($14B)가 매출 증가를 견인했으나, 반도체·스토리지 원가 상승으로 마진 압박이 지속되고 있다. HPE는 수익성 낮은 딜을 적극 기각하는 전략적 선별 수주로 전환했으며, 서버·스토리지·스위칭·라우팅·보안·시스템 소프트웨어·금융 서비스를 통합하는 포트폴리오를 운영 중이다.
핵심 인사이트
- HPE 데이터센터 사업의 분기 매출 $7.81B, 영업이익 $997M은 GenAI 인프라 수요가 Nvidia·TSMC 외 2차 공급망 기업에도 실질적 수익으로 흘러들기 시작했음을 보여주는 지표다.
- 메모리·플래시 원가가 매출 증가 속도를 상회하는 구조는 서버·스토리지 OEM 전반의 마진 압박을 심화시키며, 수익성 기반 선별 수주 전략이 업계 표준으로 확산될 가능성이 높다.
- Juniper Networks 인수($14B)로 캠퍼스 스위칭·라우팅·보안까지 포트폴리오를 확장한 HPE는 순수 서버 벤더에서 통합 인프라 솔루션 공급자로 포지셔닝을 전환하고 있다.
- AI 반도체·가속기 공급 과잉 전환 시점에 HPE 같은 시스템 통합 기업이 가격 협상력을 회복할 가능성이 있으며, 이는 향후 2~3년 내 시스템 OEM 마진 구조의 점진적 개선을 예고한다.
The Next Platform 공동 창업자 Timothy Prickett Morgan이 AI 추론 플랫폼 간 공정한 가격·성능 비교를 위한 표준 벤치마크 체계 수립을 촉구하는 칼럼을 게재했다. 현재 AI 인프라 시장에는 Nvidia GPU 외에 Cerebras, SambaNova, Groq 등 경쟁력 있는 대안들이 등장했음에도, 플랫폼 간 객관적 비교 수단이 없어 기업의 합리적 투자 결정을 방해하고 있다. 필자는 1970년대 관계형 데이터베이스 시대의 Jim Gray가 TPC 벤치마크를 정립한 사례처럼, GenAI 세대의 표준 벤치마크가 시급히 필요하다고 주장한다.
핵심 인사이트
- AI 추론 시장의 공신력 있는 벤치마크 부재는 Nvidia GPU 독점 체제를 유지시키는 비가시적 장벽으로 작용하며, 표준 벤치마크 수립이 경쟁 시장 형성의 전제 조건임을 강조한다.
- HBM 스택 메모리 공급 제약이 AI 인프라의 진정한 병목임을 지적하며, 이는 GPU 사양 경쟁 이면에서 메모리 대역폭과 용량이 실제 추론 성능을 결정하는 핵심 변수임을 시사한다.
- TPC 벤치마크가 관계형 DB 시장의 공정 경쟁을 촉진했던 역사적 선례는, AI 추론 벤치마크가 단순 측정 도구를 넘어 시장 구조 재편의 촉매제가 될 수 있음을 보여준다.
- 기업 고객이 AI 인프라의 가격·성능 분석을 엄밀히 수행할 수 없는 현재 상황은 AI 메인스트리밍을 지연시키는 구조적 요인이며, 표준화된 측정 체계 수립이 시장 규모 확대를 가속할 것이다.
Formula E와 Google Cloud가 협력해 Vertex AI 및 Gemini LLM 기반의 생성형 AI 드라이버 에이전트를 개발하고 있다. 이 시스템은 실시간 퍼포먼스 피드백과 텍스트·오디오 기반 개인화 코칭을 제공해, 기존에는 최상위 드라이버만 받을 수 있었던 엔지니어링팀 수준의 분석을 모든 드라이버에게 개방한다. 모터스포츠에서 여성 종사자 비율은 전체의 10% 미만이며, F1 그랑프리 출전 여성은 역대 5명뿐이다. More than Equal의 Inside Track 연구에 따르면 여성은 데이터 부족·문화적 편견·낮은 스폰서십으로 인해 구조적 불이익을 받고 있다.
핵심 인사이트
- Google Cloud의 Vertex AI·Gemini 기반 드라이버 에이전트는 전문 코칭 데이터의 민주화 사례로, AI가 자원 격차에 의한 퍼포먼스 불평등을 실시간으로 보완하는 새로운 활용 모델을 제시한다.
- 모터스포츠 업계의 여성 비율 10% 미만, F1 그랑프리 여성 출전자 역대 5명이라는 수치는 데이터 부족이 단순 통계 문제가 아니라 여성 특화 AI 모델 훈련의 원천 데이터 자체를 제약하는 악순환 구조임을 보여준다.
- Formula E의 드라이버 에이전트는 엘리트 전용 분석 도구를 하위 리그까지 확장하는 플랫폼 전략으로, 스포츠 외 교육·의료 등 전문 지식 접근 격차가 큰 도메인으로의 응용 가능성을 확인시킨다.
- 여성 운동선수 대상 AI 코칭 시스템 개발 수요는 스포츠 조직과 클라우드 기업 간 파트너십을 촉진하며, 성별·배경 무관 퍼포먼스 데이터 수집 의무화가 산업 표준으로 자리잡는 계기가 될 전망이다.