표시할 기사가 없습니다.
Box 창업자 Aaron Levie가 테크 CEO들이 집단적으로 "AI 망상"에 빠져 있다고 경고했다. CEO들은 AI를 직접 시험해보며 프로토타입을 만들거나 계약서를 생성하는 등의 작업을 해보고, AI 에이전트가 모든 업무를 처리할 수 있다고 성급하게 결론짓는다는 것이다. Levie는 X(구 트위터)에서 2.7백만 팔로워를 보유한 AI 지지자임에도, CEO들이 실제 현장에서 코드 검토, 버그 발견, 환각된 라이브러리 검출 등 복잡한 작업의 실상을 파악하지 못한다고 비판했다. 그는 CEO들이 AI를 충분히 사용해보되 실제 한계와 가능성을 균형 있게 인식해야 한다고 촉구했다. 이 현상은 클라우드 컴퓨팅 초기의 비용 폭주와 유사하면서도, 대규모 매출과 대량 해고가 동시에 발생하는 전례 없는 양상을 보인다.
핵심 인사이트
- Box 창업자 Aaron Levie는 CEO들이 AI의 "마지막 1마일" 작업 현실을 이해하지 못해 잘못된 자동화 판단을 내린다고 진단했다.
- AI 낙관론자조차 CEO들의 과도한 AI 기대가 조직 내 현실과 괴리를 만들어 대규모 해고 등 부작용을 낳는다고 경고한다.
- 코드 검토, 버그 식별, 환각 라이브러리 탐지 등 AI가 아직 완전 대체하지 못하는 핵심 엔지니어링 업무가 존재한다.
- 투자자·경영진의 AI 기대치 과잉은 산업 전반의 인력 구조조정 결정에 직접적 영향을 미치는 리스크 요인이다.
Meta가 Instagram, Facebook, WhatsApp 세 플랫폼에 대한 유료 구독 서비스를 글로벌 정식 출시했다. Instagram Plus와 Facebook Plus는 월 $3.99, WhatsApp Plus는 월 $2.99로 각각 프로필 커스터마이징, 슈퍼 리액션, 스토리 인사이트 등의 추가 기능을 제공한다. Meta는 크리에이터·기업용 전문가 플랜과 AI 중심 플랜도 테스트를 시작하며, 이 모든 구독 서비스를 "Meta One" 브랜드로 통합할 예정이다. 이미 존재하는 Meta Verified는 별도 운영된다. 이번 움직임은 광고 의존도를 낮추고 수십억 명의 기존 사용자에게서 추가 수익을 창출하기 위한 수익 다변화 전략의 일환이다.
핵심 인사이트
- Meta는 Instagram Plus($3.99/월), Facebook Plus($3.99/월), WhatsApp Plus($2.99/월) 3종 구독을 글로벌 동시 출시하며 구독 경제에 본격 진입했다.
- "Meta One" 브랜드 아래 크리에이터·기업·AI 전용 플랜을 추가 테스트하며 구독 포트폴리오 확장을 예고했다.
- 광고 수익에 의존하던 Meta가 수십억 사용자 기반을 직접 수익화하는 구조로 전환, 플랫폼 성장 포화 상황에서 새 수익원을 창출한다.
- AI 특화 구독 플랜 도입은 Meta AI 서비스의 프리미엄화 전략이자, 경쟁사 대비 AI 수익 모델 차별화를 의미한다.
미국 연방항공청(FAA)이 SpaceX에 2026년 5월 22일 Starship V3 12차 비행시험에서 발생한 Super Heavy 부스터 사고에 대한 조사를 명령했다. 부스터는 단 분리 후 귀환 점화 시도 중 엔진 고장(또는 연속 고장)을 일으켜 Gulf of America 상공에서 추락·폭발한 것으로 추정된다. SpaceX는 조사 결과와 시정 조치를 FAA에 제출해 승인받기 전까지 추가 발사가 금지되며, 이는 6월 중순으로 예정된 SpaceX IPO 일정에 차질을 줄 가능성이 있다. V3 Starship은 3세대 Raptor 엔진 등 대폭 개선이 적용된 버전으로, 이번 사고는 첫 번째 V3 발사에서 발생했다.
핵심 인사이트
- FAA가 SpaceX에 Starship Flight 12 Super Heavy 부스터 사고 공식 조사를 명령, 추가 발사를 전면 중단시켰다.
- 3세대 Raptor 엔진 탑재 등 대폭 개선된 V3 Starship의 첫 비행에서 부스터 엔진 고장이 발생해 신뢰성 우려가 제기됐다.
- 조사 완료 및 FAA 승인 전까지 발사 재개 불가, 6월 중순 예정 SpaceX IPO 일정에 직접적인 불확실성 요소가 됐다.
- 부스터 엔진 고장 원인 규명 및 시정 조치 완료 여부가 향후 Starship 상업화 일정과 투자자 신뢰에 핵심 변수다.
자율 AI 소프트웨어 엔지니어 "Devin"을 개발한 Cognition이 25억 달러 프리머니 밸류에이션으로 10억 달러 규모의 투자 유치를 발표했다. 이는 8개월 전인 2025년 9월 4억 달러 라운드 당시 102억 달러 포스트머니 밸류에이션 대비 약 2.5배 급등한 수치다. 이번 라운드는 Lux Capital과 General Catalyst가 주도했으며, Founders Fund, 8VC, Ribbit Capital, Atreides, Layer Global 등이 참여했다. Cognition은 Mercedes-Benz, NASA, Goldman Sachs, Santander를 고객으로 보유하고 있으며, 연간 매출 반복 수익(ARR)이 4억 9,200만 달러에 달하고 최근 6개월간 월 50% 성장세를 이어가고 있다.
핵심 인사이트
- Cognition은 8개월 만에 밸류에이션이 102억 달러에서 250억 달러(프리머니)로 2.5배 급등하며 AI 코딩 스타트업 최고 수준에 올랐다.
- ARR 4억 9,200만 달러, 월 50% 성장(6개월 연속)은 엔터프라이즈 AI 코딩 시장에서 실질적 수익 창출 가능성을 입증했다.
- Anthropic Claude Code, OpenAI Codex, Google Jules 등 빅테크의 직접 경쟁에도 독립 AI 코딩 스타트업의 생존·성장 가능성을 VC들이 확인했다.
- Mercedes-Benz, NASA, Goldman Sachs, Santander 등 대형 엔터프라이즈 고객 확보는 AI 소프트웨어 엔지니어의 B2B 시장 침투가 본격화됨을 시사한다.
CrowdStrike가 Google 및 비영리 단체 Shadowserver와 협력해 오픈소스 소프트웨어 공급망을 2년간 공격해온 "Glassworm" 봇넷을 테이크다운(차단)했다. Glassworm 공격자들은 개발자 마켓플레이스에 악성 확장 프로그램 배포, 악성 광고(malvertising), 이전 해킹으로 탈취한 자격증명 재사용 등 세 가지 전략을 활용했으며, 결과적으로 300개 이상의 GitHub 코드 저장소를 오염시켰다. CrowdStrike는 개발자 워크스테이션 한 대가 침해되면 수천 개의 다운스트림 조직과 사용자에게 공급망 피해가 연쇄적으로 확산될 수 있다고 경고했다.
핵심 인사이트
- CrowdStrike, Google, Shadowserver 3자 협력으로 2년간 활동한 Glassworm 봇넷을 성공적으로 테이크다운해 공급망 보안 공조의 중요성을 입증했다.
- Glassworm은 악성 확장 프로그램, malvertising, 자격증명 재사용 등 3가지 공격 벡터로 300개 이상의 GitHub 저장소를 오염시켰다.
- 개발자 워크스테이션 단 1대 침해가 수천 개 다운스트림 조직에 연쇄 피해를 유발하는 소프트웨어 공급망 공격의 위험성이 재확인됐다.
- 오픈소스 생태계와 GitHub에 대한 신뢰를 악용하는 공급망 공격이 증가하며 기업 보안 투자 및 개발자 보안 교육 수요가 높아지고 있다.
중국이 최정상급 AI 인재들에 대한 출국 제한을 강화하고 있다. 주요 AI 연구자·스타트업 창업자·기업 임원들은 해외 출장 시 정부 사전 승인을 받아야 하며, 2025년 3월 이후 대미국 방문도 자제 권고를 받았다. 특히 Meta가 Manus AI를 20억 달러에 인수한 후 Manus 공동창업자 2인의 출국이 금지됐으며, 중국 정부는 이 거래를 외국인 투자 규정 위반 여부로 조사 중이다. Stanford AI 지수에 따르면 2023년 31%에 달했던 미·중 상위 모델 성능 격차는 2026년 3월 기준 2.7%로 급격히 축소됐다.
핵심 인사이트
- 중국 정부가 AI 인재를 국가 안보 자산으로 규정하고 출국 제한을 통해 핵심 인재 유출을 제도적으로 차단하고 있다.
- Meta의 Manus AI 20억 달러 인수에 대해 중국이 외국인 투자 규정 위반 조사를 개시하고 창업자 출국을 금지하는 등 AI 기업 M&A에 강력한 통제를 시작했다.
- Stanford AI 지수상 미·중 상위 모델 성능 격차가 2023년 31%에서 2026년 3월 2.7%로 급감, AI 기술력 격차가 사실상 消滅 수준에 접근했다.
- 중국이 Moonshot AI, StepFun, ByteDance 등 주요 AI 기업의 미국 자본 유입에도 정부 승인을 요구, AI 산업 전반에 대한 국가 통제를 강화하고 있다.
프린스턴대 출신 핵융합 스타트업 Thea Energy가 U.S. Innovative Technology Fund 주도로 1억 달러 규모의 시리즈 B를 초과 달성해 총 민간 투자액 1억 3천만 달러를 기록했다. 이번 자금은 소형 직사각형 자석 양산 설비 확장과 "전력 플랜트 수준" 실증 장치 Eos의 건설 착수(2027년 예정)에 사용된다. Thea는 일반적인 토카막 방식이 아닌 스텔라레이터 방식을 채택하며, 소프트웨어로 조정 가능한 모듈형 직사각형 자석을 픽셀처럼 배열해 복잡한 자기장 형태를 구현하는 독자 기술을 보유하고 있다. Eos 완공은 2030년, 상업용 원자로는 그 이후를 목표로 한다.
핵심 인사이트
- Thea Energy는 시리즈 B 1억 달러 초과 달성으로 총 누적 투자액 1억 3천만 달러를 기록, 상위권 핵융합 스타트업 반열에 올랐다.
- 소프트웨어 제어 모듈형 직사각형 자석 기술로 스텔라레이터의 복잡성·비용 문제를 해결, 기존 핵융합 방식과 차별화된 독자 노선을 제시했다.
- 2027년 Eos 실증 장치 착공, 2030년 완공 목표로 핵융합 상업화 일정이 구체화되며 에너지 섹터 딥테크 투자 열기를 반영한다.
- 토카막 대비 플라즈마 안정성이 높은 스텔라레이터 방식 채택은 장기적 상업 운전 신뢰성에서 유리할 수 있어 투자자 주목을 받는다.
클라우드 데이터 저장 기업 Snowflake가 Amazon Web Services와 5년간 60억 달러 규모의 신규 계약을 체결했다. Snowflake는 2012년 창사 이래 AWS Marketplace를 통해 누적 70억 달러의 서비스를 판매해왔으며, 이번 계약은 그 거의 전체에 맞먹는 규모다. 특히 이번 계약에서 Snowflake는 AWS의 자체 ARM 기반 CPU 칩 Graviton에 대한 접근권을 확대하기로 했다. AI 에이전트 시대에 GPU가 훈련·추론을 담당하는 반면 CPU는 에이전트 관련 나머지 작업 대부분을 처리하며 사용량이 급증하고 있다. Snowflake의 AWS 기반 고객 지출은 2025년 한 해에만 두 배인 20억 달러로 증가했다.
핵심 인사이트
- Snowflake가 AWS와 5년 60억 달러 계약 체결, 창사 이래 AWS Marketplace 누적 매출 70억 달러에 육박하는 단일 계약으로 클라우드 의존도를 더욱 심화시켰다.
- Snowflake의 AWS 기반 고객 지출이 2025년 한 해 두 배(20억 달러)로 급증, Cortex AI 도구 수요가 성장의 핵심 동력임을 확인했다.
- AI 에이전트 보편화로 GPU 외 CPU(특히 Graviton) 수요가 폭발적으로 증가, Amazon 자체 칩이 가격 경쟁력으로 시장 점유율을 확대하고 있다.
- Amazon CEO Andy Jassy가 자체 AI 칩의 Nvidia 대비 우수한 가격 대비 성능을 공언, 자체 칩 기반 클라우드 생태계 구축 전략이 대형 고객 유치로 가시적 성과를 내고 있다.
FROST(Fingerprinting Remotely using OPFS-based SSD Timing)라는 새로운 사이드채널 공격 기법이 연구자들에 의해 발표됐다. 웹사이트가 방문자의 SSD I/O 타이밍을 JavaScript로 측정해 다른 탭에서 열린 사이트나 실행 중인 앱을 식별할 수 있다. 브라우저의 OPFS(원본 전용 파일 시스템)에 1GB 이상의 대용량 파일을 생성한 뒤, 컨볼루션 신경망(CNN)으로 SSD 경쟁 패턴을 분류하는 방식이다. 방문자 상호작용 없이도 공격이 가능하며, Apple M2 Mac에서 전체 공격이 실증됐다. 현재까지 실제 악용 사례는 보고되지 않았으나, 브라우저 제조사들이 OPFS 파일 크기 제한 등의 대응책을 검토 중이다.
핵심 인사이트
- FROST 공격은 방문자 클릭 없이 SSD 타이밍만으로 다른 탭·앱 활동을 추론 가능하며, 기존 브라우저 샌드박싱을 우회한다.
- 공격에 1GB 이상의 OPFS 파일이 필요해 대규모 악용 시 탐지 가능성이 높아지는 현실적 제약이 존재한다.
- CNN 기반 분류 모델 활용으로 하드웨어 측면 공격이 머신러닝과 결합되는 새로운 위협 패러다임을 보여준다.
- 브라우저 벤더가 OPFS 파일 크기 제한으로 방어할 수 있어 소프트웨어 패치만으로 위협 완화가 가능해 보인다.
NASA의 과학용 위성 2종이 이란에서 운용 중인 GPS 재밍 장치의 위치를 수 킬로미터 오차 내로 탐지할 수 있음이 실험으로 입증됐다. Zephr.xyz CEO Sean Gorman 연구팀은 이란 시라즈 인근에서 2026년 1월부터 활동 중인 재머를 대상으로 CYGNSS(8개 마이크로위성 군집)와 NISAR(미-인도 합동 SAR) 위성 데이터를 분석했다. CYGNSS는 재머 위치를 4.33km 이내로 추정했으며, NISAR는 6.26km 이내 정확도를 보였다. 두 시스템을 결합한 방식은 CYGNSS 단독보다 정확도가 높지 않았다. 이번 연구는 과학 위성 인프라가 항법 안전 모니터링 등 이중 목적으로 활용될 수 있음을 보여준다.
핵심 인사이트
- 허리케인 관측용 CYGNSS 위성이 지상 GPS 재머를 4.33km 정밀도로 탐지 가능해 이중 활용 가치가 입증됐다.
- 이란-미국·이스라엘 전쟁(2026년 2월 28일 발발) 이후 재머 출력이 더 증가해 항공·해운 항법 위협이 고조되고 있다.
- 과학 위성 데이터로 분쟁 지역 GPS 간섭 모니터링이 가능해 항공 계획 및 해상 운항 위험 구역 식별에 활용될 수 있다.
- 단일 위성 시스템(CYGNSS)이 융합 접근법보다 우수한 결과를 보여, 복잡한 데이터 융합이 항상 정확도를 높이지 않음을 시사한다.
Nvidia CEO Jensen Huang이 대만을 AI 혁명의 "진원지"로 만들겠다며 연간 1,500억 달러 투자 계획을 발표했다. 이는 4~5년 전 연간 100~150억 달러에서 10배 증가한 규모로, 2030년까지 대만에 새 본사를 완공할 예정이다. 이번 발표는 트럼프 행정부의 미국 내 AI 제조 허브 구축 계획과 정면으로 충돌하는 행보다. Nvidia는 지난해 4월 미국 내 AI 칩 생산을 처음 시작하며 5,000억 달러 규모의 미국 AI 인프라 구축을 약속했지만, 첨단 패키징 기술이 대만에 집중된 현실을 피할 수 없음을 인정하는 모양새다. 차세대 AI 시스템 Vera Rubin의 공급망 제약을 언급하며 TSMC와의 협력 심화 필요성을 강조했다.
핵심 인사이트
- Nvidia의 연간 대만 투자액이 4~5년 새 150억 달러에서 1,500억 달러로 10배 급증해 반도체 공급망의 대만 의존도가 더욱 심화됐다.
- 트럼프의 미국 제조 허브 정책과 Nvidia의 대만 투자 확대는 첨단 패키징 기술의 현실적 지리적 제약으로 인해 구조적으로 충돌한다.
- Vera Rubin 시스템의 전 생애 주기 공급망 제약 경고는 AI 인프라 수요 급증과 하드웨어 공급 능력 간의 심각한 불균형을 시사한다.
- 글로벌 테크 기업들의 2026년 AI 인프라 지출 합계가 7,500억 달러에 달해, Nvidia의 대만 투자는 시장 선점을 위한 필수적 공급망 확보 전략이다.
Roku가 10년 만의 최대 OS 개편을 단행하며 홈 스크린에 항상 표시되는 대형 광고 영역을 추가했다. 이전에는 화면 탐색 시에만 광고가 표시됐으나, 이제 기기를 켜는 순간부터 광고가 고정 노출된다. 이번 개편은 Roku의 광고 수익 의존도 심화와 맞닿아 있다. 최근 분기 실적에서 광고 수익은 3억 7,100만 달러, 플랫폼 사업 총이익은 5억 8,410만 달러를 기록한 반면 디바이스 사업은 1,910만 달러 손실을 냈다. Roku CEO는 새 홈스크린이 구독 가입과 광고 지원 콘텐츠 시청을 늘려 수익을 확대할 것으로 기대했다. 일부 사용자들은 원치 않는 콘텐츠 추천과 광고에 거부감을 표하고 있다.
핵심 인사이트
- Roku의 디바이스 사업이 분기 1,910만 달러 적자를 기록하며, TV 플랫폼 광고 수익 모델로의 전환이 불가피한 구조적 압박이 드러났다.
- 스마트 TV OS가 엔터테인먼트 인터페이스에서 광고 플랫폼으로 변모하는 트렌드가 가속화되고 있으며, 사용자 경험 저하는 불가피하다.
- AI 기반 앱 추천과 개인화 콘텐츠 큐레이션을 내세우지만, 실질적으로는 광고 노출 극대화가 핵심 목적임을 CEO 발언이 시사한다.
- 하드웨어를 저가 또는 손실로 공급하고 소프트웨어·광고로 수익화하는 Roku 모델은 스마트 TV 산업 전체의 수익 구조 변화를 예고한다.
JWST(제임스 웹 우주망원경)가 포착한 초기 우주의 "작은 빨간 점(little red dot)" Abell 2744-QSO1이 은하 없이 홀로 존재하는 초대질량 블랙홀임이 확인됐다. 빅뱅 후 7억 년 시점의 이 천체는 중력 렌즈 효과로 3번 복제 관측됐으며, 블랙홀 질량이 태양의 약 5,000만 배로 추정된다. 블랙홀 질량이 천체 전체 질량의 3분의 2 이상을 차지하는 것으로 분석됐는데, 이는 블랙홀이 주변 은하보다 훨씬 앞서 성장했음을 의미한다. 또한 블랙홀 광도-질량 관계가 130억 년에 걸쳐 변하지 않았음이 확인돼, 현재 우주에서 도출된 물리 법칙이 초기 우주에서도 동일하게 적용됨을 보여준다.
핵심 인사이트
- 블랙홀이 주변 은하 질량의 2배 이상을 차지해, 기존의 블랙홀-은하 공진화 이론에 근본적인 의문을 제기한다.
- 블랙홀 광도-질량 관계가 130억 년 전 초기 우주에서도 동일하게 성립함이 확인돼, 이 물리 법칙의 보편성이 입증됐다.
- 중력 렌즈를 통한 3중 이미지 관측이 블랙홀의 시간에 따른 물질 흡수량 변화를 추적하는 새로운 관측 방법론을 제시한다.
- 초기 우주에 은하 없이 존재하는 "벌거벗은 초대질량 블랙홀"의 존재는 JWST 시대의 새로운 천체물리학 분야를 열고 있다.
Infineon이 2026년 7월 1일부로 두 번째 가격 인상을 단행한다고 발표했다. 앞서 2026년 4월에도 한 차례 인상한 바 있으며, 이번 인상은 지정학적 긴장으로 촉발된 에너지·원자재·물류·서비스 비용 급등과 예상을 웃도는 수요 급증을 배경으로 한다. Texas Instruments도 같은 날짜에 PMIC, MOSFET 등을 포함한 두 번째 가격 인상을 실시할 예정이며, 중국의 MacMic은 IGBT 10%, Jiangsu JieJie Microelectronics는 MOSFET·IGBT를 10~20% 인상할 계획이다. 기관 투자자들은 이번 가격 인상이 단기 재고 보충이 아닌 구조적 수요 전환을 반영한다고 분석한다. AI 인프라 확장에 따라 파워 반도체 수요가 GPU를 넘어 전력 관리, 서버 파워 시스템, 고전압 MOSFET 영역으로 확대되고 있다.
핵심 인사이트
- Infineon이 2026년에만 두 번 연속 가격 인상 단행; 지정학·AI 이중 압박이 글로벌 파워 반도체 가격 구조를 상방으로 재편 중
- Texas Instruments의 데이터센터 매출이 Q1 기준 전년 대비 약 90% 급성장; AI 수요가 GPU를 넘어 파워 관리 IC 전 분야로 확산
- NVIDIA GB300 플랫폼 및 HVDC 아키텍처 도입으로 고전압 MOSFET·IGBT·전력 변환 부품 추가 수요 발생 전망
- 중국 파워 반도체 업체(MacMic, JieJie Micro)도 동반 인상 합류; 글로벌 파워 IC 가격 인상 사이클이 동·서양 공급자 모두에 걸쳐 구조화
TSMC가 2026년 하반기에 3nm 공정 가격을 최대 15% 인상하고, 2027년에는 추가로 5~10% 인상할 것으로 예상된다는 보도가 나왔다. 스마트폰 SoC 중심이던 3nm 수요가 AI 서버 교체 주기와 맞물리면서 NVIDIA, AMD, Google, AWS 등이 3nm 채택을 급속히 확대하고 있으며, 주요 클라우드 기업들의 자체 ASIC 개발 확대가 웨이퍼 수요를 추가로 끌어올리고 있다. TSMC 주요 3nm 생산 거점인 Fab 18의 가동률은 높은 수준을 유지하고 있으며, 월 생산 능력은 2026년 초 약 13만 장에서 2분기 약 16만~17만 5천 장으로 확대됐지만 AI 수요 증가 속도를 따라잡기 어려운 상황이다. TrendForce에 따르면 TSMC는 4Q25 기준 글로벌 파운드리 시장의 70.4%를 점유하고 있으며, 선단 공정뿐 아니라 CoWoS 패키징, SoIC 스태킹, CPO·실리콘 포토닉스 등 패키지 통합 영역에서도 핵심 역할을 담당하고 있다.
핵심 인사이트
- TSMC 3nm 웨이퍼 가격 2H26 최대 15%, 2027년 추가 5~10% 인상 전망; 3nm가 AI 칩 최적 양산 노드로 부상하며 공급 희소성 심화
- TSMC Fab 18 월 생산량이 2026년 초 13만 장 → 2분기 16만~17.5만 장으로 확대됐음에도 AI 수요 급증이 공급을 압도
- ASIC 수요 급증이 기존 GPU 중심 구조를 보완하며 TSMC 3nm 가동률의 구조적 상승 견인; 삼성파운드리의 가격 경쟁력 기회로 작용 가능
- CoWoS·SoIC·CPO·실리콘 포토닉스 등 패키징·광인터커넥트 영역에서도 TSMC 독점적 역할 강화; AI 랙 스케일 컴퓨팅 시대 TSMC 의존도 더욱 심화
Micron이 AI 주도 메모리 호황 속에 시가총액 1조 달러를 돌파하며 사상 최고가를 기록했다(올해 28번째 최고치). Micron은 메모리 시장의 타이트한 수급이 2026년을 넘어서까지 지속될 것으로 전망하면서 글로벌 생산 확장을 가속화하고 있다. 미국 버지니아 Manassas 공장에서 1α DRAM 양산을 시작해 DDR4 웨이퍼 생산량을 4배로 늘렸으며, Idaho 1 웨이퍼 생산 타임라인을 2027년 하반기에서 중반으로 앞당겼다. 일본 히로시마에는 약 9.5헥타르 부지에 차세대 HBM 공장을 건설 중이며, 싱가포르에는 NAND팹과 HBM 시설을 각각 구축하고 있다. 대만 Tongluo 공장 인수 이후 트윈 팹 건설도 여름부터 착공 예정이다. 인도 Gujarat 시설(2026년 3월 가동)은 최대 Micron 글로벌 생산의 10%를 담당할 수 있으며, 말레이시아도 NAND·DRAM·SSD 조립·테스트 허브로 기능한다. SK하이닉스·삼성전자와의 HBM 경쟁에서 Micron의 지리적·기술적 다각화가 가속화되고 있다.
핵심 인사이트
- Micron 시가총액 1조 달러 돌파(올해 28번째 최고가); HBM·DRAM·NAND 수급 타이트 2026년 이후 지속 전망이 밸류에이션 재평가 견인
- Idaho 1 웨이퍼 생산 일정 6개월 단축(2027년 하반기 → 중반), 일본 히로시마 HBM 팹 2028년 출하 목표; SK하이닉스·삼성 대비 생산 타이밍 격차 축소 시도
- 미국·일본·싱가포르·대만·인도·말레이시아 6개국 동시 확장; 지정학 리스크 분산과 AI 수요 대응을 위한 전방위 공급망 구축
- 인도 Gujarat 시설이 글로벌 생산의 최대 10% 담당 예정; 미국 CHIPS법 보조금과 인도·일본 국가 지원을 동시에 활용한 비용 최적화 전략
중국 당국이 Alibaba, DeepSeek 등 민간 AI 기업의 핵심 인재를 대상으로 해외 여행 시 사전 승인을 요구하는 제한 조치를 시행 중인 것으로 알려졌다. 기존에는 국영기업 주요 인사에게만 적용되던 조치가 민간 기업으로 확대된 것으로, 직책이나 소속보다 국가 전략적 중요도를 기준으로 제한 명단을 작성하고 있는 것으로 보인다. AI 스타트업 Manus의 경우, Meta가 인수한 후 중국 국가발전개혁위원회(NDRC)가 계약 해제를 명령했으며, 공동창업자 Xiao Hong과 Ji Yichao는 규제 당국과의 면담 후 출국 금지 처분을 받았다. Manus 측은 Meta 인수를 되돌리기 위해 약 20억 달러 이상의 가치평가로 외부 투자자로부터 약 10억 달러를 조달하는 방안을 모색 중이며, 홍콩 IPO를 추진하는 것도 검토하고 있는 것으로 전해진다.
핵심 인사이트
- 중국이 민간 AI 기업 핵심 인재를 사실상 '국가 자산'으로 분류하여 해외 이동을 통제; AI 기술 주권 강화 의도의 제도화
- Meta-Manus 인수 강제 해제 사례는 중국이 외국 기업의 중국 AI 인재·IP 획득에 국가 안보 심사권을 적극 행사하겠다는 선례 확립
- 해외 여행 제한 조치는 중국 AI 기업의 글로벌 인재 유치·유지를 어렵게 만들어 중장기적으로 기술 경쟁력에 역효과 우려
- Manus, Meta 인수 해제 후 홍콩 IPO 추진 검토; 미-중 기술 분리(디커플링) 압력이 중국 AI 스타트업의 자금 조달·상장 경로를 재편
중국 장비 업체 Zhongwei Precision Instrument가 8인치 SiC 레이저 리프트오프(LLO) 기술에서 재료 손실을 40μm 이하로 줄이는 데 성공해 양산에 적용했다고 발표했다. 기존 업계 기준인 60~80μm 손실 장벽을 최초로 돌파한 사례로, 기존 와이어쏘 절단 방식(재료 손실 약 250μm, 마이크로크랙 위험)에 비해 절삭 손실을 약 80% 줄였다. 핵심 기술로는 자체 개발 레이저 광원, 정밀 광학 설계, 열효과 억제 알고리즘이 꼽힌다. 이 기술로 400μm SiC 잉곳에서 350μm 합격 기판을 안정적으로 생산할 수 있으며, 처리 시간은 기판 1장당 15분 이내로 기존 방식 대비 처리량이 20~30배 향상됐다. 소모품·화학 시약이 필요 없어 친환경적이며, 여러 선도 SiC 제조사에서 현장 검증 및 파일럿 배포를 완료한 상태다.
핵심 인사이트
- 재료 손실 40μm 이하 달성으로 기존 주류 수준 대비 30%↓, 와이어쏘 대비 80%↓; 8인치 SiC 웨이퍼 원가 경쟁력과 수율이 동시에 향상
- 처리 시간 15분/장, 기존 대비 처리량 20~30배 향상; SiC 웨이퍼 공급 병목 해소와 전기차·전력 반도체 대량생산 가속화 가능
- 소모품·화학 시약 불필요한 친환경 공정 채택; 글로벌 반도체 제조사의 ESG 요건 충족 및 운영 비용 절감에 유리
- 중국 장비 업체의 SiC 핵심 공정 기술 자립화 진전; 일본·미국 장비 의존도 낮추고 중국 SiC 공급망 내재화 속도 가속화
중국 반도체 자립화 움직임이 국가 주도를 넘어 Xiaomi, BYD, NIO 등 민간 대기업으로 빠르게 확산되고 있다. Xiaomi는 TSMC 3nm 공정 기반의 XRING O1(10코어 CPU·16코어 GPU)을 Xiaomi 15S Pro에 탑재했으며, 올해 차기 XRING O3(TSMC N3P 공정 추정)를 출시할 예정이다. O3는 Little Core 주파수가 3.02GHz로 O1 대비 약 68% 향상되고, GPU 클록도 1.5GHz로 25% 개선된다. BYD는 IGBT·SiC 자체 생산을 통해 중국 신에너지 차량 전력 모듈 시장에서 최대 점유율을 확보하고 있으며, IGBT·SiC 수요의 70~90%를 자체 조달한다. BYD의 자체 인텔리전트 드라이빙 칩 '玄骥(Xuanji)'는 2026년 2분기 양산 예정으로, 2,000 TOPS의 연산 성능을 제공하며 국제 대안 대비 원가가 1/3 수준이다. NIO의 Shenji NX9031 자율주행 칩(5nm)은 세계 최초 플래그십 자율주행 칩을 표방하며, 독립 법인 Shenji가 2025년 6월 설립돼 외부 고객 판매도 검토 중이다.
핵심 인사이트
- Xiaomi XRING, BYD Xuanji, NIO Shenji 등 중국 빅테크·완성차의 자체 칩 개발이 동시다발적으로 양산 단계 진입; Qualcomm·NVIDIA 등 글로벌 공급자 대체 가속화
- BYD가 IGBT·SiC 수요의 70~90%를 자체 조달하며 중국 신에너지 차량 전력 반도체 시장 최대 점유율 확보; 한국 파워 반도체 산업에도 경쟁 압력
- BYD Xuanji 칩이 국제 대안 대비 1/3 원가로 2,000 TOPS 성능 달성 주장; 가성비 경쟁력이 중국 내 자율주행 칩 시장 판도 변화 예고
- NIO의 Shenji가 독립 법인으로 분리 후 외부 고객 공급까지 노려; 중국 자율주행 칩 생태계가 내부 조달에서 상업화 단계로 진화
중국 휴머노이드 로봇 기업 Unitree Robotics가 2026년 6월 1일 상하이증권거래소(SSE) 상장 심사를 앞두고 어려운 실적을 공개했다. 2026년 1분기 매출은 전년 대비 68% 이상 급증한 4억 2,280만 위안을 기록했지만, 비경상항목 제외 조정 순이익은 52% 이상 감소한 4,030만 위안에 그쳤다(전년 동기 8,480만 위안). 이 회사는 4억 2,000만 위안(약 6억 1,890만 달러) 조달을 목표로 IPO를 추진 중이다. R&D·판매비 급증, 휴머노이드 로봇 붐의 모멘텀 둔화, 2025년 폭발적 성장에 따른 높은 비교 기준이 수익성 악화 요인으로 작용했다. 1분기 기준 휴머노이드 로봇 매출의 86.3%(2024년), 73.6%(2025년 1~3분기)가 연구·교육 기관 고객에서 발생해 상업적 수요 다각화가 과제로 남아 있다. Tesla Optimus, 중국 완성차·소비가전 기업들의 시장 진입이 경쟁 심화 요인으로 지목됐으며, 등록 특허도 262건(국내 발명 특허 20건)에 그쳐 IP 방어력이 취약하다는 지적이 있다.
핵심 인사이트
- 매출 +68% YoY에도 조정 순이익이 -52% 급감; R&D·판매비 급증과 규모 확대 비용이 휴머노이드 로봇 수익성 실현을 압박
- 매출의 70~86%가 연구·교육 기관 조달에 의존; 실질적 상업화·산업 현장 적용 전환이 더딘 구조적 취약점
- Tesla Optimus·중국 대기업 진입으로 경쟁 심화 예고; 특허 262건(발명 20건) 수준의 IP 포트폴리오는 기술 방어에 한계
- 42억 위안 IPO 추진 중 수익성 급락 공시; 투자자들은 2025년 고성장 모멘텀 지속 여부와 상업화 로드맵 구체성에 주목
일본 반도체 스타트업 Rapidus가 Lam Research의 패널 레벨 패키징(PLP) 시스템을 활용해 600mm 정방형 유리 기판 기반의 2.xD 패키징 기술을 개발 중이라고 밝혔다. Rapidus 엔지니어링 센터장 Orii Yasumitsu는 Lam의 오스트리아 잘츠부르크 패널 레벨 패키징 센터 오브 엑설런스(CoE) 개소 행사에서 두 회사가 긴밀히 협력하고 있다고 확인했다. Rapidus는 2027년 2nm 양산을 목표로 하는 동시에, 600mm 정방형 유리 기판 인터포저의 세계 최초 프로토타입을 공개(작년 말)하고 2028년 양산을 목표로 하고 있다. Lam의 Kallisto 전기도금(ECD) 시스템은 400mm×400mm~650mm×700mm 기판을 지원하며, 10μm 이하의 정밀 미세 배선이 가능하다. 다음 세대 Phoenix 플랫폼은 시간당 약 120패널의 처리량으로 Kallisto 대비 4배 향상을 목표로 한다.
핵심 인사이트
- Rapidus가 2nm 선단 공정과 600mm 유리 기판 패키징을 동시 추진; 칩렛·이기종 집적화 시대 일본 반도체 부활의 양축 전략
- Lam Research Kallisto 시스템이 600mm 패널 지원으로 대면적 패키징 기술의 양산 준비 단계 진입; 삼성·SK하이닉스의 패키징 로드맵에도 간접 영향
- Lam이 310mm와 510mm 두 포맷을 병행 개발하며 업계 표준 분열 선제 대응; 패널 레벨 패키징 생태계에서 장비 공급사 주도권 강화
- Rapidus의 유리 기판 인터포저 2028년 양산 목표는 Intel·삼성의 유리 기판 로드맵과 정면 경쟁; 선점 여부에 따라 AI 패키징 시장 판도 변화 가능
Alchip의 주요 고객사 AI 칩이 2026년 5월 양산에 돌입했으며, 이 제품이 올해와 내년 강력한 매출 성장의 핵심 동력이 될 것으로 Alchip 측은 전망했다. Alchip 회장 Johnny Shen은 실적 컨퍼런스콜에서 ASIC이 전체 시장 규모에서 GPU를 넘어서려면 아직 시간이 필요하지만, 현재 성장 모멘텀은 GPU보다 강하며 향후 CAGR에서 GPU를 앞지를 가능성이 있다고 밝혔다. GUC는 AI 컴퓨팅이 모델 훈련에서 엔드 애플리케이션으로 무게중심이 이동하면서 ASIC이 추론에서 GPU보다 와트당 성능 우위를 발휘할 수 있다고 언급했다. MediaTek은 첫 번째 ASIC 프로젝트가 예정대로 양산에 진입했고, 올해 AI ASIC 매출 기여 예상치를 기존 10억 달러에서 20억 달러로 두 배 상향했다. Amazon Trainium 3은 2Q26부터 램프업이 시작되며, 하반기로 갈수록 출하 모멘텀이 강화될 전망이다. Alchip은 3nm 용량이 메모리 부족보다 심각하게 타이트하다고 지적했으며, TSMC와의 파트너십 강화를 통한 선단 노드 확보를 최우선 과제로 꼽았다.
핵심 인사이트
- Alchip 주요 고객(북미 CSP)의 3nm AI 액셀러레이터가 2026년 5월 양산 돌입; 3Q26부터 분기별 매출이 강하게 반등하는 하반기 가속화 시나리오 확인
- MediaTek AI ASIC 매출 전망을 10억 달러 → 20억 달러로 2배 상향; 파운드리 설계 서비스 수주 경쟁이 삼성 파운드리와 TSMC의 ASIC 설계 생태계 전쟁으로 확전
- Alchip이 3nm 확보를 메모리보다 더 심각한 병목으로 지목; SK하이닉스·삼성의 HBM과 함께 TSMC 3nm 할당이 AI 인프라의 이중 제약 요소로 부상
- ASIC 추론 효율이 GPU 대비 와트당 성능에서 우위; 데이터센터 전력 비용 급증 시대에 ASIC 채택이 구조적으로 가속화될 전망
Micron이 J.P. Morgan 컨퍼런스에서 사업 전망을 이전 어닝콜보다 낙관적으로 상향 조정했다. HBM4E 표준 제품의 2027년 양산을 예고하며, 표준 및 커스텀 제품 모두의 로직 다이를 TSMC가 제조할 예정임을 확인했다. HBM4에서 1-beta DRAM을 사용 중인 Micron은 HBM4E 세대에서 1-gamma DRAM으로 전환할 계획이다. HBM·DRAM·NAND 전반의 타이트한 수급이 2026년을 넘어서까지 지속될 것으로 보고, 재정 전망도 강화됐다. 인도 Gujarat 시설의 메모리 생산 캐파시티는 수요 급증으로 이미 완판된 상태이며, Idaho 1 사이트의 웨이퍼 생산 타임라인도 2027년 하반기에서 중반으로 앞당겨졌다. Micron의 EVP는 AI 생태계가 사람-AI 상호작용에서 에이전틱·머신간 워크플로우로 전환되면서 메모리가 전략 자산화되고 있다고 강조했다.
핵심 인사이트
- Micron HBM4E 2027년 양산 예정, TSMC 로직 다이 채택 확정; SK하이닉스·삼성전자와의 HBM 경쟁이 1-gamma DRAM 기술력 싸움으로 심화
- HBM·DRAM·NAND 수급 타이트 2026년 이후에도 지속 전망; Micron FY26 Q3 기록적 잉여현금흐름 달성 궤도에 있어 주주환원 여력 확대
- 첫 5년 전략 고객 계약(SCA) 체결 후 NAND 포함 추가 고객과도 SCA 협의 중; 고객 락인(lock-in)을 통한 장기 수익 안정성 확보 전략
- 인도 Gujarat 메모리 공장 캐파 완판, Idaho 1 웨이퍼 타임라인 6개월 앞당김; 지정학적 공급망 다변화와 AI 수요 대응 가속화
Sandisk가 AI 추론 워크로드를 위한 고대역폭 플래시 메모리(HBF, High-Bandwidth Flash)를 제안했다. HBF는 16개 다이와 베이스 다이를 적층한 구조로 HBM과 동일한 풋프린트를 가지며, HBM 대비 8~16배 높은 용량(스택당 512GB)을 제공한다. 읽기 대역폭은 1.6TB/s이며, HBM4와 동일한 규격을 따른다. Sandisk는 2026년 하반기 샘플 출하, 2027년 초 HBF 탑재 추론 디바이스 샘플 제공을 목표로 한다. SK Hynix와 협력해 Open Compute Project(OCP)에 표준화를 제출한 상태다. 쓰기 속도의 구조적 한계로 인해 학습이 아닌 추론 전용이며, AI 모델 가중치(weights)를 패키지 내에 상주시켜 스토리지-DRAM-SRAM 경로를 우회함으로써 지연 시간과 에너지를 대폭 줄이는 것이 핵심 가치다.
핵심 인사이트
- HBF는 HBM4와 동일한 폼팩터로 GPU와 동일 패키지 내에 탑재되어 AI 추론용 가중치 저장 계층을 새롭게 정의한다.
- HBM 대비 8~16배 용량(최대 3Tb급)을 동일 대역폭·가격대에 제공해 대규모 LLM 추론의 메모리 병목을 해소할 잠재력이 있다.
- NAND의 구조적 쓰기 속도 한계로 훈련 워크로드 적용은 불가하며, 정적 가중치 추론에 특화된 기술 성숙도를 보인다.
- Sandisk·SK Hynix 주도 OCP 표준화 전략은 JEDEC 대비 빠른 사양 반복을 지향하며, 2027년 이후 AI 인프라 메모리 생태계 재편의 기폭제가 될 수 있다.
휴머노이드 로봇의 촉각·음성 기술이 빠르게 발전하고 있으며, 시각·운동 기능에 이어 차세대 핵심 경쟁 분야로 부상하고 있다. Cadence CEO Anirudh Devgan은 로보틱스 시장 규모를 25조 달러로 전망했으며, 중국은 2026년 휴머노이드 로봇 생산량이 94% 증가할 것으로 예상된다. 촉각 센서는 커패시티브·압전·광학·자기·저항 방식 등 다양한 기술이 병존하며, Synaptics는 5×5mm(60채널) 격자 센서와 머신러닝 기반 MCU 전처리를 통해 호스트 부하를 최소화한다. 폐루프 손가락 제어에는 기가비트 이상 통신(Ethernet, SerDes FPD-Link)이 필요하며, 음성 기술은 3년 전 대비 100배 성능 향상이 이루어졌다. Nvidia는 Cadence와 협력해 물리 AI 칩 IP와 로보틱스 시뮬레이션 라이브러리를 결합, sim-to-real 갭을 해소하는 agentic AI 워크플로우를 개발 중이다.
핵심 인사이트
- Synaptics·TI·Grinn 등이 손가락 관절 단위 MCU 전처리 아키텍처를 구현하며, 촉각 센서의 고채널 데이터 분산 처리가 휴머노이드 손 설계의 핵심 반도체 과제로 자리잡았다.
- 음성 모델의 100X 성능 향상과 지역별 억양·연령 감지 수요가 에지 전용 LLM 가속기 및 다국어 음향 코덱 IC 시장을 빠르게 견인하고 있다.
- Nvidia-Cadence의 sim-to-real 협력은 물리 AI 칩 IP와 로보틱스 시뮬레이션 통합이 차세대 휴머노이드 SoC 설계의 핵심 기술 성숙도 지표가 될 것임을 시사한다.
- 중국의 2026년 휴머노이드 생산 94% 급증 전망은 촉각·음성 반도체 공급망 전반에서 단기 수요 급증을 유발하며, Synaptics·TI·Infineon 등 에지 AI IC 업체의 설계 수주 경쟁이 가열될 전망이다.
파운드리 최첨단 노드 용량이 Apple, Nvidia, Broadcom 등 소수 대형 고객에게 선점되면서, 중소 칩 개발사들은 첨단 노드 접근 자체가 차단되는 현실에 직면하고 있다. TSMC는 2nm 이하 나노시트 공정에서 수요가 공급을 크게 초과하며, 선단 노드 확보에는 6~12개월 이상 소요된다. 웨이퍼 가격 협상에서 파운드리는 수율·결함 밀도 데이터를 공개하지 않아 기업들이 자체 전문가를 통해 TSMC의 웨이퍼당 3만 달러 수준 가격의 적정성을 추정해야 한다. 중소 개발사들은 Samsung, GlobalFoundries, Intel Foundry 등 대안 파운드리를 활용하거나 칩렛+고급 패키징(CoWoS, EMIB, I-Cube, FOCoS)으로 경쟁력을 유지하는 전략으로 전환 중이다. EDA 자동화 도구가 설계 민주화를 통해 소규모 팀의 경쟁력을 보완하고 있으나, 고급 패키징의 비용·수율 위험 및 복수 벤더 칩렛 통합 책임 문제가 여전히 높은 진입 장벽을 형성하고 있다.
핵심 인사이트
- TSMC 2nm 이하 나노시트 노드 용량의 대부분을 Apple·Nvidia·Broadcom이 선점, 중소 팹리스의 선단 노드 접근 실질적 차단.
- 칩렛+고급 패키징(CoWoS-L, EMIB, I-Cube, FOCoS)이 선단 노드 미접근 기업의 현실적 대안으로 부상하나 비용·복잡도 상승.
- EDA 자동화 및 AI 지원 설계 도구가 소규모 팀의 엔지니어링 오버헤드를 낮추며 칩 개발 민주화 진행 중.
- 경제력이 기술 로드맵을 결정하는 구조 고착화로, 반도체 생태계 내 대형 플레이어와 중소 개발사 간 격차 심화 전망.
D2S, Micron, HJL Lithography, Synopsys 전문가들이 curvilinear 마스크 시대의 검사(inspection)·계측(metrology) 한계를 심층 논의했다. High-NA EUV 전환 시 인쇄 가능한 결함 크기가 15nm 이하로 작아지면서 actinic EUV 검사의 물리적 한계(고각도에서 다층막 반사율 저하로 인한 대비 손실)와 e-beam multi-beam 검사의 처리량 문제가 동시에 부각된다. curvilinear 마스크의 mask data prep 전 과정이 curvilinear-native 포맷으로 전환되어야 하며, ILT·OPC 연산에 GPU/HPC 활용이 필수적이다. 계측 측면에서는 Manhattan 기하학과 달리 곡선 패턴의 Critical Dimension(CD), Line-Width Roughness(LWR) 정의 자체가 새로운 수학적 난제로 부상했으며, Edge Placement Error(EPE)의 통계적 측정이 차세대 표준으로 수렴 중이다. MRC(Mask Rule Check) 역시 rule-based에서 model-based로 전환이 불가피하며, D2S는 ILT 출력이 본질적으로 curvilinear임을 강조하며 fracturing 단계 자체의 불필요성을 주장했다.
핵심 인사이트
- High-NA EUV에서 15nm 이하 결함 검사의 물리적 한계로, actinic EUV와 multi-beam e-beam 검사 모두 근본적인 기술 혁신이 필요한 임계점에 도달했다.
- curvilinear 마스크 전환은 mask shop 내 데이터 흐름 전체(입력-작성-검사-계측)의 native 포맷 통일 없이는 TAT(Turn-Around Time) 개선이 불가능하며, GPU/HPC 투자가 전제 조건이다.
- EPE 통계적 측정 방식이 curvilinear 계측 표준으로 수렴 중이나, 메모리·로직 제조사 간 접근법 차이로 업계 통일 표준 수립에 2년 이상 소요될 전망이다.
- model-based MRC로의 전환이 불가피해 EDA 벤더의 검사 시뮬레이션 통합 솔루션 수요가 증대되며, D2S·Synopsys 등 curvilinear-native 툴체인 공급사의 경쟁 우위가 강화될 전망이다.
chiplet 기술의 경제성이 데이터센터와 소비자 시장에서 어떻게 다르게 작동하는지를 심층 분석한 기사다. 모놀리식 다이를 10개의 chiplet으로 분리하면 마스크 세트, 웨이퍼 처리, 검사 등 모든 비용이 10배로 증가한다. 그러나 2nm 노드의 마스크 세트 비용이 65nm 대비 30배에 달하는 현실에서, 최첨단 공정 사용 면적을 최소화하면 전체 비용이 낮아질 수 있다. 데이터센터의 경우 소비 전력 내 최대 성능이 최우선이므로 경제성보다 기술적 가능성이 의사결정을 주도한다. 반면 MCU 등 소비자 시장은 고급 패키징 비용을 감당할 수 없어 chiplet 채택이 제한적이다. chiplet 마켓플레이스가 형성되면 단일 고객이 아닌 여러 고객이 비용을 분담하게 되어 경제성이 개선될 수 있으나, 아직 표준화 및 공급망 정착이 숙제로 남아 있다.
핵심 인사이트
- 2nm 마스크 세트 비용은 65nm 대비 30배 수준으로, chiplet 분산 전략이 전체 비용 절감의 핵심 레버로 작용한다.
- 데이터센터 AI칩 시장은 경제성보다 기술적 한계(레티클 크기 초과)가 chiplet 도입을 강제하고 있어, 가격 민감도가 낮다.
- MCU·소비자 시장은 고급 패키징 비용이 장벽으로 작용해, 패키징 비용 하락 없이는 chiplet의 소비자 시장 진입이 어렵다.
- chiplet 마켓플레이스 성공 여부가 장기 경제성을 결정하며, 2.5D EMIB 방식이 3D 전체 풋프린트 표준화보다 현실적인 경로로 평가된다.
chiplet과 실리콘 포토닉스 시대가 도래하면서 저온 솔더(Low-Temperature Solder, LTS)가 반도체 패키징의 핵심 소재로 부상하고 있다. 기존 표준 솔더인 SAC305는 235~250°C의 리플로 온도가 필요하지만, 주석-비스무트(Sn-Bi) 기반 LTS는 150°C에서 리플로가 가능해 70°C 낮다. 이 차이는 대형 이종 패키지의 warpage(휨) 문제를 크게 줄이고, 열에 민감한 실리콘 포토닉스·LED 모듈·플렉스 회로와의 호환성을 확보해 준다. 탄소 배출 측면에서도 SMT 라인 1개당 연간 57톤의 CO2를 절감할 수 있어 업계 전체로는 연 35,000~50,000톤 감축이 가능하다. 단, Sn-Bi 솔더의 취성(brittleness) 문제와 electromigration 특성이 열등한 점이 과제로, 은(Ag)·니켈(Ni) 첨가 합금과 Intense Pulsed Light(IPL) 솔더링 공정이 해결책으로 연구되고 있다.
핵심 인사이트
- Sn-Bi 기반 LTS의 리플로 온도 150°C는 SAC305 대비 70°C 낮아 실리콘 포토닉스 통합 패키지의 열 스트레스 문제를 원천 해결한다.
- Hypoeutectic Sn60Bi40 솔더가 eutectic Sn58Bi42 대비 electromigration 특성이 우수해 SAC305 대체 유력 후보로 떠올랐다.
- Samsung이 개발한 IPL(Intense Pulsed Light) 솔더링은 열 사이클 신뢰성을 1,200→1,900회로 58% 향상시키며 carbon footprint도 동시에 감소시킨다.
- AI 데이터센터 확장에 따른 실리콘 포토닉스 수요 급증이 LTS 채택을 가속화해 관련 소재·장비 업체에 새로운 성장 기회를 만들고 있다.
반도체 포토마스크 기술이 High-NA EUV 도입과 curvilinear(곡선형) 패턴 확산으로 새로운 복합 도전에 직면하고 있다. Micron, D2S, Synopsys, HJL Lithography 전문가들은 마스크 결함 검사와 수리(inspection & repair)가 여전히 최대 병목이라고 진단했다. Multi-beam mask writer(MBW) 도입으로 마스크 작성 시간은 개선됐으나, 검사-확인-수리-재확인의 반복 사이클이 리드타임을 지배하고 있다. curvilinear 마스크는 생산 현장에서 실효성이 입증됐지만, 마스크샵 간 검증·규격 기준이 통일되지 않아 양산 확대의 장벽이 되고 있다. 데이터 볼륨 문제는 절대적 한계보다는 턴어라운드 타임 증가로 현실화되며, GPU/HPC 가속 ILT·OPC가 해결책으로 채택되고 있다. SEMI P49 표준화 작업과 eBeam Initiative 조사에서 데이터 인프라, ILT, 계측(metrology)이 3대 curvilinear 도입 장벽으로 확인됐다.
핵심 인사이트
- EUV 마스크 결함 검사·수리 사이클이 최대 병목으로, 단순 처리 속도가 아닌 결함의 wafer printability 판별 능력이 차세대 핵심 요건이다.
- curvilinear 마스크는 양산 적용이 시작됐으나, 마스크샵 간 자격인정(qualification) 기준 불일치로 표준화가 시급한 상황이다.
- GPU 가속 ILT/OPC와 scalable compute 인프라 투자가 curvilinear 전환의 실질적 병목인 데이터 처리 속도를 해소하는 핵심 수단으로 부상했다.
- MBW 보급이 Manhattan과 curvilinear 마스크 간 비용 격차를 줄이면 critical layer 전면 curvilinear 전환이 가속화돼 EDA·마스크 장비 공급사에 새로운 수요를 창출한다.
IMAPS Memory Summit에서 Synopsys, Intel, Samsung SSI, Credo 전문가들이 데이터 이동 표준화와 리소스 공유의 현실적 복잡성을 논의했다. AI 워크로드 증가로 인한 열 변화, 실시간 에러 발생, 채널별 노화 불균형 등의 문제를 해결하기 위해 엔드-투-엔드 시뮬레이션과 지속적 헬스 모니터링이 핵심 전략으로 제시됐다. 인터커넥트 계층 구조는 물리 계층(PCIe/CXL)부터 링크·트랜잭션 계층까지 이어지며, CXL은 현재 메모리 풀링 용도로 이미 상용 가능한 반면 UALink는 아직 실제 디바이스가 없는 상태다. Synopsys는 향후 2년 내 설계에서 UALink는 가속기-가속기 스위치 연결에 CXL과 병행 사용될 것이며, 호스트-가속기·호스트-SSD 연결은 PCIe/CXL이 주도할 것으로 전망했다. 하이퍼스케일 환경에서는 균일한 스펙 적용과 검증 효율화가 혼재된 멀티-인터커넥트보다 우선시되며, 전문화된 틈새 인터커넥트의 고볼륨 공존이 미래 표준 생태계의 현실적 형태로 부상하고 있다.
핵심 인사이트
- CXL 컨트롤러·메모리·스위치가 현재 이미 상용화된 반면, UALink는 실제 디바이스가 없어 설계 적용 시 CXL이 단기 기본 인터커넥트 역할을 독점한다.
- AI 에이전트의 워크로드 변동과 열 변화로 인한 런타임 장애 증가는 엔드-투-엔드 시뮬레이션 및 온칩 헬스 모니터링 솔루션 수요를 빠르게 확대시키고 있다.
- RAS(신뢰성·가용성·서비스성) 구현이 칩렛 혼합 패키지 환경에서 극도로 복잡해지며, 패키지 수준의 공통 신호·변수 표준화가 차세대 설계의 핵심 과제로 부상하고 있다.
- 하이퍼스케일 데이터센터에서는 검증 비용 절감을 위해 단일 벤더 인터커넥트 통일이 선호되며, 틈새 고볼륨 인터커넥트 공존이 PCIe 단일 지배 구도보다 현실적인 미래 생태계 형태로 자리잡을 전망이다.
Gartner는 AI 에이전트를 도입한 조직의 40%가 거버넌스 실패로 인해 에이전트를 다운그레이드하거나 폐기하게 될 것이라고 전망했다. 핵심 원인은 에이전트의 자율성 수준과 접근 범위를 구분하지 않고 일률적인 통제를 적용하는 방식이다. Gartner 수석 애널리스트 Shiva Varma는 이를 "이진법적 거버넌스"라고 지적하며, 지나친 제한은 간단한 에이전트의 활용을 저해하고 그림자 개발을 유도하는 반면, 불충분한 제한은 고자율 에이전트에서 보안·컴플라이언스 위험을 높인다고 설명했다. SAP, Oracle, Workday, Salesforce 등 주요 엔터프라이즈 소프트웨어 기업들이 AI 에이전트를 적극 도입 중이나, 법적 책임은 벤더가 아닌 조직이 부담한다는 점도 강조됐다.
핵심 인사이트
- Gartner는 AI 에이전트 도입 조직의 40%가 거버넌스 실패로 에이전트를 폐기 또는 격하할 것으로 예측
- SAP·Oracle·Workday·Salesforce 등 엔터프라이즈 벤더의 AI 에이전트 과대 마케팅과 실제 거버넌스 현실 사이의 괴리가 도입 실패의 배경
- 에이전트는 인간 감독 속도를 초과하는 스케일·속도로 작동하며, 이를 제어할 회로 차단기·롤백 메커니즘 등 기술적 안전장치가 필수
- AI 에이전트 오작동 시 법적 책임은 벤더가 아닌 도입 조직에 귀속되는 법적 리스크 구조가 기업 투자 결정에 중요 변수로 부상
스탠퍼드 대학 주도 연구팀이 AI 채용 플랫폼 pymetrics(현 Harver)의 데이터를 분석한 결과, AI 채용 알고리즘이 흑인 및 아시아계 지원자를 체계적으로 더 많이 탈락시키는 것으로 확인됐다. 2018~2022년 사이 4,197,168건의 채용 지원 데이터를 분석한 결과, 흑인 지원자의 26%, 아시아계 지원자의 15%가 해당 AI 시스템이 인종 차별적 판단을 내린 직군에 지원한 것으로 나타났다. 동등한 기회가 보장됐다면 약 40,000명의 추가 지원자가 다음 심사 단계로 진출했을 것으로 추산된다. 또한 동일한 알고리즘을 사용하는 여러 기업에 복수 지원할 경우, 알고리즘 모노컬처로 인해 탈락 확률이 더욱 높아지는 '복합 차별' 현상도 확인됐다.
핵심 인사이트
- 4백만 건 이상 채용 데이터 분석에서 AI 알고리즘의 인종 편향이 통계적으로 입증됨: 흑인 26%, 아시아계 15% 차별 피해
- 동일 AI 벤더를 사용하는 156개 기업(연매출 합산 2,250억 달러)이 형성한 '알고리즘 모노컬처'가 차별 효과를 시장 전반으로 증폭
- 미국 EEOC의 "4/5 규칙" 기준으로도 위반이 확인되어 향후 규제 당국의 AI 채용 도구 조사 강화 가능성
- 채용 AI 시스템에 대한 독립적 제3자 감사 의무화 필요성 부각, 인사 AI 서비스 시장 전체의 신뢰성 위기로 이어질 수 있음
교황 레오 14세가 발표한 회칙 "Magnifica Humanitas"에서 AI를 인간 지능과 동일시하지 말라고 경고한 것과 관련해, Anthropic 공동창업자 Chris Olah가 바티칸 발표 행사에서 AI 모델이 신비롭고 유기적인 존재라는 주장을 펼쳤다. Olah는 AI가 "우리의 언어로 만들어졌으며, 훈련시키는 당사자들에게도 여전히 신비롭다"고 발언했다. The Register는 이를 비판적으로 분석하며, AI 모델은 텐서와 메타데이터의 이진 집합체일 뿐이며, Anthropic이 강조하는 "신비"는 훈련 데이터 출처 미공개와 100건 이상의 저작권 소송이라는 현실을 은폐한다고 지적했다. AI의 불투명성은 영적 신비가 아닌 데이터 투명성 결여에서 비롯된다는 반론이다.
핵심 인사이트
- 교황청이 AI를 공식 신학 문서(회칙)에서 다룬 것은 사회적 규범 형성에서 AI 윤리 논쟁이 최고위 기관으로 확산됐음을 의미
- Anthropic 등 AI 기업 경영진의 AI 의인화 담론은 훈련 데이터 무단 수집 및 저작권 소송(100건 이상)과 모순되는 공중 관계 전략
- AI 모델의 "불투명성"은 기술적 복잡성보다 개발사의 정보 비공개 정책에서 기인하며, 이는 규제 논의에서 핵심 쟁점
- AI 기업의 공개 커뮤니케이션 방식이 규제 당국 및 여론의 신뢰 형성에 직접 영향을 미치는 만큼, 의인화 마케팅에 대한 역풍 가능성
Okta가 의뢰하고 Apprize360이 수행한 설문조사(AI Agents at Work 2026)에서 응답 기업의 58%가 지난 12개월 내 AI 관련 보안 사고 또는 아차 사고를 경험했음에도 불구하고, 경영진의 90%는 AI 도구에 대한 충분한 가시성을 확보하고 있다고 자신한다는 결과가 나왔다. 지식 노동자의 52%는 미승인 AI 도구를 사용하고 있으며, 이 중 16%는 로그인 자격증명을 비승인 AI 도구에 제공한 것으로 확인됐다. 조사는 미국, 영국, 호주, 캐나다, 일본, 프랑스, 독일 7개국 292명 임원과 492명 지식 노동자를 대상으로 2026년 3월 진행됐다.
핵심 인사이트
- 경영진 90%가 AI 가시성에 자신하나, 지식 노동자 52%가 미승인 AI 사용을 인정해 경영진-현장 간 인식 격차가 극단적으로 큰 상황
- 전체 응답 기업 58%가 1년 내 AI 보안 사고 경험: 실제 침해(26.7%)와 사전 차단 아차 사고(31.2%)로 구성되어 "Shadow AI"가 현실적 위협임을 입증
- 직원들이 미승인 AI 도구에 기밀 문서, HR 정보, 로그인 자격증명(16%)을 제공하는 행위가 조직 공격 표면을 급격히 확대
- Okta, AI 보안 거버넌스 시장 선점 목적으로 자체 연구 결과를 공개: 신원 중심 통제(identity-centric controls), 자동화 탐지, 샌드박스 등을 해결책으로 제시
Broadcom이 한국 AI 반도체 스타트업 FuriosaAI를 커스텀 ASIC 파트너로 추가했다. FuriosaAI의 3세대 칩은 Broadcom의 고급 패키징 기술(3.5D XDSiP)을 활용해 2nm 공정으로 제조되며, HBM4 또는 HBM4e 듀얼 레이어 메모리를 탑재한 멀티 다이 시스템온패키지 구조로 설계된다. 또한 Broadcom의 Ethernet 및 PCIe 제품을 사용해 8개 칩 이상의 대규모 시스템 구성을 지원할 예정이다. FuriosaAI의 현재 2세대 RNGD 칩은 FP8 기준 512 TFLOPS, HBM3 48GB, 1.5TB/s 대역폭을 제공하며 TDP는 180W로, Nvidia B200(FP8 9배, 메모리 4배, TDP 1,000W) 대비 낮은 전력 소비가 강점이다.
핵심 인사이트
- Broadcom이 Google TPU, Meta MTIA 등에 이어 FuriosaAI를 파트너로 확보하며 커스텀 AI ASIC 생태계를 지속 확장, Nvidia GPU 독점 구도를 견제
- FuriosaAI 3세대 칩의 2nm 공정 + HBM4/4e + 3.5D 패키징 조합은 고성능 AI 추론 시장을 겨냥한 차세대 사양으로, 경쟁력 있는 전력 효율이 핵심 차별점
- Broadcom의 3.5D XDSiP 기술이 신규 칩 개발사의 설계 리스크와 비용을 낮춰, AI 반도체 시장 진입 장벽을 낮추는 플랫폼 역할로 확대
- Ethernet 기반 스케일아웃 네트워킹(Tomahawk 6) 채택은 NVLink 중심의 Nvidia 에코시스템에 대한 오픈 표준 대안이 성숙하고 있음을 시사
비영리 AI 연구 재단 Aithos가 개발한 LARA(Legal Assessment for Real-world Agents) 도구로 주요 LLM을 평가한 결과, 모든 주요 AI 모델이 EU 법규(GDPR, EU AI Act) 준수 테스트에 낙제한 것으로 나타났다. 최악의 모델인 Moonshot AI의 Kimi K2.6은 테스트 시나리오의 93%에서 위반이 발생했으며, 가장 양호한 Anthropic Claude Opus 4.7도 준수율은 약 54%에 불과했다. 테스트 항목에는 노인 착취, 개인정보 수집, 비밀 모니터링, 취약 사용자에 대한 프리미엄 서비스 강매 등이 포함됐다. Aithos는 AI 에이전트를 기반으로 제품을 출시한 개발사와 해당 에이전트를 배포한 조직이 AI 모델 제조사 대신 법적 책임을 부담할 수 있다고 경고했다.
핵심 인사이트
- 주요 프론티어 LLM 전체가 EU 규정 준수 실패: 최고 성적의 Claude Opus 4.7도 준수율 54%에 그쳐 현재 AI 모델의 구조적 컴플라이언스 결함이 입증됨
- Kimi K2.6(Moonshot AI)의 93% 위반율은 중국계 LLM의 EU 규범 호환성이 특히 낮음을 시사하며, 글로벌 시장 진출 전략에 영향
- EU AI Act 및 GDPR 위반 시 법적 책임이 모델 제공자가 아닌 AI 에이전트 개발자·배포 조직에 귀속되어, 기업의 AI 도입 법적 리스크가 대폭 상승
- LARA 같은 제3자 AI 컴플라이언스 평가 도구 시장의 성장과 독립적 AI 감사 의무화 규제 논의가 가속화될 전망
AWS가 Graviton 프로세서 기반의 새로운 Redshift RG 인스턴스를 출시하며 기존 RA3 대비 최대 7배 빠른 쿼리 성능과 30% 낮은 vCPU당 비용을 달성했다고 밝혔다. RG 인스턴스는 데이터 웨어하우스와 데이터 레이크를 단일 엔진으로 쿼리할 수 있으며, Apache Iceberg 기준 RA3 대비 2.4배, Apache Parquet 기준 1.5배 성능을 제공한다. AWS VP Andrew Warfield는 AI 에이전트가 자연어로 데이터를 쿼리하면서 기존 SQL 전문가 대비 쿼리 발생 빈도가 급격히 증가하고 있어, 이 성능 향상이 에이전트 기반 워크로드 대응에 필수적이라고 설명했다. 인스턴스는 미국, 유럽, 아시아태평양 등 주요 AWS 리전에서 시간당 과금 및 예약 인스턴스 방식으로 제공된다.
핵심 인사이트
- Graviton 기반 Redshift RG 인스턴스가 RA3(2019년) 대비 최대 7배 성능·30% 비용 절감 달성으로, AWS 자체 CPU 설계의 데이터 분석 경쟁력이 입증됨
- AI 에이전트의 체인-오브-리즈닝 구조가 기존보다 훨씬 많은 대화형 쿼리를 생성하여 데이터 웨어하우스에 새로운 성능 요구사항을 부과하는 추세가 가시화됨
- 단일 엔진으로 데이터 웨어하우스(Redshift)와 데이터 레이크(Iceberg, Parquet)를 통합 쿼리하는 데이터 레이크하우스 아키텍처가 AWS 전략의 중심으로 부상
- AWS가 Graviton 최적화 Redshift를 AI 에이전트 시대의 핵심 인프라로 포지셔닝, Snowflake·Databricks 등 경쟁사 대비 비용-성능 우위 확보가 핵심 과제
Alibaba 산하 연구소 DAMO Academy가 자체 개발 RISC-V 프로세서인 XuanTie 9 시리즈에서 Android 16 구동에 성공했다고 밝혔다. DAMO Academy는 RVA23 아키텍처 프로파일을 지원하는 프로세서로 Android 16을 실행한 최초 사례라고 주장하며, 관련 성과를 "1차 XuanTie 전략 고객사"와 공유했다. 이번 성과는 중국 정부의 국산 반도체·소프트웨어 스택 전환 정책과 맞닿아 있으며, Qualcomm·MediaTek 의존도를 낮추려는 중국 스마트폰·스마트 단말 제조사들의 관심을 끌 것으로 예상된다. 단, 아직 어떤 XuanTie 9 모델에서 구동됐는지는 공개되지 않았다.
핵심 인사이트
- Alibaba DAMO Academy가 RVA23 기반 RISC-V 프로세서에서 Android 16 최초 구동을 달성, 중국의 독립 모바일 소프트웨어 스택 구축에 의미 있는 이정표
- Qualcomm·MediaTek 의존도 탈피를 원하는 중국 단말 제조사들에게 XuanTie 기반 Android가 현실적 대안으로 부상하며, RISC-V 상용화 속도 가속 전망
- Huawei의 Harmony OS와 달리 Android를 유지하면서 RISC-V 칩으로 전환하는 전략은, 앱 생태계 호환성을 보존하면서 하드웨어 주권을 확보하는 실용적 접근
- RISE 프로젝트(RISC-V 소프트웨어 생태계)보다 앞서 성과를 낸 DAMO Academy의 행보는 중국 기업이 글로벌 RISC-V 생태계에서 선도적 기여자로 부상하고 있음을 시사
인도 사이버 비상대응팀(CERT-In)이 AI 보조 사이버 공격의 증가에 대응해 새로운 취약점 패치 권고 기준을 발표했다. 인터넷 연결 시스템 또는 핵심 인프라에 영향을 미치는 실제 악용 중인 취약점은 가능한 경우 12시간 이내에 패치, 완화 또는 노출 차단을 완료해야 한다고 권고했다. 내부 시스템의 CVSS 9.0 이상 취약점이나 알려진 악용 취약점에 대해서는 24시간 기준이 적용된다. CERT-In은 AI가 취약점 식별, 무기화, 악용 전 과정을 자동화하고 가속화하고 있으며, 에이전틱 AI의 급성장이 이 위협을 더욱 심화시키고 있다고 분석했다.
핵심 인사이트
- CERT-In의 12시간 패치 권고는 AI 자동화로 취약점 악용 사이클이 대폭 단축된 현실을 반영하며, 글로벌 보안 기관들의 패치 기준 재정립 흐름을 이끌 선례
- AI 에이전트가 정찰·익스플로잇·권한 상승·데이터 탈취까지 전 공격 단계를 자동화할 수 있어, 기존 인간 중심 탐지·대응 주기로는 한계에 봉착
- 인도의 디지털 인프라 확장(클라우드, 소프트웨어 공급망, OT 시스템)과 AI 기반 위협의 교차점이 특히 취약하며, 이는 인도 기업의 사이버 보안 투자 가속화 요인
- OpenClaw 등 소비자용 에이전틱 AI 도구의 일반화로 비기술 공격자도 자율적 사이버 공격을 수행할 수 있게 되어, 위협 행위자 수와 기술 장벽이 동시에 변화
유럽 항공우주 기업 Airbus가 프랑스 슈퍼컴퓨터 제조사 Bull(Eviden/Atos 산하)로부터 HPC-as-a-service 방식의 슈퍼컴퓨터를 도입했다. 서비스형 HPC 모델을 통해 Airbus는 대규모 선행 자본 투자 없이 항공기 설계, 유체역학 시뮬레이션, 구조 해석 등 컴퓨팅 집약적 엔지니어링 워크로드를 처리할 수 있게 됐다. 이번 도입은 유럽 항공우주·방산 산업에서 온프레미스 HPC 인프라를 서비스 구독 방식으로 전환하는 추세를 반영한다.
핵심 인사이트
- 항공우주 분야의 HPC-as-a-service 도입은 고성능 컴퓨팅 인프라의 소유에서 이용으로의 전환이 전통적 엔지니어링 산업에도 확산되고 있음을 보여줌
- Bull(Atos/Eviden)이 Airbus와의 파트너십을 통해 유럽 내 방산·항공우주 HPC 시장에서 AWS·Azure 등 미국 클라우드 대비 주권적 HPC 공급자로서의 입지를 강화
- 항공기 설계 시뮬레이션의 AI 가속화 추세와 맞물려 HPC-as-a-service 수요는 지속 성장할 전망이며, 서비스형 모델이 캐팩스 부담 없이 고사양 워크로드를 지원하는 핵심 수단으로 부상
- 유럽의 기술 주권(tech sovereignty) 정책 기조 속에서 비미국계 HPC 벤더(Bull, SiPearl 등)의 대형 계약 수주는 유럽 HPC 생태계 자립 전략의 일환
일리노이대 어바나-샴페인(UIUC) Qing Cao 연구팀이 200°C 이하 저온 공정으로 실리콘 기반 모놀리식 3D 칩을 제작하는 데 성공했다. 핵심은 접합이 없는 junctionless transistor로, p-n 접합 없이 모두 동일 도핑 타입으로 구성해 고온 공정 없이도 동작한다. 10nm 이하 두께의 단결정 실리콘 막을 롤-전사 인쇄 방식으로 적층해 75mm 웨이퍼에 3층 트랜지스터(층당 625개)를 집적했으며, 수직 정렬 정밀도는 10nm 이하다. SRAM 셀 풋프린트를 2D 대비 1/3로 줄였고 전류 밀도는 650mA/μm으로 구형 상용 MOSFET 수준에 근접했다. 2019년 시작해 2024년 핵심 장벽을 돌파한 이 기술은 현재 파운드리와의 협력을 추진 중이다.
핵심 인사이트
- [기술 성숙도] 2019년 연구 시작~2024년 핵심 장벽 돌파, 현재 파운드리 협력 추진 단계로 상용화까지 5~10년 예상
- [산업 영향] 기존 실리콘 생태계와 완전 호환 가능한 200°C 이하 공정으로 이종 소재(탄소나노튜브, 2D 반도체) 대비 채택 속도 압도적 우위
- [기술적 의미] 수직 연결 밀도가 TSV 기반 오늘날 3D 칩보다 수 자릿수 높아 AI 워크로드의 메모리-연산 간 통신 병목 직접 해소 가능
- [투자/비즈니스] SRAM 풋프린트 1/3 축소 등 면적 효율 혁신으로 단위 면적당 연산 밀도 극대화, 차세대 HBM·AI 가속기 설계에 파급 효과
5년 역사의 스타트업 Bolt Graphics가 Nvidia 대항 GPU 'Zeus'를 발표했다. AI 최적화에 집중한 Nvidia·AMD와 달리, Zeus는 FP64 벡터 코어와 path tracing 렌더링을 우선시해 과학 계산·전문 크리에이티브·GIS 등 고정밀 워크로드를 겨냥한다. Nvidia의 최신 GPU가 세대별로 저정밀(FP16/INT8/NVFP4) 연산 비중을 늘리는 추세 속에 FP64 수요를 파고드는 전략이다. Zeus는 PCIe 카드와 4-GPU 서버 랙 구성으로 출시 예정이며, 28-GPU 랙이 실시간 path tracing 기준 Nvidia RTX 5090 280개 분량의 성능을 목표로 한다. 다만 TSMC N5 구형 공정 채택과 드라이버 생태계 부족이 주요 과제다. Blender, Autodesk, SideFX와 협력 중이다.
핵심 인사이트
- [기술 성숙도] 드라이버 생태계가 없는 신생 GPU로 Intel Arc의 전철 가능성, 초기 전문 소프트웨어 3~5개 한정 지원으로 리스크 관리
- [산업 영향] AI 쏠림으로 인한 GPU 시장 세분화 가속 — 고정밀 과학·크리에이티브 워크로드는 Nvidia 독점에서 틈새 경쟁으로 전환 가능
- [기술적 의미] Path tracing 전용 아키텍처로 rasterization 대비 절반 성능 감수, 28-GPU 랙 = RTX 5090 × 280 상당의 실시간 path tracing 목표
- [투자/비즈니스] TSMC N5 구형 노드로 가격 경쟁력 확보 시도, 리딩엣지 공급 부족 속 현실적 선택이나 장기 성능 경쟁력 제약 우려
남아프리카공화국은 세계 백금족 금속(PGM) 매장량의 88%를 보유해 반도체·데이터센터 공급망에서 구조적 협상 우위를 지닌 유일한 개도국이다. 아프리카 최대 데이터센터 시장(2024년 21.6억 달러)을 보유하고, Huawei·Microsoft·Google·AWS·Oracle이 경쟁적으로 인프라를 구축 중이다. Huawei는 DeepSeek LLM을 클라우드·스토리지에 번들해 미국 기업보다 90% 저렴하게 제공하고 있다. Microsoft는 2027년까지 ZAR 54억(약 3억 달러)을 추가 투자 예정이다. 그러나 최근 철회된 AI 정책 초안은 PGM 레버리지를 전혀 활용하지 않고, 외국 컴퓨트 인프라에 최소 조건도 부과하지 않았다. 저자는 ZAR 5억 이상 투자에 대한 의무 조건, 컴퓨트 보고 임계치, AI 안전 기관 설립 등 구체적 정책 조항을 제안한다.
핵심 인사이트
- [기술 성숙도] AI 인프라 주권 확보의 골든윈도우가 닫히는 중 — 인프라 결정은 사후 재협상이 사실상 불가능
- [산업 영향] Huawei 90% 할인 공세 vs. 미국 하이퍼스케일러 API 종속 — 남아공 선택이 아프리카 전체 AI 인프라 협상 선례 형성
- [기술적 의미] 오픈웨이트 모델 + 로컬 호스팅만이 실질적 AI 주권 달성 수단, 데이터 주권 법제화 없이는 기술 이전 불가
- [투자/비즈니스] PGM 광물 레버리지를 협상 카드로 쓰지 않으면 광물 자원국이 AI 소비국으로 고착 — 한국 등 자원 빈국과 반대되는 구조적 아이러니
AI 기반 고래 탐지 시스템이 2026년 5월 19일 샌프란시스코 만에서 공식 가동을 시작했다. WhaleSpotter(매사추세츠 소머빌 소재)가 개발한 이 시스템은 Angel Island 블런트 포인트의 열화상 카메라로 7km 범위 내 고래를 탐지하고, 인간 전문가가 검증 후 미 해안경비대 선박 교통 서비스에 경보를 발령한다. 샌프란시스코 만은 2025년 역대 최다인 회색 고래 21마리가 폐사했으며, 그 중 40%가 선박 충돌로 인한 사망이었다. 2018년 이후 100마리 이상의 회색 고래가 기후변화로 인한 먹이 부족으로 베이에 기착하고 있으며, 만 진입 고래의 사망률은 18%로 추정된다. 시스템 가동 10일 만에 6,600건의 탐지를 기록했으며, WhaleSpotter는 기존 선박 탑재형 시스템이 선박 충돌 위험을 90% 감소시킨다고 밝혔다.
핵심 인사이트
- [기술 성숙도] 2020년 대서양 시험에서 높은 위양성 문제를 확인, 인간 검증 루프를 유지하며 AI 오탐 리스크를 관리하는 현실적 접근
- [산업 영향] 육상 고정 카메라 + 선박 탑재 카메라 최초 결합 방식으로 해운·해양생물 보호 교차점에서 새로운 인프라 모델 제시
- [기술적 의미] sEMG 대신 열화상의 픽셀 1~2개 수준의 고래 분출 감지 기술로 야간·안개 속 24/7 모니터링 가능, Woods Hole Oceanographic Institution 원천 기술
- [투자/비즈니스] Matson 컨테이너선 8척 등 상용 사례 보유, 해양 AI 탐지 플랫폼의 확장성·반복성 입증으로 항만·환경 규제 시장 진입 가속
뉴질랜드 와이카토대 Te Taka Keegan 교수팀이 마오리어(te reo Māori) 방언 Waikato-Maniapoto 전용 text-to-speech 모델을 개발해 데이터 주권 기반 소수 언어 AI의 청사진을 제시했다. 7시간 45분 분량의 녹음 데이터(업계 권장 수백 시간 대비 대폭 적은 양)만으로 단어 오류율 6.78%(업계 기준 '양호')를 달성했다. 핵심 기술 선택은 phoneme 기반 입력 방식과 오프라인 로컬 실행 가능한 Piper 아키텍처(오픈소스)였다. 68명의 원어민 청취자가 인간 음성과 합성 음성을 구별한 비율은 65%로, 화자 지인조차 일부 오답을 낼 만큼 자연스러운 음성 품질을 구현했다. 저작권은 법적으로 발화자 Ngaringi Katipa에 귀속되지만, 마오리 전통 개념으로는 3개 이위(부족)의 집단 소유다. Google이 자금을 지원했으나 소유권 조건은 없었다.
핵심 인사이트
- [기술 성숙도] 7.75시간 저자원 데이터로 WER 6.78% 달성 — 소수 언어 TTS의 데이터 최소요건 패러다임을 수백 시간에서 한 자릿수 시간대로 끌어내림
- [산업 영향] Kaitiakitanga 라이선스(마오리 미디어 Te Hiku), FLAIR(북미 원주민 언어), Matxa(카탈루냐어) 등 원주민 언어 AI 주권 모델이 글로벌 표준으로 확산 중
- [기술적 의미] phoneme 기반 입력 + 오픈소스 Piper 아키텍처의 조합이 저자원 언어 TTS의 최적 스택으로 확인, eSpeak NG 마오리어 규칙셋 활용
- [투자/비즈니스] 대형 기술 기업의 무허가 데이터 스크래핑에 대한 반작용으로 커뮤니티 소유 AI 모델 수요 급증, 소수 언어 AI 거버넌스 시장 형성 초기 단계
텍사스 오스틴 소재 Wetour Robotics(나스닥: WETO)가 인간을 컴퓨팅 네트워크의 1등급 노드로 만드는 Physical AI 플랫폼 'Orchestra'를 발표했다. 핵심 개념은 Spatial Intent Fusion — 신체 공간 위치(VisionLink), 시각 맥락, 근육 신호(sEMG, Conductor)를 동시에 융합해 100ms 이하 지연으로 연결된 기기를 제어한다. sEMG 신호는 실제 손가락 동작보다 50~80ms 앞서 나타나 사전 의도 감지(pre-motion intent sensing)가 가능하다. 엣지 추론 전용 레퍼런스 하드웨어는 NVIDIA Jetson Orin Nano Super이며, 클라우드 의존 없이 전체 제어 루프를 엣지에서 처리한다. 현재 동적 환경에서의 sEMG 신호 안정성, 엣지 AI 소형화, 서드파티 기기 프로토콜 이종성이 미해결 과제다. Wetour는 휴머노이드 로봇 발전과 경쟁이 아닌 보완 관계를 강조하며, 인간-기기 상호작용 데이터를 체화 AI 훈련 신호로 활용하는 전략을 제시했다.
핵심 인사이트
- [기술 성숙도] sEMG 50~80ms 사전 의도 감지는 실험실 검증 단계, 보행·등반 등 동적 환경에서는 신호 저하로 이산 제스처만 지원 — 상용화까지 신호 처리 개선 필요
- [산업 영향] 스크린·버튼·음성 40년 인터페이스 패러다임을 신체-컴퓨팅 직접 연결로 전환, 산업 현장(풍력 터빈, 물류 도크)·보조기기 등 핸즈프리 작업 환경 혁신
- [기술적 의미] NVIDIA Jetson Orin Nano Super 기반 100ms 이하 전체 제어 루프를 클라우드 없이 엣지에서 완결 — 안전 크리티컬 물리 AI의 레이턴시 요구사항 충족
- [투자/비즈니스] WETO 나스닥 상장사로 Physical AI OS 플랫폼 전략, 인간-기기 상호작용 데이터가 차세대 체화 AI 훈련 데이터 자산으로 전환 가능한 이중 수익 모델
스탠퍼드대 연구팀이 스파스(희소) 컴퓨팅 전용 칩 SIGMA를 개발해 CPU 대비 평균 70배 에너지 절감, 8배 속도 향상을 달성했다. 대규모 AI 모델의 파라미터 중 상당 부분이 실제로 0에 가까운 스파스 특성을 지니는데, 기존 GPU·CPU는 이를 활용하지 못한다. Cerebras는 LLM의 70~80% 파라미터를 0으로 설정해도 정확도 손실이 없음을 이미 시연했다. 스파스 하드웨어, 펌웨어, 소프트웨어를 통합 설계할 때만 이점을 극대화할 수 있다.
핵심 인사이트
- CPU 대비 70x 에너지 절감, 8x 속도 향상으로 AI 추론 전력 위기에 대한 하드웨어 차원 해법 제시
- 기존 GPU는 스파스 포맷 디코딩 오버헤드로 오히려 성능 저하, 스파스 전용 아키텍처 필요성 명확
- 하드웨어·펌웨어·컴파일러·ML 프레임워크 전 스택 공동 설계가 필수, 개별 최적화로는 효과 미미
- Meta Llama 2조 파라미터 등 초거대 모델 확장 추세에서 스파스 컴퓨팅이 에너지 효율 대안으로 부상
Hugging Face, Nvidia, Alibaba 등 주요 기업들이 오픈소스 로보틱스 AI 플랫폼에 대규모 투자를 단행하며 로봇 개발 진입 장벽이 빠르게 낮아지고 있다. Hugging Face의 LeRobot 플랫폼은 2024년 5월 출시 후 로보틱스 데이터셋이 1,145개에서 58,000개 이상으로 폭증해 플랫폼 내 최대 데이터셋 카테고리가 됐다. Nvidia는 Cosmos 월드 모델, GR00T 추론 모델, Isaac 오케스트레이션 프레임워크로 구성된 풀스택 오픈소스 로보틱스 스택을 공개했다. Alibaba도 Google·Nvidia 대비 벤치마크 우위를 주장하는 오픈소스 물리 AI 기반 모델 RynnBrain을 출시했다. Hugging Face는 Pollen Robotics 인수로 하드웨어 영역까지 확장했다.
핵심 인사이트
- [기술 성숙도] 오픈소스 로보틱스 AI가 학술 연구 단계에서 산업 플랫폼 경쟁 단계로 진입, LeRobot 데이터셋 50배 폭증이 방증
- [산업 영향] Nvidia·Hugging Face·Alibaba 3사 주도의 오픈소스 로봇 AI 생태계 형성으로 전용 연구실 없이도 고성능 로봇 개발 가능
- [기술적 의미] 합성 데이터 생성(Cosmos)과 파인튜닝 가능한 사전학습 모델(GR00T)이 로봇 AI 개발 패러다임을 전환
- [투자/비즈니스] Kickstarter 로봇 킷 $219 출시 등 하드웨어 민주화 진행, 홈 로봇 시장의 오픈소스 vs. 독점 플랫폼 경쟁 격화 예상
2005년 처음 제안된 공중 연산(OAC, Over-the-Air Computation)이 프로토타입 단계로 진입했다. OAC는 다수 기기가 동시에 전송할 때 전파 간 자연 합산되는 물리적 특성을 활용, 무선 채널 자체를 연산 장치로 전환하는 패러다임이다. 사우스캐롤라이나대 팀은 Analog Devices의 소프트웨어 정의 라디오 5개를 사용해 원시 데이터 전송 없이 이미지 인식 신경망을 공중에서 훈련, 95% 정확도를 달성했다. TBMA(Type-Based Multiple Access) 방식은 히스토그램 전체를 단 한 번의 전송으로 집계해 스펙트럼 효율·지연시간·프라이버시를 동시에 개선한다. 2025년 3월 IEEE 802.11 워킹그룹에서 향후 Wi-Fi 표준 AI/ML 역량으로 시연됐으며, 재구성 가능 지능형 표면(RIS)과의 결합이 차세대 연구 방향으로 제시됐다.
핵심 인사이트
- 간섭을 연산 자원으로 전환 - 네트워크 규모가 클수록 연산 정확도가 높아지는 역발상 패러다임
- 원시 데이터 미전송으로 프라이버시·지연 동시 개선 - AI 연합학습(federated learning) 분산 가속에 최적
- Wi-Fi·5G 기존 동기화 기술 재활용 가능 - 신규 인프라 없이 표준 내 추가 모드로 구현 가능성
- 이동성·위상 동기화가 핵심 미해결 과제 - 실험실 성공을 고속 차량 등 동적 환경으로 확장하려면 나노초 수준 정밀도 필요
미국 트럼프 행정부가 CHIPS and Science Act 예산을 활용해 9개 양자 컴퓨팅 기업에 총 20억 달러 이상을 지원하기로 발표했다. IBM은 10억 달러를 받아 자체 1억 달러를 추가 투자, 순수 양자 칩 파운드리 'Anderon'을 뉴욕 올버니에 설립한다. GlobalFoundries는 3억 7,500만 달러를 받아 QPU, 극저온 IC, 초전도 인터커넥트를 포함한 완전한 양자 하드웨어 솔루션 제조에 나선다. Atom Computing, D-Wave, Infleqtion, PsiQuantum, Quantinuum, Rigetti 각각 1억 달러, Diraq는 3,800만 달러를 받는다. D-Wave는 10만 큐비트 어닐링 시스템과 100개 논리 큐비트를 포함한 1만 큐비트 게이트 방식 시스템 개발에 자금을 사용할 예정이다. 중국도 15차 5개년 계획(2026~2030)에서 양자를 7대 미래 산업 최우선 순위로 지정해 175억 달러 규모의 3개 지역 펀드를 조성하며 미중 양자 기술 패권 경쟁이 가속화되고 있다. 다만 의회에서는 자금 배분 방식의 투명성 부족과 정부 지분 취득에 대한 반발이 제기되고 있다.
핵심 인사이트
- IBM이 정부 10억 달러 + 자체 10억 달러로 Anderon 파운드리를 설립, 300mm 웨이퍼 기반 초전도 큐비트 제조 생태계 주도권 선점에 나섰다.
- 미중 양자 기술 투자 경쟁이 격화되며 미국 $2B+ vs 중국 $17.5B 규모로 국가 안보·경제 패권 차원의 장기전이 전개되고 있다.
- 초전도, 중성 원자, 광자, 트랩 이온, 실리콘 스핀 등 다양한 양자 컴퓨팅 모달리티에 분산 투자함으로써 기술 불확실성 헷지 전략이 채택됐다.
- 정부의 지분 취득 조건과 CHIPS법 자금 용도 위반 논란이 정치적 리스크로 부상, 최종 투자 확정 여부가 불투명한 상태다.
Nvidia가 1MW 랙 아키텍처 'Kyber'를 통해 800V DC 전력 도입을 추진하고 있지만, Schneider Electric은 2030년까지 신규 AI 노드의 10% 미만만 800V로 전환될 것으로 전망했다. 현재 데이터센터 랙은 140~200kW 수준이며, 48V 기준의 150kW 랙에는 8개 전원 케이블이 필요하지만 1MW 랙으로 가면 32개가 필요해 실용성이 없다. 해결책은 랙 외부로 전력 변환기를 이동시키고 전압을 높이는 것으로, 초기에는 600kW~1MW를 커버하는 사이드카 방식이 올해 말 소규모 배포될 예정이며, 2029년에는 AC에서 800V로 직접 변환하는 2~5MW 단위의 중앙화 솔루션이 등장한다. 액체 냉각 도입 효과도 분석됐는데, 텍사스 100MW 데이터센터 기준 공랭식 대비 액냉 방식이 물 소비를 161개에서 79개 올림픽 수영장 분량으로 절반 이하로 줄이면서 토큰 처리량은 1.99×10⁸에서 2.52×10¹¹으로 약 1,000배 이상 향상되는 것으로 나타났다.
핵심 인사이트
- Nvidia Kyber의 1MW 랙 비전은 기술적으로 타당하나, 전력 인프라 전환 비용·복잡성으로 2030년까지 보급률은 10% 이하에 그칠 전망이다.
- 800V 전력 표준화는 EV 산업의 공급망을 그대로 활용하는 형태로 진행되며, 2029년 중앙화 DC 배전 솔루션이 본격 분기점이 될 것이다.
- 액체 냉각은 공랭식 대비 PUE 1.148→1.04로 개선하고 물 소비를 50% 절감하며 토큰 처리량을 1,000배 이상 향상시켜 AI 인프라 필수 기술로 부상했다.
- AI 워크로드의 '펄싱 부하' 특성이 기존 데이터센터 설계 패러다임을 바꾸며, 전력망 보호(Fault Ride Through)가 새로운 설계 요구사항으로 등장했다.
Oak Ridge 국립연구소가 양자 컴퓨팅, 고전적 HPC, AI를 통합하는 하이브리드 시스템 스택 개발을 본격화하고 있다. 국립 전산과학 센터의 Tom Beck 섹션장에 따르면, 양자 장치가 분자 샘플링을 담당하고 클래식 시스템이 고유값 문제를 처리하는 방식으로 역할을 분담한다. AI는 양자 오류 수정(물리적 큐비트 수 감소)과 회로 최적화에 활용되며, 역으로 양자 시스템이 AI의 손실 함수 최적화를 위한 고차원 공간 샘플링을 지원하는 상호보완 구조를 갖는다. 국가 2위 슈퍼컴퓨터인 Frontier(AMD MI250X GPU 기반 HPE Cray EX235A)가 클래식 HPC 백본을 담당하며, 2024년 연구에서는 양자-HPC 연결 고속 네트워크와 양자 테스트베드 구축을 권고했다. 재료 과학, 신약 개발, 기후 모델링, 핵물리학 분야 적용이 목표다.
핵심 인사이트
- [기술 통합] 양자-클래식-AI 3원 하이브리드 스택은 단일 패러다임의 한계를 넘는 새로운 슈퍼컴퓨팅 아키텍처 방향을 제시한다.
- [시장 영향] 국가 주도의 양자-HPC 통합 인프라 투자가 확대되면서 고속 양자-클래식 인터커넥트 시장이 새롭게 열릴 전망이다.
- [기술 의미] AI 기반 오류 수정이 실용화될 경우 내결함성 양자 컴퓨팅 달성 시점을 앞당길 수 있는 핵심 가속 요인이 된다.
- [투자/비즈니스] Frontier 같은 기존 Tier-1 슈퍼컴퓨터가 양자 연산의 보조 처리 플랫폼으로 재활용되며, 국립 연구소의 HPC 투자 가치가 확장된다.
Dell Technologies World 2026에서 Dell은 AI 워크로드의 온프레미스 전환 트렌드를 강조하며 새로운 하드웨어 및 AI 생태계 확장을 발표했다. Dell 자체 조사에 따르면 AI 워크로드의 67%가 클라우드 외부(온프레미스, 엣지, 코로케이션)에서 실행되며, 88%의 기업이 온프레미스 AI 워크로드를 운영 중이다. Eli Lilly는 Blackwell GPU 1,016개와 9,000 PF 성능의 LillyPod 슈퍼컴퓨터를 Dell 스토리지와 연계해 신약 개발에 활용 중이다. Dell은 Google Gemini 3 Flash, OpenAI Codex, Grok, Palantir AIP 등 주요 AI 모델을 온프레미스로 제공하며, PowerRack·PowerFlex·ObjectScale X7700 등 신규 인프라도 출시했다. 2030년까지 AI 인프라 지출이 $1.4조~$7조에 달할 것으로 전망된다.
핵심 인사이트
- AI 워크로드의 67%가 이미 온프레미스에서 실행되며, 클라우드 대비 온프레미스 전환이 가속화되고 있다.
- Dell은 Nvidia, Google, OpenAI, Palantir, SpaceXAI 등과 광범위한 파트너십으로 온프레미스 AI 생태계를 구축하며 클라우드에 정면 도전한다.
- ObjectScale X7700은 전 세대 대비 HDD 용량 45% 증가, 245 TB 올플래시 드라이브로 플래시 밀도를 3배 이상 높여 AI 데이터 집약 워크로드를 겨냥한다.
- 온프레미스 AI 서버로 클라우드 API 대비 3개월 내 손익분기점 달성 가능하다는 주장은 기업 IT 예산 결정에 강력한 근거로 작용할 전망이다.
Cisco가 FY2026 3분기(4월 마감) 실적을 발표했다. 전체 매출 $158.4억(+12% YoY), 순이익 $33.7억(+35.4%)을 기록했으며, AI 관련 수주는 hyperscaler/cloud builder 대상으로만 연간 $90억으로 상향 조정됐다. Acacia 광트랜시버는 400G 75만 개·800G 4만 개 이상 출하하며 경쟁사를 압도했고, Silicon One P200은 5개 hyperscaler 설계 채택을 확보했다. neocloud·소버린·기업 고객 대상 AI 인프라 수주도 $3억 달성(3분기 연속 3자릿수 성장). 4,000명 추가 감원을 통한 비용 절감도 병행 중이다. 기업·서비스 프로바이더·공공 부문 전반에서 AI 네트워크 업그레이드 수요가 확대되고 있음을 보여준다.
핵심 인사이트
- Cisco의 AI 수주가 hyperscaler 중심으로 급증, FY2026 연간 $90억으로 상향 조정되며 기존 예측($50억) 대비 80% 초과
- Acacia 광트랜시버 수주 5.4배 급증, 400G/800G 시장에서 최대 공급자 지위 확립하며 AI 클러스터 인터커넥트 시장 선점
- Silicon One P200의 scale-across 네트워크 5건 hyperscaler 설계 채택으로, Cisco가 자체 ASIC 경쟁력을 실증
- 가격 인상이 수주 성장의 약 50%를 차지, GPU·DRAM·스토리지 비용 상승이 OEM 매출 증대의 구조적 요인으로 부상
Cerebras Systems가 IPO를 통해 $5.55B을 조달하며 상장을 완료했다. 공모가 $185에서 당일 $311로 종가를 기록했으며 215.23백만 주에 대해 25배 초과 청약을 기록했다. IPO 자금과 Series H 투자, OpenAI와의 $20B 규모 계약(2030년까지 웨이퍼스케일 시스템 공급) 포함 총 현금은 약 $8.9B에 달한다. AWS·Google Cloud·Meta·Microsoft Azure 4대 클라우드 업체의 2026년 capex 합계가 $695~725B에 달하는 AI 인프라 투자 급증 시기와 상장 타이밍이 맞물렸다. 차세대 WSE-4 프로세서에서는 컴퓨트 대 SRAM 비율 문제 해결(3D 적층 SRAM 또는 광인터커넥트 기반 공유 DRAM) 등의 기술 혁신이 예상되며, 저지연 AI 추론 인프라 특화 전략으로 Nvidia·AMD 의존도를 낮추려는 하이퍼스케일러 시장을 공략한다.
핵심 인사이트
- IPO 당일 공모가 대비 68% 급등($185→$311)과 25배 초과 청약은 웨이퍼스케일 AI 추론 인프라에 대한 시장 신뢰를 수치로 증명한다.
- OpenAI와의 $20B 계약(2030년까지)은 Cerebras의 안정적 매출 기반을 확보하며 WSE-4 R&D 투자 여력을 보장한다.
- WSE-4에서 3D 적층 SRAM 또는 광인터커넥트 기반 외장 DRAM 도입 시, 저지연 추론을 위해 다수 머신을 묶던 한계가 단일 노드로 해소될 가능성이 높다.
- 2026년 4대 하이퍼스케일러 capex $695~725B 환경에서 자체 칩 설계로 Nvidia·AMD 의존도를 줄이려는 수요는 Cerebras와 같은 특화 플레이어의 성장 구조를 뒷받침한다.
OpenAI, Microsoft, Broadcom, AMD, Nvidia 5개사가 공동으로 Multipath Reliable Connection(MRC)이라는 신규 네트워크 프로토콜을 발표했다. 기존 RoCE Ethernet의 상위 확장 프로토콜로, 51.2 Tb/sec 스위치 ASIC의 포트 대역폭을 높이는 대신 포트 수를 대폭 늘려(800 Gb/sec 64포트 → 100 Gb/sec 512포트) 8개의 독립적인 Clos 데이터 플레인을 구성한다. 이를 통해 3-tier 네트워크에서 65,536개 GPU를 연결하던 구성이 2-tier 네트워크로 131,072개 GPU 연결로 확장되며, 스위치 수는 20% 증가에 그친다. 링크 장애 시 훈련 작업이 중단되지 않고 8개 경로 중 하나를 잃어 12% 대역폭만 감소하면서 자가 복구가 가능하다. MRC는 Nvidia ConnectX-8, AMD Pollara/Vulcano DPU, Broadcom Thor Ultra SmartNIC에 구현됐으며, Oracle Stargate(텍사스 애빌린)와 Microsoft Azure(위스콘신 페어워터) 클러스터에서 실증됐다.
핵심 인사이트
- 51.2 Tb/sec ASIC을 100 Gb/sec 512포트로 분할·8중화해 2-tier로 131,072 GPU 연결, 동일 대역폭 대비 스케일 2배 달성
- 링크 장애 시 AI 훈련 중단 없이 자가 복구 가능 — 기존 Clos 구조의 "전체 정지·체크포인트 복귀" 문제를 구조적으로 해결
- Ultra Ethernet과 달리 기존 RoCE 인프라와 호환되는 점진적 프로토콜 확장 방식으로 하이퍼스케일러의 빠른 도입 장벽이 낮음
- Nvidia·AMD·Broadcom 3사 NIC과 Nvidia Spectrum·Arista 스위치 모두 지원, 멀티벤더 생태계 형성으로 InfiniBand 대체 가능성 가속화
Gartner의 2026년 4월 전망에 따르면 글로벌 IT 지출은 약 6.32조 달러로 전년 대비 13.5% 증가할 것으로 예상된다. CPU·GPU 컴퓨트 수요 급증과 메모리·스토리지 부품 공급 부족이 맞물리며 가격이 급등하고 있다. 특히 데이터센터 시스템 지출은 2월 전망(31.7% 성장) 대비 크게 상향 조정되어 55.8% 성장한 7,880억 달러로 수정됐다. 생성형 AI 투자를 서두르는 하이퍼스케일러, 클라우드 인프라 구축사, Anthropic·OpenAI 등 주요 AI 모델 개발사들이 지출 급증을 주도하고 있으며, 데이터센터 시스템이 전체 IT 지출에서 차지하는 비중은 2012년 4.5%에서 2026년 12.5%로 대폭 확대될 전망이다.
핵심 인사이트
- 2026년 글로벌 IT 지출 전망이 불과 3개월 만에 10.8%→13.5% 성장으로 대폭 상향 조정되며 AI 수요 급증을 반영함
- 데이터센터 시스템 지출이 3개월 만에 1,346억 달러 추가 상향 조정되는 전례 없는 투자 가속이 진행 중
- Anthropic·OpenAI 등 AI 기업들의 IPO 준비와 맞물린 인프라 선점 경쟁이 부품 가격 급등을 부추기는 구조
- 핵심 IT 지출 비중이 2012년 35.9%→2026년 64.9%로 확대되며 기업 예산의 AI 인프라 집중 트렌드 고착화
AMD가 CDNA 4 아키텍처 기반의 에어쿨링 GPU 카드 MI350P를 출시했다. MI350X의 절반 패키지로 의도적으로 설계된 이 제품은 PCI-Express 폼팩터를 채택해 표준 서버에 장착 가능하다. TDP는 최대 600W이며 450W로 낮출 수 있고, 메모리 대역폭은 약 3.6 TB/sec에 달한다. 금융, 제조, 생명과학 등 온프레미스 추론 워크로드를 운용하며 액체 냉각 인프라를 갖추지 못한 기업을 주요 타깃으로 삼는다. 200~250억 파라미터 규모 모델 추론에 최적화되어 있으며, Dell·HPE·Lenovo·Cisco·Supermicro 등이 OEM 파트너로 참여한다. 가격은 MI350X의 절반 이하 수준이 될 것으로 예상된다.
핵심 인사이트
- AMD MI350P는 CDNA 4 아키텍처를 유지하면서 PCI-E 폼팩터와 에어쿨링을 지원, 기존 데이터센터 인프라에서도 최신 AI 가속기 도입이 가능해졌다.
- 금융·제조·생명과학 등 온프레미스 운용이 필수인 산업군이 핵심 타깃으로, 클라우드 의존 없이 AI 추론 워크로드를 처리할 수 있는 시장 수요가 명확히 존재한다.
- 600W→450W 전력 스로틀링 시 성능은 10~15%만 감소하는 반면 전력은 25% 절감되어, 에너지 효율 관점에서 450W 모드가 사실상 표준 채택 구성이 될 가능성이 높다.
- Dell·HPE·Lenovo·Cisco·Supermicro 5개 주요 OEM 파트너가 즉시 시스템을 출시함으로써, AMD의 엔터프라이즈 AI 가속기 생태계가 NVIDIA에 대한 실질적 대안으로 빠르게 확장되고 있다.
AMD는 2026년 1분기 총 매출 $10.25B(YoY +37.8%)을 기록하며 강세를 이어갔다. 특히 데이터센터 그룹 매출이 $5.78B(YoY +57.2%, 전체 매출 56.3%)으로 성장의 핵심을 담당했다. AMD CEO Lisa Su는 서버 CPU TAM을 기존 예측 $60B에서 $120B(2030년)으로 대폭 상향했으며, 이는 에이전틱 AI 워크로드 확대가 CPU 수요를 구조적으로 늘리고 있기 때문이다. CPU:GPU 비율이 기존 1:4~1:8에서 1:1 혹은 CPU 우세 구도로 전환될 수 있다고 전망했다. Epyc CPU 매출은 $3.65B(YoY +53%), Instinct GPU는 $1.9B(YoY +64%, QoQ -28.2%)으로, HBM 공급 부족과 MI300→MI400 제품 전환 영향으로 GPU는 일시적 역성장했다.
핵심 인사이트
- 서버 CPU TAM 전망이 $60B에서 $120B(2030년)으로 두 배 상향되며 에이전틱 AI가 CPU 르네상스를 이끄는 핵심 동인으로 부상
- CPU:GPU 비율이 1:4에서 1:1 이하로 압축될 수 있어, GPU 중심 AI 인프라 설계의 패러다임 전환 신호
- AMD Instinct GPU 매출이 HBM 공급 부족과 MI400 전환 과도기로 QoQ 28.2% 급락하며 공급망 리스크가 현실화
- Epyc CPU의 하이퍼스케일러 비중 76.2%($2.78B), AMD가 50% 이상 점유율 목표를 공식화하며 Intel에 직접적 도전장