표시할 기사가 없습니다.
전 Neuralink 공동창업자 Max Hodak가 설립한 Science Corporation이 인간 뇌에 최초로 센서를 이식하는 임상시험을 준비 중이다. Yale 의대 신경외과 학과장 Murat Günel 박사가 과학 자문으로 참여하며, 520개의 기록 전극이 탑재된 완두콩 크기의 장치를 뇌 표면에 삽입하는 방식이다. 기존 금속 전극 방식과 달리 실험실 배양 뉴런을 전자회로와 결합하는 바이오하이브리드 접근법을 채택했다. 회사는 지난달 2억 3,000만 달러 규모의 시리즈 C 투자를 완료하며 기업가치 15억 달러를 인정받았으며, 2027년 임상시험 시작을 목표로 하고 있다.
핵심 인사이트
- Science Corp.은 최근 2억 3,000만 달러 시리즈 C를 완료해 기업가치 15억 달러를 달성했으며 임상시험 자금 기반을 확보했다.
- 기존 뇌-컴퓨터 인터페이스(BCI)의 금속 전극 방식이 뇌 손상을 유발하는 한계를 바이오하이브리드 뉴런 기술로 극복한다는 차별화 전략이다.
- 520개 전극이 탑재된 완두콩 크기 장치로 뇌 표면에만 접촉해 FDA 승인 없이 임상시험이 가능하다는 규제 우회 전략을 택했다.
- 파킨슨병, 뇌종양, 척수 손상 등 다양한 신경계 질환 치료 시장을 목표로 Neuralink와 직접 경쟁 구도를 형성하고 있다.
리워드 앱 Freecash가 사기성 마케팅으로 App Store와 Google Play 상위권을 차지한 뒤 Apple에 의해 퇴출됐다. 독일 기업 Almedia GmbH가 운영하는 이 앱은 2026년 1월 전 세계 앱스토어에서 550만 건이 넘는 다운로드를 기록하며 미국 App Store에서 2위까지 올랐다. 2월에는 최고 600만 건에 달했으나 이후 하락 추세다. Malwarebytes 조사에 따르면 앱은 인종, 종교, 성 정체성, 건강 등 민감한 개인정보를 수집하는 데이터 브로커 역할을 했다. TechCrunch 취재 후 Apple은 오해를 유발한 마케팅을 이유로 앱을 삭제했으며, Google도 조사 중이다.
핵심 인사이트
- Freecash의 다운로드는 2025년 10월 87만 6,000건에서 2026년 1월 550만 건으로 불과 3개월 만에 6배 이상 폭증했으며, 이 이례적 성장이 사기의 핵심 근거다.
- Almedia GmbH는 기존 앱이 금지된 후 키프로스 기업 256 Rewards Ltd.의 개발자 계정을 인수해 재진입하는 우회 전략을 사용했다.
- 4.7점의 높은 평점에도 불구하고 허위 리뷰, 봇 트래픽, TikTok 기만 광고 등 복합적 조작이 동원됐다는 점이 앱 스토어 심사 시스템의 취약성을 드러냈다.
- 미디어 취재 직후 Apple이 즉각 앱을 삭제한 사례는 언론의 감시가 플랫폼 자율규제를 촉진하는 효과적 메커니즘임을 보여준다.
AI 기반 바이브 코딩 앱 Anything이 Apple App Store에서 두 차례 강제 퇴출된 이후 생존 전략을 모색하고 있다. Apple은 개발자 계약 2.5.2 조항(코드 다운로드·실행 금지)을 이유로 Anything, Replit, Vibecode 등 AI 코딩 앱의 업데이트를 막거나 삭제했다. Anything은 3월 26일 첫 삭제 후 4월 3일 잠시 복구됐다가 재삭제됐으며, 현재 iMessage 플랫폼 앱 빌더, 데스크톱 앱, Android 전환 등을 검토 중이다. AI 코딩 도구 확산으로 Apple의 앱 제출 건수가 단일 분기에 84% 급증했다는 보고도 있어 정책 변화 압박이 커지고 있다.
핵심 인사이트
- Apple, AI 코딩 앱 3종(Anything·Replit·Vibecode) 연쇄 제재 - 개발자 계약 2.5.2 위반 이유
- AI 코딩 도구로 App Store 제출 건수 단일 분기 84% 급증 - Apple 심사 체계 전환 압박
- Anything, iMessage 앱·데스크톱 앱·Android 전환 3가지 우회 전략 동시 추진
- Epic Games CEO도 공개 비판 - "Apple, 개발 도구 앱 차단 즉시 중단해야"
YouTube가 라이브 스트리밍 중 채팅 참여도가 최고조에 달하거나 Super Chat·Super Stickers·Gift 구매가 이루어질 때 광고를 자동으로 보류하는 기능을 도입했다. 기존에는 YouTube Premium 구독(월 $13.99→$15.99로 인상)만이 광고 없는 시청 방법이었다. 선물 기능은 캐나다, 한국, 인도네시아, 태국, 호주, 뉴질랜드에 새로 확대됐으며, 가로/세로 동시 라이브 방송 및 GIF 전송 기능도 추가됐다. 2025년 미국 라이브 시청 시간의 30% 이상이 TV에서 발생한 점을 고려한 다중 디바이스 전략의 일환이다.
핵심 인사이트
- 피크 채팅 참여 시 광고 자동 보류 - 시청 경험 개선과 크리에이터 수익 균형 도모
- Super Chat·Gift 구매자에게 즉각적 광고 없는 창 제공 - 후원 유인 강화
- YouTube Premium 가격 인상($13.99→$15.99) 직후 무료 광고 면제 확대 - 균형 전략
- 2025년 미국 라이브 시청의 30% TV 발생 - 멀티 포맷 동시 방송 전략 근거
Tesla가 FSD(Full Self-Driving) 사용률 제고를 위해 연속 사용 일수 '스트릭(Streak)' 기능과 상세 통계를 포함한 새로운 자율주행 앱을 출시한다. 월 $99 구독 방식인 FSD(Supervised)는 2020년 베타 출시 이후 운전 조향, 차선 변경, 주차를 지원하나 여전히 운전자 감독이 필요하다. Elon Musk는 2035년까지 FSD 1,000만 구독을 달성해야 약 1조 달러 규모 보수 패키지 전액을 수령할 수 있으며, 이번 앱 개편은 구독 전환 간소화(원탭 구독)가 핵심이다. FSD Hardware 4.0(A14 칩) 탑재 차량(2023년 1월 이후 출하)에만 적용된다.
핵심 인사이트
- FSD 원탭 구독 전환 도입 - 기존 복잡한 단계 제거로 구독 전환율 제고 목표
- 연속 사용 스트릭 게임화 요소 추가 - 습관적 FSD 사용 유도 전략
- Musk의 $1조 보수 패키지, 2035년 FSD 1,000만 구독 달성 조건 - 강력한 내부 동기
- FSD HW 4.0 전용 - 2023년 1월 이후 차량만 해당, 기존 차주 업그레이드 필요
Lucid Motors가 14개월간의 CEO 공백 끝에 엘리베이터·에스컬레이터 기업 Schindler Group 출신 Silvio Napoli를 신임 CEO로 임명했다. 동시에 Uber로부터 $2억 추가 투자(총 $5억, 차량 최소 35,000대 주문)와 사우디 국부펀드(PIF)로부터 $5.5억 규모 주식 매입을 확보했다. Napoli는 미국 취업 허가 취득 전까지 스위스에서 이사회 임원으로 근무하며, 기본 연봉 $150만, 이사 비용 $100만, 주식 ~$1,000만 상당을 받는다. Uber·Nuro가 수정된 Lucid Gravity SUV로 샌프란시스코 럭셔리 로보택시 서비스를 연내 출시할 예정이다.
핵심 인사이트
- Uber 총 투자 $5억, 최소 35,000대 주문 - Lucid 로보택시 사업 핵심 파트너로 확정
- 사우디 PIF 추가 $5.5억 투자 - 2018년 이후 지속적 자금 지원으로 Lucid 생존 기반 유지
- Schindler 출신 산업 전문가 CEO 영입 - 기술보다 생산 효율화·비용 절감 우선 신호
- 12% 구조조정·계약직 감원 이어 Gravity SUV 생산 램프업 중 - 수익성 전환 분기점
Adobe가 Acrobat DC, Reader DC, Acrobat 2024에서 최소 4개월 이상 악용된 제로데이 취약점(CVE-2026-34621)을 패치했다. 이 취약점은 악성 PDF 파일 열람만으로 Windows·macOS 기기에 원격 악성코드 설치를 가능하게 하며, 보안 연구자 Haifei Li가 운영하는 EXPMON 시스템이 최초 발견했다. VirusTotal 기록에 따르면 악성 PDF는 2025년 11월 말부터 유포됐다. Adobe는 패치 전 공개 악용(in-the-wild exploit) 사실을 인정했으며, 사용자에게 즉각 업데이트를 촉구했다.
핵심 인사이트
- CVE-2026-34621 제로데이 - 4개월 이상 패치 없이 악용, 시스템 완전 제어 가능
- 악성 PDF 클릭 한 번으로 Windows·macOS 원격 침해 - 사용자 행동 유발 방식 위험
- EXPMON·VirusTotal 통한 탐지 - 보안 연구자 생태계가 취약점 발견 선행
- PDF 리더 소프트웨어의 광범위한 보급이 지속적 표적 원인 - 즉각 업데이트 필수
AI 전용 데이터센터 스타트업 Fluidstack이 Jane Street 주도로 $10억 투자 유치를 협상 중이며, 기업가치는 $180억으로 불과 수개월 전 $75억 대비 2.4배 급등했다. 2025년 11월 Anthropic과 텍사스·뉴욕에 AI 전용 데이터센터 구축 계약($500억)을 체결하며 급부상했으며, 영국 옥스퍼드 스핀아웃에서 미국 뉴욕으로 본사를 이전했다. 프랑스 €100억 AI 프로젝트에서도 철수하고 미국 시장에 집중하는 전략적 전환을 단행했다. Meta, Poolside, Black Forest Labs도 주요 고객으로 보유 중이다.
핵심 인사이트
- 기업가치 $75억→$180억 수개월 내 2.4배 급등 - AI 인프라 투자 과열 지표
- Anthropic $500억 데이터센터 계약이 핵심 성장 동력 - AI 자체 인프라 구축 트렌드
- 영국→미국 본사 이전, 프랑스 €100억 프로젝트 철수 - 미국 AI 생태계 집중 전략
- Jane Street 주도 협상 - 금융 기관의 AI 인프라 직접 투자 확대 신호
Sony가 2026년 5월 말부터 최근 출시된 Bravia 스마트 TV의 안테나 및 셋톱박스 사용자 기능을 축소한다. 영향을 받는 모델은 2023~2025년형으로 Bravia 9, 8, 7, 5, A95L 시리즈 등이며, 일부 모델은 출시 1년도 채 되지 않았고 가격대는 $1,000~$4,500에 달한다. 변경 사항으로는 안테나 채널의 TV 가이드 축소, 채널 로고 및 썸네일 이미지 제거, 셋톱박스 전용 메뉴 폐지가 포함된다. Sony는 공식 이유를 밝히지 않았으나, 채널 메타데이터·로고 제공을 위한 서드파티 데이터 라이선스 비용 절감 및 Google TV 표준 가이드 의존 전환이 배경으로 추정된다. 미국 성인의 19%는 안테나를, 26%는 셋톱박스를 주 시청 수단으로 사용 중이다.
핵심 인사이트
- Sony가 비용 절감을 위해 이미 판매된 고가 TV에서 기능을 사후 삭제하는 논란적 정책을 시행한다.
- 안테나·셋톱박스 사용자 비중이 각각 19%, 26%로 소수가 아님에도 기능이 축소되는 소비자 권익 문제가 부각된다.
- Google TV OS 표준화 전략의 일환으로 Sony가 독자 TV 가이드 운영 비용 부담을 줄이려는 움직임으로 해석된다.
- 구매 후 기능 삭제는 스마트 TV 시장 전반의 소프트웨어 의존도 리스크와 소비자 신뢰 훼손 문제를 드러낸다.
미국인의 3분의 1이 AI 챗봇을 의료 정보 목적으로 사용한다는 KFF 조사 결과가 발표된 가운데, Hartford HealthCare와 K Health의 PatientGPT, Epic의 Emmie 등 병원 자체 의료 AI 챗봇 출시가 잇따르고 있다. PatientGPT는 이미 일부 환자 대상 베타 서비스를 시작했으며 수만 명으로 확대 예정이다. 그러나 Oxford대 연구에 따르면 실제 사용자가 직접 입력한 프롬프트를 쓸 때 AI의 정확한 병명 식별률은 약 33%에 그치며, 적절한 다음 조치 안내율도 43%에 불과하다. 또한 스웨덴 연구팀이 가상의 피부 질환 'bixonimania'를 만들어 올렸더니 LLM이 그대로 사용자에게 안내하는 사례도 발생해 의료 AI의 정확성과 안전성에 심각한 우려가 제기된다.
핵심 인사이트
- 미국 성인의 33%가 AI를 의료 정보 목적으로 활용하지만, 실제 정확도는 병명 식별 33%, 다음 조치 안내 43%에 불과하다.
- Hartford HealthCare·Epic 등 의료 기관이 자체 챗봇을 출시하며 환자를 자사 서비스로 유도하는 비즈니스 전략이 본격화되고 있다.
- 의료 AI의 환각(hallucination) 문제가 실제 의료 정보 오염으로 이어지는 위험성이 연구를 통해 확인되어 규제 필요성이 부각된다.
- AI 의료 챗봇 시장이 확대될수록 의료 법인의 책임 소재와 규제 프레임워크 부재 문제가 핵심 투자 리스크로 부상한다.
Microsoft가 2024년 출시된 Surface 제품군 가격을 $250~$300 일괄 인상하며, $1,000 미만 모델을 라인업에서 완전히 제거했다. 12인치 Surface Pro는 $799→$1,049, 13인치 Surface Laptop은 $899→$1,149로 올랐으며, 고급형 모델은 $999→$1,499까지 뛰었다. Microsoft는 메모리·부품 원가 상승을 이유로 들었다. 이번 인상으로 동급 M5 MacBook Air($400 저렴)와의 가격 역전 현상이 심화되어, ARM 기반 Windows PC의 가격 경쟁력이 크게 약화됐다.
핵심 인사이트
- Surface 전 라인업 $1,000 미만 모델 소멸 - 프리미엄 포지셔닝 강제화
- M5 MacBook Air 대비 $400 가격 역전 - ARM Windows PC 가격 경쟁력 심각한 타격
- RAM·스토리지 공급 부족이 소비자 가전 가격 전방위 압박 - 업계 공통 현상
- Snapdragon X2 Elite 업데이트 없는 가격 인상 - 소비자 업그레이드 이점 전무
Amazon이 $116억(또는 $108억)에 Globalstar를 인수하고 Apple과 iPhone·Apple Watch의 위성 서비스 공급 계약을 체결하며 SpaceX Starlink에 맞선 위성 인터넷 경쟁을 본격화했다. Amazon은 iPhone 14 이후 모델에서 긴급 SOS, 메시지, Find My, 로드사이드 지원 등 기존 Globalstar 서비스를 계속 지원하고, 2028년 Amazon Leo D2D 위성 시스템을 통해 음성·데이터·메시징으로 확장한다. Apple은 2022년 Musk의 Starlink 탑재 제안을 거부한 바 있으며, FCC 의장은 이번 딜에 우호적 입장을 표명했다.
핵심 인사이트
- Amazon Globalstar 인수 $116억 - iPhone 위성 서비스 1차 공급사 지위 확보
- 2028년 Amazon Leo D2D 출시 목표 - 현재 Starlink(10,000+ 위성) 대비 241기로 격차 큼
- Apple, Starlink 대신 Amazon 선택 - 2022년 Musk 제안 거부 후 4년만에 결론
- FCC, 위성 D2D 시장 3파전 선호 - Amazon·SpaceX·AST SpaceMobile 경쟁 구도 유도
영국 AI 보안연구소(AISI)가 Anthropic의 Mythos Preview 모델을 사이버보안 CTF 테스트로 독립 평가한 결과, 단일 작업 성능은 경쟁 모델(GPT-5.4, Claude Opus 4.6)과 유사하지만, 32단계 기업 네트워크 침투를 시뮬레이션한 'The Last Ones(TLO)' 테스트에서 최초로 전 과정을 완주한 모델로 기록됐다. 10회 시도 중 3회 성공, 평균 22/32단계 완료로 Claude 4.6(16단계)보다 우수했다. AISI는 소규모 취약 기업 시스템에 대한 자율 공격이 가능한 수준이라고 평가하며, 방어 측도 AI 활용 강화를 권고했다.
핵심 인사이트
- TLO 테스트 세계 최초 완주 - 32단계 기업망 침투 자율 수행 능력 입증
- 10회 중 3회 성공률 - 현재는 소규모 취약 시스템에만 위협, 대규모 방어망은 안전
- 개별 작업 성능은 경쟁 모델과 유사 - 멀티스텝 체이닝 능력이 차별화 포인트
- AISI 권고: 방어 측도 AI 활용 강화 - AI 공격·방어 군비 경쟁 본격화 신호
SanDisk가 차세대 메모리인 HBF(High Bandwidth Flash) 파일럿 라인을 2026년 하반기에 구축하겠다는 계획을 기존 로드맵보다 약 6개월 앞당길 것으로 알려졌다. SanDisk는 재료·부품·장비 파트너사들과 HBF 프로토타입 생산 생태계 구축에 착수했으며, 일본이 생산 거점 유력 후보지로 거론되고 있다. 상용화 목표는 2027년이다. SK hynix와 SanDisk는 2026년 2월 25일 'HBF 표준화 컨소시엄 킥오프'를 공동 개최하며 AI 추론 시대를 겨냥한 글로벌 표준화 로드맵을 발표했다. Samsung Electronics도 2020년대 초부터 HBF를 연구해왔으며 관련 특허를 적극 확보 중이다. 한국 소재 기업 JK Materials는 중국 주요 고객사 대상 HBF용 고성능 폴리머 개발을 완료했다고 발표했다.
핵심 인사이트
- SanDisk가 HBF 파일럿 라인 일정을 6개월 앞당기며 차세대 메모리 시장 선점 경쟁이 본격화되고 있다.
- SK hynix-SanDisk 공동 HBF 표준화 컨소시엄 출범으로 한국-미국 연합이 글로벌 표준 주도권을 노린다.
- HBF는 NAND를 TSV로 적층하는 구조로, HBM 생태계의 기술·장비가 그대로 적용 가능해 전환 장벽이 낮다.
- 한국 소재 기업 JK Materials의 HBF용 폴리머 공급 성사 시 한국 소재·부품 공급망 확대로 이어질 수 있다.
대만 DRAM 제조사 Nanya Technology가 2026년 1분기 사상 최대 분기 실적을 기록했다. 연결 매출은 NT$49.09억으로 전분기 대비 63.1% 증가했으며, 순이익은 NT$26.06억으로 전분기비 134.9%, 전년동기비 1,442.8% 급증했다. EPS는 NT$8.41을 기록했다. 출하량이 중간 한 자릿수 감소했음에도 ASP(평균 판매 단가)가 70% 이상 급등하며 실적을 견인했다. 2분기 DRAM 가격도 두 자릿수 추가 상승이 예상된다. 한편 SanDisk·Kioxia·SK하이닉스 계열 Solidigm·Cisco의 참여로 NT$787.2억의 사모 배정이 완료됐으며, 4대 주요 고객이 총 지분의 약 10.19%를 보유하게 됐다. DDR5는 매출의 약 10%, UWIO(Ultra Wide I/O) 커스텀 제품도 초기 매출에 기여 중이다.
핵심 인사이트
- 1분기 순이익 전년동기비 1,442.8% 급증, EPS NT$8.41 사상 최고 — ASP 70% 이상 상승이 출하량 감소를 압도
- 2분기 DRAM 가격 두 자릿수 추가 상승 전망 — 단기 스팟가 약세는 일시적 조정, 계약가 상승세 지속
- SanDisk·Kioxia·Solidigm·Cisco 사모 배정 NT$787.2억 완료 — 고객 지분 참여로 AI 메모리 로드맵 공동 개발
- 추가 협력사 복수 논의 중 — 지분 투자 넘어 공동 R&D·생산 할당·공급망 통합으로 확장 가능
Apple 폴더블 아이폰의 공급망 구조가 구체화되고 있다. 패널은 삼성디스플레이가 3년 독점 공급하며, CoE(Color-on-Encapsulation) 기술과 M14 OLED 소재를 적용한다. 메모리는 삼성이 12GB LPDDR5X를 공급하며 전년 대비 약 두 배의 조달 가격이 책정됐다. 렌즈는 라간(Largan), 힌지는 SZS(신주성)가 공급하며, 최종 조립은 폭스콘이 단독 담당해 2026년 4분기 양산 예정이다. 중국 A주 기업들도 LY iTECH(힌지·지지대), 렌즈테크(UTG 유리·PET 필름), FII·룩스쉐어·BYD 등이 공급망에 포함됐다. 다만 Nikkei는 엔지니어링 테스트에서 기술적 병목이 발생해 지연 위험이 있다고 보도했다.
핵심 인사이트
- 삼성디스플레이, 애플 폴더블 OLED 패널 3년 독점 공급 확정 — CoE 기술 채택으로 굴곡부 패널 내구성 해결
- 삼성 LPDDR5X 12GB 메모리 조달가 전년비 약 2배 — 폴더블 수요가 메모리 고부가 제품 믹스 개선에 기여
- 폭스콘 단독 조립, 2026년 4분기 양산 계획 — 엔지니어링 테스트 기술 병목으로 초기 공급 제약 가능성 존재
- 중국 A주 LY iTECH·렌즈테크 등 다수 공급망 참여 확정 — Apple 폴더블 출시가 중국 부품 업체 수혜 촉매
Stanford HAI 보고서에 따르면 중국 AI 모델이 미국과의 성능 격차를 대폭 줄여 2026년 3월 기준 Anthropic 선두 모델의 우위가 2.7%에 불과하다. 2023년 미중 모델 간 300점 이상 벌어졌던 점수 차가 2년 만에 사실상 박빙으로 좁혀졌으며, DeepSeek-R1은 2025년 2월 일시 동률을 기록했다. 미국은 고영향 특허·데이터센터 수에서 우위를 유지하지만, AI 인재 유입은 2017년 대비 89%(지난 1년 80%) 급감했다. 이에 OpenAI·Anthropic·Google은 중국의 '적대적 증류(adversarial distillation)' 시도에 대응해 정보 공유에 나섰다.
핵심 인사이트
- 미중 AI 성능 격차 2.7% - 2023년 300점 차에서 2년 만에 사실상 동률 수렴
- 미국 AI 인재 유입 89% 급감(2017년 대비) - 장기 기술 우위 지속 가능성 위협
- 미 빅3(OpenAI·Anthropic·Google) 중국 증류 공격 대응 공동 전선 구축
- 한국, AI 인구 1인당 특허 세계 1위 - AI 인프라 투자 여력 대비 고효율 혁신
Nvidia Rubin GPU 플랫폼 출시를 앞두고 삼성과 SK하이닉스가 HBM4 전략에서 정반대 방향을 택했다. 삼성은 현재 60% 미만인 1c DRAM 수율을 하반기 80%까지 끌어올려 Nvidia의 핵심 고객 지위를 확보하는 데 집중하는 한편, HBM4 로직 다이 가격을 연초 대비 40~50% 인상했다. 반면 SK하이닉스는 Rubin 플랫폼 출시 지연을 이유로 HBM4 출하량을 당초 목표의 20~30% 줄이고 HBM3E·서버 DRAM으로 전환한다. TrendForce는 Rubin의 고급 GPU 내 점유율이 2026년 29%→22%로 하락하고 Blackwell(HBM3E)은 71%→78%로 오를 것으로 전망했다.
핵심 인사이트
- 삼성 HBM4 수율 <60%→80% 목표 - Nvidia 공급 자격 확보가 사활적 과제
- SK하이닉스 HBM4 출하 20~30% 축소 - Rubin 지연에 HBM3E·서버 DRAM으로 선회
- 삼성 HBM4 로직 다이 가격 40~50% 인상 - 수율 낮은 상황서 비용 전가 전략
- Rubin 고급 GPU 점유율 29%→22% 하락 예상 - Blackwell 생명 연장, HBM3E 수요 유지
유리 기판(Glass Substrate) 상용화 경쟁에서 한국 기업들이 Intel의 표준 선점을 막기 위해 생산 확대에 속도를 내고 있다. SKC 자회사 Absolics는 미국 조지아에 세계 최초 유리 기판 양산 시설을 구축해 실리콘밸리 테크 기업들의 관심을 받고 있으며, SKC는 유상증자 조달 자금의 60%인 약 5,900억 원을 Absolics 제품 개발에 투입할 계획이다. 삼성전자도 삼성전기와 협력해 유리 기판 위에서 칩이 직접 동작하는 통합 솔루션을 개발 중이다. Intel은 2030년을 목표로 유리 기판 로드맵을 제시했지만, 한국 기업들은 먼저 양산 체계를 갖춰 업계 표준을 선점한다는 전략이다.
핵심 인사이트
- Absolics, 세계 최초 유리 기판 양산 시설(조지아) - Intel보다 먼저 양산해 표준 선점 전략
- SKC, 유상증자 60%인 5,900억 원 Absolics 투자 - 한국 정부·기업 차원의 전략적 베팅
- 삼성전자·삼성전기 통합 유리 기판 솔루션 개발 - 메모리·파운드리 시너지 활용
- Intel 2030년 목표 vs 한국 조기 양산 - 포토닉스 시대 AI 패키징 표준 주도권 다툼
Huawei가 세계 최초의 가로형(와이드) 폴더블 스마트폰 Pura X Max를 4월 20일 중국에서 출시하며 폴더블 폼팩터 경쟁을 선도하고 있다. Kirin 9030 탑재가 예상되며, 펼쳤을 때 4:3 비율 7.6~7.69인치 화면으로 iPad mini 수준의 태블릿 경험을 제공한다. 삼성은 Galaxy Z Fold8과 Z Wide Fold를 올여름 발표 예정으로 5월 양산에 돌입하며, Apple의 첫 폴더블 iPhone Ultra는 2026년 출시 예상가 $2,000~$2,500 수준으로 알려졌다. Huawei의 미국 시장 부재로 미국 소비자는 Samsung과 Apple의 선택지만 남아있다.
핵심 인사이트
- Huawei Pura X Max 4월 20일 출시 - Samsung·Apple 대비 수개월 먼저 가로형 폴더블 시장 선점
- Samsung Galaxy Z Wide Fold 5월 양산 착수 - 새로운 와이드 폼팩터로 폴더블 시장 재편 시도
- Apple iPhone Ultra 예상가 $2,000~$2,500 - 프리미엄 폴더블 시장 상한선 설정
- Huawei 미국 제재로 글로벌 경쟁 불균형 - 중국 내 선점 효과, 서방 시장 파급력 제한
AI 가속기의 급속한 확산이 반도체 테스트 분야에 전례 없는 복잡성을 가져오고 있다. 하나의 AI 가속기 패키지는 수천 개의 코어와 HBM(High Bandwidth Memory)을 포함하며, HBM은 전체 패키지 비용의 50% 이상을 차지해 불량 스택 조기 감지가 필수적이다. 테스트는 웨이퍼 프로브부터 HBM 스택 모듈, 최종 패키지, 데이터센터 내 시스템 레벨까지 다단계로 이루어진다. 각 패키지의 소비 전력이 300W~2,000W에 달해 열 관리도 핵심 과제다. HBM은 HBM3E에서 HBM4로 진화하면서 스택 높이 775마이크론 이내에 20개의 DRAM 다이를 집적하고, 인터페이스 폭도 4K 비트로 확장된다. IEEE 1838 표준이 멀티다이 스택 테스트 접근성을 지원하지만, 수천 개 코어에서의 불량 격리와 비트 정밀 예상 결과 검증은 여전히 난제로 남아 있다.
핵심 인사이트
- HBM이 AI 가속기 패키지 비용의 50% 이상을 차지하므로, HBM3E→HBM4 전환기에 Known Good Stack 검증이 수율 및 비용 관리의 핵심이 된다.
- AI 가속기는 수천 개의 동일 코어를 반복 배치하는 homogeneous 구조로, 기존 CPU 대비 스트리밍 스캔 및 병렬 테스트 최적화가 상대적으로 유리하다.
- 300W~2,000W의 고전력 밀도는 패키지 설계 단계에서 칩렛의 열 격리 배치를 필수 아키텍처 결정 사항으로 만들며, 테스트 중 전력 무결성 검증도 요구한다.
- Advantest, Synopsys, PDF Solutions, Amkor 등 주요 테스트·패키징 기업들이 AI 가속기 테스트 인프라 구축에 집중 투자하고 있으며, 이 분야의 시장 성장 잠재력이 크다.
비트 플립(bit flip)은 우주 방사선, 전압 글리치, 적대적 공격 등으로 인해 0이 1로 또는 1이 0으로 뒤바뀌는 현상으로, 프로세스 노드 축소·고클럭·저전압 추세와 맞물려 단순 신뢰성 이슈를 넘어 시스템 전반의 구조적 보안 위협으로 진화하고 있다. 실제로 에어버스 A320 항공기 전체 기단의 리콜 사태가 태양 방사선에 의한 비행 제어 데이터 변조에서 비롯됐다. DRAM 셀 축소로 노이즈 마진이 낮아지고 rowhammer 공격 위험이 높아지며, AI/ML 신경망 가중치 단 1비트 변조만으로도 백도어 삽입이 가능하다. Secure-IC(Cadence), Synopsys, Rambus 전문가들은 ECC 단독으로는 불충분하며, CFI(제어 흐름 무결성)·물리적 메모리 감지·잠금 스텝(lockstep) 등을 계층적으로 결합하는 Defense in Depth 전략이 필수라고 강조한다.
핵심 인사이트
- 비트 플립은 이제 예외적 장애가 아닌 설계의 기본 가정이 되어야 하며, 첨단 노드에서 모델링되지 않은 비트 플립은 곧 설계 보안 취약점(gap)임
- rowhammer·클럭 글리칭·레이저 주입 등 의도적 fault injection이 보안 우회 수단으로 부상, 하드웨어 보안 IP 시장(Rambus, Secure-IC, Synopsys)의 수요 급증 예상
- ECC·CFI·물리적 센서·잠금 스텝을 계층화하는 Defense in Depth가 기술 표준으로 자리잡으며, 단일 완화책 의존 설계는 상용화·인증 단계에서 탈락 리스크 증가
- AI 가속기와 자동차·항공 등 고신뢰 시스템에서 비트 플립 방어 요구사항이 SI 설계 계약 조건에 포함되기 시작하는 단계로, 관련 EDA 도구 및 보안 IP 벤더에 신규 비즈니스 기회
2nm 이하 공정으로의 스케일링은 와트당 성능 향상을 위해 계속되고 있으나, 기술·경제적 복잡성이 전례 없는 수준으로 증가하고 있다. FinFET에서 GAA(Gate-All-Around) 나노시트 트랜지스터로의 전환은 이전 노드 전환 대비 1개 차원 이상 복잡성이 높으며, 금속 배선의 저항·열 이동·전기이동 문제가 신뢰성을 직접 위협한다. High-NA EUV 스캐너(Intel 기준 3억 5천만 달러 이상)가 도입되고, 다이 설계 비용은 일괄 working silicon까지 1억 달러를 초과한다. 칩렛·인터포저 기반 2.5D/3D 패키징은 수익과 물리적 한계를 동시에 늘리며, 하이브리드 본딩 피치는 35µm에서 9µm(Intel 18A 기준)으로 줄어들고 있다. Rapidus는 IBM 2nm 나노시트 기술 기반 양산을 2027년, 패키징을 2028년으로 계획하며, 실제 3D-IC 양산은 아직 어느 기업도 달성하지 못한 상태다.
핵심 인사이트
- GAA 나노시트 전환은 FinFET 대비 구조적 복잡도가 1개 오더 이상 증가, EDA·소재·공정 장비 전 영역에 동시 혁신이 요구됨
- 설계~테이프아웃 비용 1억 달러 초과로 사실상 AI 데이터센터 기업과 대형 파운드리 고객만이 첨단 노드 접근 가능 — 반도체 산업의 구조적 과점화 가속
- 완전 3D-IC는 2D 인터포저 대비 신호 경로·전력 밀도에서 도약적 개선을 이론상 제시하지만, 열 분산·수율·플로어플래닝 복잡도로 인해 양산 시점이 불확실한 상태
- Lam Research·Synopsys·proteanTecs 등 공정·EDA·인-칩 모니터링 업체가 마진 관리, 실시간 타이밍 가드밴드 계측 분야에서 신규 비즈니스 기회를 확보 중
2026년 1분기 반도체 스타트업 투자 시장은 80개사가 총 80억 달러 이상을 조달하며 강세를 보였다. 18개사가 1억 달러 초과의 메가 라운드를 달성했고, Rapidus(17억 달러)와 Cerebras(10억 달러)가 10억 달러를 돌파했다. AI 추론 칩, 칩간 인터커넥트, 포토닉스 분야가 투자를 주도했으며, EDA 자동화에 AI 에이전트를 적용하는 스타트업(Ricursive Intelligence: 3억 달러, ChipAgents: 5,000만 달러)도 주목받았다. 특히 6개 이상 스타트업이 최근 1년 내 추가 자금을 유치하며 재투자 빈도가 증가했다. 포토닉스 분야에서는 Ayar Labs(5억 달러), Olix(2.2억 달러), Neurophos(1.1억 달러) 등이 대규모 투자를 받았으며, 리소그래피·에피택시·전력 관리 등 제조·장비 분야의 신기술 스타트업도 자금을 유치했다.
핵심 인사이트
- AI 추론 칩과 데이터센터 인터커넥트 분야가 Q1 2026 반도체 스타트업 투자의 핵심 테마로, AI 인프라 수요가 스타트업 생태계 전반의 자금 흐름을 주도하고 있다.
- Ricursive Intelligence(3억 달러)·ChipAgents(5,000만 달러) 등 agentic EDA 플랫폼에 대한 대규모 투자가 집중되며, AI 기반 칩 설계 자동화가 독립 시장으로 부상하고 있다.
- 포토닉스 분야(Ayar Labs, Olix, Neurophos 등)가 AI 데이터센터 광 인터커넥트 수요를 기반으로 총 수억 달러 규모의 투자를 유치하며 차세대 고성장 섹터로 자리잡았다.
- Rapidus(17억 달러)의 대규모 전략적 투자 유치는 미국·한국 중심의 AI 칩 공급망에 일본 파운드리가 진입하는 지정학적 반도체 경쟁의 심화를 나타낸다.
Rowhammer 취약점이 수십 년간 DRAM 보안 위협으로 지속되고 있으며, 최근에는 유사 메커니즘인 Rowpress까지 등장해 상황이 악화되고 있다. Rowhammer는 셀 간 전자 간섭으로 발생하며, 공정 스케일링으로 셀 간격이 좁아질수록 심화된다. 이를 완화하기 위해 TRR, RFM, ARFM에 이어 행 단위로 동작하는 DRFM(Directed Refresh Management)이 DDR5, LPDDR5, HBM4에 표준화되었으나, DRFM 명령 자체가 새로운 전이적 Rowhammer 공격 수단으로 악용되는 역설이 발생했다. GDDR은 여전히 이러한 표준 명령을 지원하지 않는다. 근본적 해결책은 수직 트랜지스터를 사용하는 4F2 아키텍처로의 전환이지만, 이는 수년 후에나 양산 가능하며 기존 메모리 세대는 장기간 유지될 전망이다.
핵심 인사이트
- DRFM이 DDR5/LPDDR5/HBM4에 표준화됐지만, DRFM 명령 자체가 새로운 공격 벡터로 전용되는 Whac-A-Mole 구조적 문제가 반복되고 있다.
- 근본 해결책인 4F2 수직 트랜지스터 DRAM 셀은 인접 셀 간 기판 공유를 없애 Rowhammer를 원천 차단하지만, 양산까지 수년이 소요된다.
- DRAM 내부 레이아웃 비공개 정책이 메모리 컨트롤러 측 방어를 약화시키며, Microsoft 연구팀은 위상 공개가 더 효율적인 방어를 가능케 한다고 주장한다.
- 기존 DRAM 세대의 긴 수명을 고려할 때, 신규 셀 아키텍처 전환 이후에도 취약 메모리가 인프라에 수년간 잔류해 보안 리스크가 지속될 전망이다.
AI 시대를 맞아 코프로세서 아키텍처가 빠르게 진화하고 있지만, 단일 프로세서로 모든 워크로드를 효율적으로 처리하는 것은 여전히 불가능하다. CPU는 50년간 범용 연산의 핵심이었으나, AI의 등장으로 NPU, TPU, GPU 등 전용 가속기와의 협업 구조가 필수가 됐다. 핵심 병목은 연산 성능이 아니라 데이터 이동 효율성으로, 최고 TOPS가 아닌 최저 데이터 이동 에너지를 가진 코프로세서가 경쟁 우위를 갖는다. Arm은 agentic AI 워크로드가 CPU 바운드임을 강조하며 CPU 성능-전력비를 끌어올리는 전략을 택했고, RISC-V 기반 가속기는 제어·데이터 전송 오버헤드를 제거하는 통합 방향을 모색 중이다. UCIe, CXL 같은 표준이 물리·프로토콜 호환성을 제공하지만, 시스템 수준의 동작 통합은 여전히 미해결 과제다.
핵심 인사이트
- agentic AI 워크로드 확산으로 데이터센터에서 GPU 가속기의 토큰 처리 속도와 CPU의 데이터 전송 처리 속도 간 병목이 심화되고 있다.
- 데이터 이동 에너지가 연산 에너지보다 훨씬 크다는 원칙 하에, 코프로세서 선택 기준이 peak TOPS에서 데이터 이동 최소화 효율로 이동하고 있다.
- RISC-V ISA 기반 가속기는 제어 프로세서와 가속기를 통합해 오버헤드를 제거하는 방향으로 발전하며, 특화 아키텍처의 새로운 접근법을 제시한다.
- UCIe, CXL 표준이 물리·프로토콜 수준의 호환성을 해결했지만, 시스템 수준 동작 통합이 남은 핵심 과제로 칩렛 생태계 성숙을 좌우할 전망이다.
Edge AI 시대에 성능 지표가 peak TOPS에서 지연 시간 보장, 전력 효율, 메모리 대역폭, 모델 배포 속도로 근본적으로 전환되고 있다. Arm, Cadence, Rambus, Synopsys 등 업계 전문가들은 공통적으로 "평균이 아닌 매번" 지연 시간 목표를 충족해야 한다고 강조한다. Edge 추론에서 메모리 대역폭 요구치는 300~500 GB/s 이상이며, 워크로드가 연산이 아닌 대역폭에 의해 제한되는 경우가 많다. Cadence는 Edge 생성 AI에서 초당 40~50 토큰을 실시간 성능 기준으로 제시했다. 자동차·산업 분야에서는 1밀리초 미만 지연이 요구되며, 모델 교체 주기 단축에 따른 새 모델의 기존 하드웨어 신속 탑재(landing) 능력도 핵심 경쟁 요소로 부상했다. 이는 하드웨어·소프트웨어·모델 양자화를 아우르는 전체 스택 최적화 문제다.
핵심 인사이트
- Edge 추론의 메모리 대역폭 요구치가 300~500 GB/s 이상으로, 연산 성능보다 메모리 대역폭이 실질적 성능 병목이 되는 경우가 점증하고 있다.
- 자동차·산업 Edge AI에서 1밀리초 미만 지연이 요구되며, "평균 지연"이 아닌 "확정적 지연 보장"이 하드웨어 선택의 핵심 기준이 된다.
- 생성 AI 모델의 빠른 교체 주기로 인해 새 모델을 기존 하드웨어에 신속히 탑재하는 능력이 TOPS만큼이나 중요한 경쟁력 요소로 부상했다.
- 효과적인 TOPS/W 및 TOPS/mm² 지표가 순수 peak TOPS를 대체하며, 소형 폼팩터와 전력 제약 환경에서의 실질 성능을 측정하는 기준으로 확립되고 있다.
첨단 패키징에서 불량은 인터페이스에서 가시화되지만, 실제 원인은 소재, 기하학적 변동, 열-기계적 스트레스, 테스트 환경 전반에 걸쳐 분산되어 있다. 마이크로범프 크랙, TSV 저항 증가, 하이브리드 본드 불안정성은 초기에는 규격 내에 있다가 시간이 지남에 따라 서서히 저하되어 이진 테스트로는 감지되지 않는다. 특히 테스트 소켓(임시 상호연결)이 측정 체인에서 가장 큰 변수로 작용해, 소켓의 동적 변화 폭이 기판이나 실리콘의 변화보다 커지면 패키지 고유의 불량을 식별할 수 없게 된다. Bruker, proteanTecs, Nordson, Onto Innovation 등은 파라메트릭 드리프트, 박막 불균일성, 범프 잔류물 등을 탐지하기 위한 심층 텔레메트리와 다파장 계측 기술을 제시하고 있다. 결론적으로, 인터페이스 불량의 근원을 정확히 파악하려면 실시간 온-다이 파라메트릭 가시성이 필수적이다.
핵심 인사이트
- 첨단 패키징 불량의 상당수는 time-zero에서 스펙 내에 있다가 열-기계적 사이클링 중 드리프트하는 저항성 인터페이스 효과로, 기존 이진 테스트로는 탐지 불가하다.
- 테스트 소켓(임시 상호연결)이 측정 체인에서 가장 큰 변수로, 소켓 불량이 실리콘 불량으로 오진되어 불필요한 반복 테스트가 발생하는 구조적 문제가 존재한다.
- 박막 불균일성, 범프 산화·잔류물 등 초미세 결함이 첨단 노드에서 더 이상 무시할 수 없는 인터페이스 신뢰성 위협으로 부상하고 있다.
- proteanTecs의 심층 텔레메트리처럼 온-다이 파라메트릭 가시성을 구조적·기능적 테스트에 통합하는 솔루션이 첨단 패키징 시장의 핵심 투자 영역으로 성장하고 있다.
Anthropic이 Claude Code에 '루틴(Routines)' 기능을 출시했다. 루틴은 프롬프트·저장소·커넥터 설정을 저장해 Anthropic 클라우드 인프라에서 자동 실행되는 스케줄링 서비스로, 기존 cron job·GitHub Actions와 달리 AI가 맥락에 따라 동적으로 동작한다. Pro는 하루 5회, Max 15회, Team/Enterprise 25회 제한이며 초과 시 종량제 과금. 같은 날 Claude Code 데스크톱 앱도 개편해 통합 터미널, 인앱 파일 에디터, 빠른 diff 뷰어, 멀티세션 관리를 추가했다. The Register는 이를 Anthropic이 개발자 인터페이스를 직접 장악하려는 전략으로 해석했다.
핵심 인사이트
- 루틴 = AI 기반 동적 cron job - 맥락 인식 자동화로 고정 스크립트 한계 극복
- Anthropic 관리 클라우드 실행 - 노트북 꺼져도 작동, 자체 인프라 의존성 심화
- Claude Code 데스크톱 통합 에디터 추가 - VS Code·서드파티 의존 탈피, 생태계 독점 의도
- Pro/Max/Team 사용 한도 차등 - 구독 등급별 루틴 사용량 제한으로 업셀링 유도
Nvidia가 양자 컴퓨터의 핵심 난제인 에러율 감소를 위한 오픈 웨이트 AI 모델 패밀리 'Ising'을 공개했다. 현재 최고 수준 양자 시스템도 1,000회 연산당 1회 오류가 발생하며 실용화를 위해서는 10억 배 개선이 필요하다. Ising Calibration(350억 파라미터 비전-언어 모델)은 양자 시스템 노이즈 최소화 설정을 자동화하고, Ising Decoding(91만~179만 파라미터 CNN)은 에러를 실시간 감지·수정하며 기존 PyMatching 대비 2.25~2.5배 빠르다. 가중치는 Hugging Face에 공개됐으며, Nvidia는 이 모델 외에도 하드웨어·소프트웨어·연구센터 등 양자 생태계 투자를 확대 중이다.
핵심 인사이트
- 양자 에러율 10억 배 감축 목표 - AI 기반 캘리브레이션·디코딩으로 실용화 로드맵 제시
- Ising Calibration 350억 파라미터 - RTX Pro 6000 Blackwell에서 경량 실행 가능
- Ising Decoder, PyMatching 대비 2.25~2.5배 빠른 실시간 에러 수정 - 속도 우위
- 오픈 웨이트 공개 + 합성데이터 훈련 프레임워크 - 양자 업체별 파인튜닝 생태계 조성
Stanford 대학교 HAI(인간중심 AI 연구소)의 2026 AI Index Report에 따르면, AI는 PC나 인터넷보다 빠른 3년 만에 전 인구의 53%에 도달하며 대중화를 완성했다. 그러나 안전 기준이 능력 발전을 따라가지 못하면서 2025년 실제 AI 피해 사고가 362건으로 전년 대비 55% 급증했다. AI 전문가와 일반 대중 모두 선거와 인간관계 훼손을 AI 최대 위험으로 꼽았다. 미국 AI 투자액은 $2,859억으로 중국의 23배이나, AI 연구인력의 미국 유입은 2017년 대비 89% 급감했다. Arena 벤치마크에서 Claude Opus 4.6과 ByteDance Dola-Seed Preview의 점수 차이가 2.7%포인트에 불과해 미중 AI 성능 격차가 사실상 소멸했다.
핵심 인사이트
- AI 피해 사고가 1년 만에 55% 급증(233건→362건)했음에도 안전 규제 체계가 따라가지 못해 기업 AI 리스크 관리 부담이 증가할 전망
- Arena 벤치마크 미중 격차 2.7%포인트 수준으로 수렴은 미국 독점 AI 기술 우위 전략의 실효성에 근본적 의문을 제기
- 미국 AI 연구인력 유입 89% 급감은 단기적 수치 우위에도 불구하고 장기 기술 경쟁력 기반이 붕괴 중임을 시사
- 전문가들이 2030년까지 생성형 AI가 미국 근무시간의 80%에 기여할 것으로 전망해 기업 조직 구조·인력 계획 전면 재편이 불가피
텍사스 출신 20세 Daniel Moreno-Gama가 4월 10일 Sam Altman의 샌프란시스코 자택에 화염병을 투척한 후 OpenAI 본사 유리문을 의자로 파손하려 한 혐의로 살인미수 등 중범죄로 기소됐다. 체포 당시 등유·라이터와 함께 AI CEO 및 투자자의 개인정보 목록, AI 경영진 살해를 촉구하는 3부작 문서가 발견됐다. 미 검사는 이를 공공 정책 변화를 강요하기 위한 행위일 경우 국내 테러로 기소할 것이라고 밝혔다. AI 기술에 대한 반발이 물리적 위협으로 이어진 사례로 AI 업계 보안 우려가 고조됐다.
핵심 인사이트
- AI 반발 물리적 위협화 - AI CEO 개인정보 목록 소지, 체계적 타깃 선정 시사
- 살인미수 외 국내 테러 혐의 검토 - AI 기술 반대 운동의 과격화 경계선
- OpenAI 본사 공격 시도까지 - 개인 자택에서 기업 시설로 확대된 위협 범위
- AI 기업 물리적 보안 취약성 노출 - 업계 차원의 보안 강화 논의 불가피
Anthropic의 Claude 서비스가 품질 저하와 장애 이슈로 사용자 불만이 급증하고 있다. 4월 13일에는 15:31~16:19 UTC 사이 Claude.ai와 Claude Code에 주요 장애가 발생했으며, GitHub 이슈 분석 결과 품질 관련 클레임이 4월 들어 13일 만에 20건을 넘어 3월 전체(18건)를 이미 초과할 페이스다. Claude 자신이 자체 GitHub 이슈를 분석한 결과 "품질 불만이 급격히 증가했다"고 결론 내렸다. 다만 SWE-Bench-Pro에서 Opus 4.6의 객관적 점수 하락은 확인되지 않아, 체감 저하와 벤치마크 사이 괴리가 존재한다.
핵심 인사이트
- Claude 자체가 품질 저하를 인정 - AI가 자신의 결함 진단, 신뢰도 논란 역설
- 4월 품질 이슈 폭증(월말 전 이미 전월 초과) - 피크타임 용량 조절의 부작용 의심
- SWE-Bench-Pro 점수 유지 vs 체감 저하 - 벤치마크와 실사용 경험 간 괴리 노출
- AI 생성 GitHub 이슈 증가로 통계 오염 가능성 - 오픈소스 커뮤니티 신뢰성 문제
Anthropic이 Claude Code의 프롬프트 캐시 TTL(유효시간)을 2월 1일 1시간으로 연장했다가 3월 7일 다시 5분으로 단축하면서 사용자 할당량 고갈 불만이 폭증했다. 5분 TTL은 장시간 고컨텍스트 세션 중심인 Claude Code 특성상 불리하며, 특히 1M 토큰 컨텍스트 창 사용 시 캐시 미스가 발생하면 비용이 폭등한다. Anthropic 측은 서브에이전트를 많이 쓰는 원샷 요청에는 5분 TTL이 오히려 저렴하다고 해명했으나, 월 $200 구독자가 처음으로 할당량 한도에 부딪히는 사례가 속출하고 있다. Claude Code 개발자 Boris Cherny는 기본 컨텍스트 창을 40만 토큰으로 줄이고 100만 토큰은 선택 옵션으로 전환하는 방안을 검토 중이라고 밝혔다.
핵심 인사이트
- 캐시 TTL 단축이 장기 세션 사용자에게는 사실상 가격 인상으로 작용해 Anthropic의 가격 정책 투명성에 대한 신뢰가 훼손될 위험
- 1M 토큰 컨텍스트 창의 캐시 미스 비용 급증 문제는 초대형 컨텍스트 제공이 오히려 비용 불확실성을 키우는 역설적 결과를 낳아 경쟁사 대비 차별화 전략 재검토 필요성 제기
- 할당량 소진 문제가 캐시 정책만의 문제가 아닐 수 있다는 의혹 — "쿼터가 예전보다 적은 처리 시간을 구매"한다는 분석은 실질 서비스 품질 저하 가능성을 시사
- 컨텍스트 창 기본값 40만 토큰으로 하향 검토는 인프라 비용 압박을 반영하며 AI 코딩 어시스턴트 시장의 지속가능한 가격 모델 정립이 업계 공통 과제임을 드러냄
AI가 법률 분야에서 환각(hallucination)으로 인한 피해가 급증하고 있다. 법정 제출 서류에 AI가 생성한 가짜 판례가 포함되는 사건이 전 세계에서 폭발적으로 증가하여, HEC Paris가 세계 각지에서 수집한 1,200건 중 800건이 미국 사례다. 10개 법원관할권에서 하루에 10건의 AI 환각 사례가 동시에 접수되기도 했다. 법원이 수십만 달러의 과태료를 부과하고 경고를 강화해도 이 추세는 계속 악화되고 있다. 책임감 있는 변호사들도 AI 검증에 절약 시간만큼 시간을 써야 한다고 인정하지만 그래도 가치 있다는 평가다.
핵심 인사이트
- AI 법률 환각 1,200건 기록(세계) - 미국이 800건으로 66% 차지, 확산 추세
- 10개 법원관할권서 하루 10건 동시 접수 - 산발 사건에서 구조적 전염 단계로 진입
- 수십만 달러 과태료 부과에도 지속 - AI 생산성 유혹이 전문가 윤리 판단 압도
- AI 환각, 다른 산업에서는 법조계보다 더 불투명 - 법률이 AI 한계 드러내는 '카나리아'
Oracle이 Bloom Energy와 총 2.8 GW 규모의 연료전지 공급 계약을 확대 체결하며 데이터센터 전력 자급을 위한 연료전지 도입을 가속화하고 있다. 이미 1.2 GW 초기 계약이 진행 중이며 올해부터 배포를 시작해 2027년까지 이어진다. Oracle-OpenAI $3,000억 AI 인프라 계약(약 4.5 GW 컴퓨팅 용량)에 따른 급격한 전력 수요 증가에 대응하는 조치다. 미국 전력망 연결 대기는 최대 7년에 달해, 현장 분산 발전이 데이터센터 확장의 병목을 해소하는 핵심 수단으로 부상하고 있다.
핵심 인사이트
- Oracle 연료전지 총 2.8 GW - AI 데이터센터 전력 자급의 새로운 표준 제시
- Bloom Energy, OCI 사이트에 90일 목표 대비 55일 조기 납품 - 속도 경쟁력 입증
- 미국 전력망 연결 최대 7년 대기 - 현장 발전이 데이터센터 입지 선택의 핵심 변수
- 가스터빈 장비 부족으로 연료전지 대안 부상 - AI 인프라 에너지 솔루션 다양화
일본 신생 파운드리 Rapidus가 2027년 하반기 홋카이도 2nm 팹 양산을 목표로 빠르게 전진하고 있다. IBM의 2nm GAA 공정 기술을 라이선스해 5년 만에 최첨단 파운드리를 구축하는 전략으로, 이미 300mm 웨이퍼 파일럿 생산을 시작하고 부분 PDK를 배포했으며 연내 전체 PDK 출시를 예고했다. 일본 경제산업성은 6,315억 엔($39.6억)을 추가 승인했다. Rapidus의 차별화 전략은 소량 맞춤 생산과 짧은 제조 사이클 타임으로 n-1 노드를 선호하는 설계사에 대응하는 것이며, 어드밴스드 패키징 역량도 동시에 개발 중이다.
핵심 인사이트
- 일본 Rapidus, 2027년 하반기 2nm 양산 목표 - 창업 5년 만에 최첨단 파운드리 달성 시도
- IBM 2nm GAA 공정 라이선스 - 자체 개발 없이 기술 단축으로 속도 확보
- 일본 정부 6,315억 엔 추가 투입 - 반도체 주권 회복을 국가 전략으로 격상
- 소량 맞춤·단납기 전략 - TSMC·삼성과 직접 경쟁 대신 틈새 시장 공략
일본 JAXA가 2025년 12월 H3 로켓 2단계 실패의 원인이 위성 탑재체 고정 부품의 접착제 결함임을 밝혔다. 제조 중 예상보다 높은 온도에 노출돼 접착제가 약해진 탓에 페어링 분리 시 해당 부품이 층간 분리(delamination)됐고, 위성이 예상치 못한 움직임을 보이며 2단계 연료 파이프를 파손했다. 탑재 위성이 이례적으로 무거웠기 때문에 결함이 처음 드러났다. JAXA는 제조 공정 전면 재검토와 H3 설계 변경을 검토 중이며, 항법위성은 회수 불가 손실 처리됐다.
핵심 인사이트
- 접착제 온도 초과→층간 분리→연료관 파손 연쇄 장애 - 우주 임무의 극한 제조 정밀도 요구
- 특이 무거운 탑재물에서만 결함 발현 - 일반 조건 테스트로는 발견 불가 잠재 결함 유형
- H3 설계 변경 검토 - 단순 공정 개선 넘어 구조적 재설계 필요 가능성
- 항법위성 손실 - 일본 자체 위성항법 시스템 구축 일정에 차질 우려
Boston Dynamics의 4족 보행 로봇 Spot에 Google DeepMind의 Gemini Robotics-ER 1.6 구현 추론 모델이 탑재됐다. 이 통합으로 Spot은 위험 잔해·누출 식별, 산업용 계기판 해석 등 복잡한 자율 점검 작업을 수행할 수 있게 됐다. 안전 추론 기능(예: 컵을 테이블 가장자리에 놓으면 쏟아질 수 있다는 판단)이 내장됐으나, 충분한 촉각 센서 학습 데이터 부족으로 현재는 시각 데이터만 활용한다. Boston Dynamics는 신기능 출시 전 선별 고객과의 베타 프로그램으로 신뢰성을 검증하며, 80% 이상의 정확도가 운영자 신뢰 유지의 핵심 임계값으로 설정됐다.
핵심 인사이트
- Gemini Robotics-ER 1.6 상용 로봇 탑재 - AI 추론의 물리 세계 배포 이정표
- 계기판·산업 게이지 자율 해석 가능 - 인간 접근 위험 구역 원격 점검 실용화
- 80% 이상 정확도 신뢰 임계값 - 산업 현장 AI 로봇 수용성의 정량 기준 제시
- 촉각 학습 데이터 부재가 현 한계 - 멀티모달 센서 통합이 차세대 과제
NASA Perseverance 화성 로버가 1,312번째 화성일 기준 주행의 약 90%를 자율로 수행해 Curiosity(6.2%)를 압도하는 자율주행 기록을 달성했다. 핵심은 Enhanced Autonomous Navigation(ENav) 알고리즘으로, 약 1,700개 경로 후보를 분석해 최적 경로를 선택하며, 1990년대 후반 iMac G3 수준의 방사선 경화 프로세서에서 구동된다. 특히 주행과 경로 계산을 동시에 처리해 Curiosity 대비 10배 빠른 속도를 실현했다. 2023년 4월 3일 331.74m 하루 최장 자율주행 기록을 세웠으며, Jezero 크레이터 고대 강 삼각주 탐사에서 24일 동안 하루 평균 201m 95% 자율주행을 유지했다.
핵심 인사이트
- 자율주행 비율 6.2%→90% - Curiosity 대비 14.5배 향상, 심우주 탐사 자율화 패러다임 전환
- 1990년대 PC 수준 프로세서로 1,700개 경로 실시간 분석 - 경량 알고리즘 최적화의 기준
- 주행·계산 동시 처리로 10배 속도 향상 - 실시간 자율 탐사의 핵심 알고리즘 혁신
- 331.74m 화성 하루 최장 자율주행 - 미래 화성 유인 탐사 선행 인프라 검증
독일 라이프치히 응용정보학연구소의 Bianca Reichard 팀이 수술 중 환자의 통증을 비접촉 방식으로 측정하는 머신러닝 시스템을 개발했다. 원격 광혈류측정법(rPPG, 피부 반사광으로 혈류량 변화 감지)과 안면 표정 분석을 결합해 통증을 추정한다. BioVid 통증 데이터베이스와 심장 카테터 환자 29명의 데이터로 훈련했으며, 불량 조명·얼굴 가림 등 비이상적 조건의 30분~3시간 영상을 학습에 사용해 45%의 통증 예측 정확도를 달성했다. 이 시스템은 의사 표현이 어려운 영아·치매 환자의 수술 통증 모니터링에 특히 유용할 것으로 기대된다.
핵심 인사이트
- 비접촉 rPPG + 안면 분석 통증 측정 - 영아·치매 환자 수술 안전성 향상 가능
- 45% 예측 정확도 - 비이상 실제 조건에서 기존 단기 클립 훈련 모델 능가
- 30분~3시간 현실 영상 학습 - 단기 이상 조건 데이터 편향 극복한 훈련 방법론
- 더 복잡한 신경망 활용 시 추가 개선 가능 - 임상 적용까지 추가 연구 필요
AI 연구자들이 AGI 달성을 수십 년이 아닌 수 년 내로 예측하지만, AGI를 어떻게 정의하고 측정할지에 대한 합의가 없다. 튜링 테스트는 GPT-4.5가 73% 인간 기만에 성공했음에도 기본 연산 실패로 무용지물이 됐다. François Chollet의 ARC-AGI-2 벤치마크는 인간 60% vs 최고 AI 16%의 격차를 보이며, OpenAI 미공개 모델이 88% 달성했지만 퍼즐당 약 $2만의 비용이 들었다. Geoffrey Hinton은 AI가 인간보다 설득력이 뛰어나다는 연구에 놀랐으며, 배관 같은 물리 작업은 10년간 어려울 것이라 예측했다. AGI 용어 자체는 열망이나 우려를 표현하는 약어로서는 유용하나 정밀한 측정 도구로는 한계가 있다.
핵심 인사이트
- ARC-AGI-2 인간 60% vs AI 16% - 추상 추론 능력의 현격한 격차, AGI 아직 요원
- OpenAI 모델 88% 달성, 비용 퍼즐당 $2만 - 성능 달성해도 비용 효율성이 AGI 척도
- GPT-4.5 튜링 테스트 73% 통과 + 기본 연산 실패 - 벤치마크와 실용 지능 간 괴리
- 'AGI' 정의 미합의 - 성능·아키텍처·경제적 영향 등 측정 기준 논쟁 지속
스탠퍼드대 HAI센터가 발표한 2026년 AI Index 보고서(400페이지 이상)에 따르면, 2025년 전 세계 AI 투자액은 5,810억 달러로 전년 대비 두 배 이상 증가했으며 미국이 3,440억 달러로 선도한다. 미국 기업들이 AI 모델 출시를 주도하나 중국이 빠르게 격차를 좁히고 있다. 산업용 로봇 설치에서는 중국이 29만5,000대로 압도적 선두다. 전 세계 AI 컴퓨팅 용량은 2022년 이후 연 3.3배 성장했으며 Nvidia GPU가 60% 이상을 점유한다. 최신 LLM 훈련 시 탄소 배출량은 Grok 4 기준 7만2,000톤으로 GPT-4 대비 14배 증가했다. AI에 대한 공중 신뢰는 소폭 개선됐으나 52%는 여전히 AI 탑재 제품에 불안감을 표했다.
핵심 인사이트
- AI 모델 성능 성숙화: Humanity's Last Exam에서 최고 모델들이 50%를 상회하며 벤치마크 정복 속도가 가파르게 상승 중
- 상용화 가속: OpenAI·Anthropic 모두 올해 IPO를 앞두고 있어 AI 산업의 공개시장 진입 원년이 될 전망
- 산업 이중성: AI 노출도가 높은 근로자보다 낮은 근로자의 실업률이 더 높아져 AI 영향의 복잡성 확인
- 경쟁·투자 관점: 중국의 로봇·AI 모델 추격과 미국의 데이터센터 규제 확산이 지정학적 AI 패권 경쟁의 핵심 변수로 부상
AI 학습의 막대한 에너지 소비 문제를 해결하기 위해 분산 학습(decentralized training) 접근법이 주목받고 있다. 기존 단일 데이터센터 집중 방식 대신, 지리적으로 분산된 노드 네트워크에 학습을 분배해 유휴 서버·태양광 가정용 GPU 등 기존 자원을 활용한다. Google DeepMind의 DiLoCo 알고리즘은 '컴퓨트 섬' 개념으로 통신 빈도를 줄이면서 내결함성을 확보했고, Prime Intellect는 이를 적용해 10B 파라미터 INTELLECT-1을 5개국 3개 대륙에 걸쳐 학습시켰다. 0G Labs는 107B 파라미터 모델을 DiLoCo 변형으로 분산 클러스터에서 학습했으며, Akash Network는 2027년까지 태양광 가정집을 데이터센터로 전환하는 Starcluster 프로그램을 추진 중이다.
핵심 인사이트
- DiLoCo의 'islands of compute' 아키텍처가 통신 비용을 획기적으로 줄이고 노드 장애 시 배치 전체 재시작 문제를 해결, 분산 학습 실용성 입증
- Streaming DiLoCo가 동영상 스트리밍처럼 계산 작업 중 지식을 점진적으로 동기화해 대역폭 요구사항을 추가 단축, PyTorch 내결함성 라이브러리에 공식 포함
- GPU-as-a-Service 모델(Akash Network 등)이 유휴 컴퓨팅 자원 수익화를 가능케 해 소규모·중형 GPU 보유자 참여 생태계 형성, 클라우드 컴퓨팅 시장 구조 변화 촉진
- 태양광 가정집·학교·지역 시설로 AI 학습 인프라를 분산하는 Starcluster 모델이 새로운 에너지 효율적 AI 학습 비즈니스 모델로 부상, 2027년 상용화 목표
자율 AI 시스템이 충돌·오류 없이 조용히 실패하는 'quiet failure' 현상이 새로운 엔지니어링 과제로 부상하고 있다. 모든 모니터링 대시보드가 정상을 표시하면서도 시스템의 실제 동작이 의도한 목적에서 벗어나는 현상으로, 기존 업타임·레이턴시·오류율 중심의 관찰 가능성(observability) 도구로는 감지가 불가능하다. AI 시스템은 각 결정이 다음 행동에 영향을 미치는 연속 추론 루프 구조를 가지므로, 구성 요소별 정상 작동이 시스템 전체 정확성을 보장하지 않는다. 해결책으로 항공·발전소 등 산업 도메인의 감독 제어(supervisory control) 개념을 소프트웨어 AI 시스템에 적용해, 동작이 허용 범위를 벗어날 때 실시간 개입하는 행동 제어(behavioral control) 아키텍처가 요구된다.
핵심 인사이트
- AI 자율 시스템의 연속 추론 루프 구조에서 국소적으로 올바른 단계들이 누적되어 전역적으로 잘못된 결과를 초래하는 '조용한 실패' 패턴은 기존 observability 도구의 근본적 한계를 드러냄
- 전통적 소프트웨어의 요청-처리-응답 구조와 달리 AI 에이전트의 지속적 관찰-추론-행동 루프는 시스템 신뢰성의 정의 자체를 구성 요소 정확성에서 시간에 따른 행동 정렬로 전환
- 항공 비행 제어·전력망·제조 공장에서 검증된 감독 제어 시스템(supervisory control) 개념을 AI 소프트웨어에 도입해 출력 패턴 이상·유사 입력 불일관 처리 등 행동 드리프트를 실시간 감지
- 클라우드 인프라·로보틱스·대규모 의사결정 시스템 등으로 AI 자율성 확산에 따라 'behavioral reliability' 보장 솔루션이 AI 안전성 분야의 핵심 상업 기회로 성장 전망
Nvidia가 양자 컴퓨팅의 두 가지 핵심 병목인 캘리브레이션과 에러 디코딩을 해결하기 위한 오픈 소스 AI 모델 패밀리 'Ising'을 발표했다. 현재 최고 양자 프로세서는 1,000번 연산당 1번 오류가 발생하지만, 실용화를 위해서는 1조분의 1 이하가 필요하다. Ising Calibration(350억 파라미터 VLM)은 캘리브레이션을 수일에서 수 시간으로 단축하고, Ising Decoder(91만~179만 파라미터 CNN)는 PyMatching 대비 2.5배 빠른 속도 또는 3배 정확한 에러 수정을 제공한다. Nvidia는 "AI가 양자 하드웨어의 제어 플레인"이라 표현하며 CUDA-Q, NVQLink와 통합해 Quantum-GPU 수퍼컴퓨팅 생태계를 구축하고 있다.
핵심 인사이트
- AI가 양자 제어 플레인 역할 - 큐비트 노이즈 관리의 유일한 현실적 확장 경로
- Ising Calibration: 캘리브레이션 수일→수 시간 단축 - 상용 QPU 1M+ 큐비트 시대 전제 조건
- Ising Decoder: PyMatching 대비 2.5배 속도 / 3배 정확도 - 오픈소스로 양자 업계 표준화 시도
- Nvidia 시가총액 $4.5조의 양자 투자 - HPC·AI·양자 3자 융합 생태계 선점 전략
Anthropic의 Mythos 모델(코드명 Capybara)과 Meta의 Muse Spark 프론티어 모델이 동시에 공개됐다. Mythos는 Opus 4.6보다 대폭 향상된 능력을 가지며, 보안 취약점 발견 능력이 뛰어나 AWS, Apple, Broadcom, Google, Microsoft 등 주요 파트너들에게만 선공개됐다. 코드명은 Capybara이며, 10조 파라미터 추정치가 있으나 확인되지 않았다. Meta의 Muse Spark는 Llama 4 Maverick 대비 10분의 1 컴퓨팅으로 훈련됐으며, 상위 5위 프론티어 모델이지만 오픈소스는 아니다. Llama 4 Behemoth(2조 파라미터 MoE)는 결국 출시되지 못해 Zuckerberg가 Scale AI를 $143억에 인수하는 계기가 됐다.
핵심 인사이트
- Mythos, 주요 OS·브라우저 보안 취약점 수천 건 발견 - 공개 배포 보류의 직접 원인
- AWS·Apple·Google·Microsoft 등 11개 파트너만 Mythos 접근 - Project Glasswing 방어적 사용
- Meta Muse Spark, Maverick 대비 10배 적은 컴퓨팅으로 훈련 - 효율성 향상 입증
- Llama 4 Behemoth 출시 실패→Scale AI $143억 인수 - AI 프론티어 경쟁 구조 재편
Nutanix CEO Rajiv Ramaswami가 GPU 가상화를 CPU 가상화 혁명처럼 추진하겠다고 밝혔다. NX-AI 인프라와 AOS 7 소프트웨어 스택을 통해 GPU 공유 및 멀티테넌시를 지원한다. Broadcom의 VMware 인수로 발생한 약 30만 VMware 고객 중 16만 5천 개를 타깃으로 분기당 500~1,000개 전환 중이다. GPU 메모리가 컴퓨팅보다 더 중요한 병목 자원으로 부상했으며, Nvidia MIG 및 AMD 동등 기술 기반 하이퍼바이저 수준 멀티테넌시를 구현한다. NetApp과의 이례적 파트너십 외에 AMD가 전략적 투자를 단행했다.
핵심 인사이트
- GPU 가상화 시장은 VMware가 구현한 CPU 가상화 패러다임과 동일한 진화 경로를 밟고 있어 Nutanix가 핵심 수혜자가 될 전망
- Broadcom의 VMware 인수로 이탈 고객 16만 5천 개가 Nutanix의 핵심 공략 대상으로, 분기당 500~1,000개 전환이 진행 중
- GPU 메모리 대역폭·용량이 LLM 추론의 핵심 병목으로 부상하며 멀티테넌트 GPU 공유 솔루션의 비용 효율이 강조됨
- AMD의 Nutanix 전략적 투자는 Nvidia 독주 견제를 위한 엔터프라이즈 소프트웨어 생태계 확장 전략의 일환
Meta Platforms가 CoreWeave와 추가 210억 달러 규모의 AI 컴퓨팅 용량 계약을 체결해 CoreWeave의 수익 백로그가 878억 달러로 확대됐다. Meta와 OpenAI가 전체 백로그의 약 65%를 차지한다. CoreWeave는 2025년 매출 51.3억 달러(전년 대비 2.7배)를 기록했으나 순손실 11.7억 달러를 냈다. 현재 약 60만 개 GPU(H100/H200 중심, B200/B300 증가)와 850MW 가동 전력을 보유하며, 잔여 계약 전력 2.25GW 구축을 위해 1125억 달러가 필요하다. 이를 위해 최대 47.5억 달러 규모 선순위 채권 발행을 추진 중이다.
핵심 인사이트
- Meta와 OpenAI 두 고객이 CoreWeave 백로그 65%를 차지해 고객 집중 리스크가 구조적 취약점으로 작용
- 2025년 매출 2.7배 성장에도 순손실 11.7억 달러로, 규모 확장이 수익성 확보보다 선행하는 전형적 하이퍼스케일 성장 패턴
- 잔여 계약 전력 2.25GW 구축에 약 1125억 달러 소요 예상으로 외부 자본 조달 의존도가 극히 높은 재무 구조
- 기존 GPU 자산 150~200억 달러 상당이 사실상 담보 역할을 하며 채권 발행과 IPO를 통한 복합 금융공학 전략 구사
Meta Platforms의 자체 AI 가속기 MTIA 로드맵이 6세대에 걸쳐 2027년까지 추론 처리량을 293배 향상하고 추론당 비용을 9.1배 절감하는 것을 목표로 한다. MTIA 300은 멀티칩 설계로 HBM3 메모리를 탑재했으며, MTIA 400은 다이 수를 2배로 늘리고 HBM3E를 채택해 72개 장치가 공유 메모리 도메인 내에서 연결된다. MTIA 450은 HBM4로 전환해 메모리 대역폭 18.4 TB/sec를 달성하며, 설계의 핵심 드라이버는 DLRM을 LLM처럼 처리하는 HSTU(Hierarchical Sequential Transduction Unit) 기법이다.
핵심 인사이트
- MTIA 로드맵은 HSTU 기반 생성형 추천 모델(DLRM v3)에 최적화된 코설계 전략으로, Nvidia 의존 탈피와 동시에 LLM 추론 지원 이중 목적 달성
- 2023~2027년 추론 처리량 293배 향상·비용 9.1배 절감 목표는 초거대 소셜 플랫폼 운영의 경제성 압박을 반영한 공격적 성능 로드맵
- HBM3→HBM3E→HBM4 전환 경로와 멀티칩 설계의 연속적 채택은 메모리 대역폭이 AI 가속기 경쟁력의 핵심 지표임을 재확인
- MTIA 400이 테스트 완료 후 배포 준비 단계에 진입해 Broadcom과 공동 설계한 자체 칩이 실제 대규모 상용 인프라로 전환되는 임계점 도달
Nutanix가 연례 고객 컨퍼런스에서 Agentic AI 시대를 위한 통합 클라우드 플랫폼을 발표했다. Nutanix Service Provider Central은 동일한 물리적 GPU 인프라 위에서 여러 조직의 멀티테넌시를 강화하며, 네오클라우드와 엔터프라이즈 모두를 타깃으로 한다. 빠른 GPU 자산 감가상각 속에서 복잡한 자체 구축보다 완성된 스택 구매가 더 합리적이라는 논리가 핵심이다. NetApp·Cisco·Lenovo·Dell과의 파트너십 확대, NKP Metal(베어메탈 Kubernetes), AMD GPU 서버 지원 추가 등이 발표됐다.
핵심 인사이트
- GPU 자산의 빠른 감가상각과 전력·냉각 인프라 부족이 네오클라우드의 자체 구축 전략을 압박하며 통합 플랫폼 구매 수요를 견인
- Nutanix의 멀티테넌시 프레임워크는 GPU-as-a-Service, K8s-as-a-Service, Models-as-a-Service까지 세분화된 서비스 카탈로그를 지원해 네오클라우드 수익화 모델 다변화 가능
- 컨퍼런스 참석자 5분의 1이 VMware 이탈 검토 중으로, Broadcom의 VMware 인수 후폭풍이 지속적인 고객 전환 동력으로 작용
- NetApp과의 "이전에는 상상할 수 없었던" 전략적 제휴는 AI 인프라 통합 수요가 경쟁사 간 협력을 이끌어내는 산업 재편의 신호
Anthropic이 Claude Code를 앞세운 코드 어시스턴트 시장에서 폭발적 성장을 기록하며 ARR이 2026년 2월 140억 달러에서 이번 주 300억 달러로 두 배 이상 증가했다. 이에 따라 Broadcom-Google-Anthropic 간 장기 공급 계약이 확대됐다. Google은 Broadcom과 TPU 개발·제조 및 네트워킹 부품 공급보증 계약(2031년까지)을 체결했고, Anthropic은 2027년부터 자체 데이터센터에 Broadcom 제조 TPU 랙을 직접 설치할 계획이다. TPU 인프라 비용은 Nvidia 대비 약 30~35억 달러/GW 수준으로 추정된다.
핵심 인사이트
- Anthropic의 ARR이 140억→300억 달러로 급등하며 코드 어시스턴트가 GenAI 킬러앱으로 확립되고 AI 인프라 투자 수요가 구조적으로 확대되는 중
- Google이 Broadcom을 Anthropic용 TPU OEM으로 활용하는 구조는 Google의 TPU 비용을 간접 보전하는 동시에 Anthropic의 멀티소스 전략을 지원하는 복합 설계
- Anthropic의 2027년 자체 TPU 데이터센터 구축 계획은 클라우드 임차에서 자체 인프라 소유로의 전환을 예고하며 대규모 IPO 자금 조달의 명확한 동인 제시
- OpenAI 대비 Anthropic의 낮은 누적 투자액(670억 vs 1680~1990억 달러)과 빠른 ARR 성장은 상대적 저평가 논리로 IPO 밸류에이션에서 유리하게 작용
한국 AI 칩 스타트업 Rebellions AI가 4억 달러 규모의 Series D "Pre-IPO" 라운드를 완료해 총 누적 투자액이 8억 5000만 달러를 돌파했다. 현재 기업 가치는 약 23억 4000만 달러이며 임직원 수는 300명 이상이다. 미래에셋금융그룹이 약 1억 9900만 달러로 리드 투자했고, 한국 정부의 "K-Nvidia 육성 프로젝트"를 위한 국가성장펀드($99.5B, 5년 계획)에서 첫 투자인 약 1억 6600만 달러도 집행됐다. 주요 제품인 Rebel100 가속기는 512 MB SRAM, 144 GB HBM3E, 4.8 TB/sec 메모리 대역폭을 갖추며, 32개 가속기로 구성된 RebelRack은 16 petaflops FP8 성능에 최대 7kW 전력으로 공냉 운용이 가능하다. 클라우드·네오클라우드·통신사 등 Nvidia 시스템의 대안을 모색하는 글로벌 고객을 타겟으로 IPO를 추진 중이다.
핵심 인사이트
- 한국 국가성장펀드(99.5B 달러)의 첫 AI 칩 투자처로 선정되며 Rebellions가 한국의 탈-Nvidia 전략 핵심 기업으로 부상
- RebelRack의 공냉 16 petaflops FP8 시스템은 액체냉각 없이 데이터센터 구축을 원하는 고객에게 중요한 운영비 절감 경쟁 우위 제공
- Samsung(제조)·SK Hynix(메모리)·Arm(CPU 파트너·투자자) 연합의 전략적 투자 구조로 한국 반도체 공급망 전체를 활용한 수직 통합 가속기 생태계 구축
- RebelPod(64~1,024 가속기) 클러스터와 400 Gb/sec Ethernet 기반 스케일아웃 구조로 추론 워크로드 전용 대형 AI 인프라 시장 직접 공략
Nvidia는 MLPerf Inference v6.0 벤치마크에서 소프트웨어 혁신으로 기록적인 성능을 달성했다. DeepSeek-R1 Interactive 벤치마크에서 초당 250,634 토큰을 생성하며 토큰 비용을 약 100만 토큰당 30센트로 낮췄다. Blackwell Ultra GPU를 탑재한 GB300 NVL72 시스템은 이전 버전 대비 1.21x~2.77x 속도 향상을 기록했다. Dynamo(분리형 추론 프레임워크), TensorRT-LLM, CUDA 커널 최적화 등 다층적 소프트웨어 전략이 성능 향상을 견인했으며, Groq 개발팀 인수($20B)와 LPU 추론 엔진 라이선싱도 기여했다. Nvidia는 하드웨어뿐 아니라 소프트웨어 플랫폼 전략으로 AMD, Intel, 하이퍼스케일러 자체 칩 대비 경쟁 우위를 강화하고 있다.
핵심 인사이트
- MLPerf v6.0에서 DeepSeek-R1 기준 초당 250,634 토큰 생성, 6개월 대비 최대 2.77x 성능 향상 달성
- AI 추론이 하이퍼스케일러·기업의 주요 워크로드로 부상하며 소프트웨어 최적화가 핵심 차별화 요소로 부각
- Dynamo 분리형 추론 프레임워크가 prefill/decode 단계 분리로 GPU 활용률과 처리량을 대폭 개선
- Groq 인수·LPU 기술 통합으로 Nvidia가 GPU 외 추론 전용 아키텍처 생태계까지 확장 중
Broadcom이 VMware Cloud Foundation(VCF)을 퍼블릭 클라우드의 프라이빗 클라우드 대안으로 적극 포지셔닝하고 있다. $69B에 VMware를 인수한 후 공격적 가격 인상으로 고객 이탈이 발생했지만, KubeCon Europe 2026에서 vSphere Kubernetes Service(VKS) 3.6을 발표하며 반전을 노리고 있다. VKS 3.6은 Kubernetes 1.35 지원, CNI 플러그인 통합, RHEL 9·Ubuntu 22.04/24.04·Windows Server 2022 등 OS 확장을 포함한다. F5 Big-IP, Kong API Gateway, Tigera Calico Enterprise 등 써드파티 통합도 강화했으며, Velero를 CNCF Sandbox에 기여했다. Hock Tan 사장은 "기업의 미래는 프라이빗 클라우드"라 강조하며 AI 워크로드의 온프레미스 회귀 수요를 겨냥하고 있다.
핵심 인사이트
- VKS 3.6이 Kubernetes 1.35·다중 OS 지원으로 엔터프라이즈 Kubernetes 플랫폼 경쟁력을 대폭 강화
- 퍼블릭 클라우드 비용 증가와 AI 워크로드 저지연 요구가 온프레미스 회귀(repatriation) 트렌드를 가속화
- NGINX Ingress 컨트롤러 은퇴에 맞춰 AVI 로드밸런서를 VKS 기본 통합으로 제시, 생태계 종속성 심화
- VMware 인수 후 신뢰 손상을 기술 혁신으로 만회하려는 Broadcom의 전략적 베팅이 성공 여부의 관건