한국어 뉴스 대시보드

TechCrunch

🆕 신규

OpenAI releases GPT-5.5 Instant, a new default model for ChatGPT

OpenAI가 GPT-5.3 Instant를 대체하는 GPT-5.5 Instant를 ChatGPT의 새 기본 모델로 출시했다. 법률·의료·금융 등 민감한 영역에서의 환각 현상 감소에 초점을 맞추면서도 빠른 응답 속도를 유지했다. 수학 평가 AIME 2025에서 81.2점(이전 65.4점)을 기록했으며, 멀티모달 추론 평가에서는 76점(이전 69.2점)으로 성능이 크게 향상됐다. 이전 대화, 저장 문서, 이메일을 연동해 개인화된 답변을 제공하는 메모리 기능이 강화됐으며, 유료 구독자부터 우선 제공된다. API에서는 'chat-latest'로 제공되며, 이전 버전은 3개월간 유료 사용자에게만 유지된다.

핵심 인사이트

AIME 2025 수학 평가에서 65.4점에서 81.2점으로 약 24% 향상되어 추론 능력이 크게 개선됐다.
법률·의료·금융 분야 환각 감소에 집중하며 엔터프라이즈 신뢰성 확보가 핵심 경쟁 전략으로 부상했다.
메모리 소스 투명성 기능 도입으로 사용자가 AI가 참조하는 정보를 직접 제어할 수 있게 됐다.
유료 구독자 우선 제공 및 이전 모델 3개월 한정 유지 정책으로 프리미엄 구독 이탈 방지에 활용한다.

TechCrunch

🆕 신규

PayPal says it's 'becoming a technology company again' — that means AI

PayPal이 AI 전환을 핵심으로 하는 대규모 구조조정을 선언했다. CEO Enrique Lores는 1분기 실적 발표에서 클라우드 네이티브 전환과 AI 기반 개발 프로세스 도입을 강조했다. 새로운 'AI 전환 및 간소화' 팀이 CEO 직속으로 신설되며, 향후 2~3년간 직원 20%(약 4,500명 이상)를 감축해 최소 15억 달러의 비용 절감을 목표로 한다. 사업은 결제 솔루션, 소비자 금융서비스(Venmo 포함), 결제 서비스 및 암호화폐의 3개 부문으로 재편된다. 1분기 매출은 84억 달러(전년 대비 7% 성장)로 예상치를 상회했지만, 약한 2분기 가이던스로 주가가 하락했으며, 주가는 2021년 고점 대비 80% 이상 하락한 상태다.

핵심 인사이트

AI 코딩 도구 도입에 뒤처진 PayPal이 경쟁사 대비 AI 전환 지연을 공개 인정하며 긴급 전환에 나섰다.
2~3년간 20% 인력 감축과 AI 결합으로 15억 달러 이상 비용 절감을 목표로 하는 구체적 로드맵을 제시했다.
Venmo의 독립 사업부 분리로 향후 매각 가능성이 열리며 사업 포트폴리오 재편 신호가 감지된다.
2021년 고점 대비 80% 하락한 주가 회복을 위해 AI 전환이 투자자 신뢰 회복의 핵심 카드로 활용된다.

TechCrunch

🆕 신규

Meta will use AI to analyze height and bone structure to identify if users are underage

Meta가 Facebook과 Instagram에서 미성년자를 탐지하기 위해 AI를 활용한 신체 특징 분석 기술을 도입한다고 발표했다. 이 시스템은 키와 골격 구조 등 시각적 단서를 분석해 나이대를 추정하며, 얼굴 인식과는 다른 접근법이라고 Meta는 강조했다. 시각 분석 외에도 생일 언급, 학년 표기 등 텍스트 패턴과 사용자 행동도 함께 분석한다. 미성년자로 의심되는 계정은 비활성화 후 나이 인증 절차를 거치도록 한다. 'Teen Accounts' 기능은 EU 27개국 및 브라질로 확대되고 미국·영국·EU에서 Facebook에도 적용된다. 이 조치는 2026년 3월 뉴멕시코 법원이 Meta에 3억 7,500만 달러의 민사 제재금을 부과한 데 따른 후속 대응이다.

핵심 인사이트

얼굴 인식이 아닌 신체 비례·골격 분석이라는 새로운 AI 기반 연령 추정 기술이 소셜 미디어에 도입됐다.
법원의 3억 7,500만 달러 제재 이후 플랫폼 안전 규제 압박에 대응한 선제적 기술 조치로 해석된다.
메시징·댓글을 제한하는 Teen Accounts의 EU 및 브라질 확장으로 글로벌 아동 보호 규제 준수가 강화된다.
텍스트·행동·시각 데이터를 복합 분석하는 다중 신호 탐지 방식이 AI 콘텐츠 모더레이션의 새 표준이 될 수 있다.

TechCrunch

🆕 신규

Hackers steal students' data during breach at education tech giant Instructure

교육 기술 기업 Instructure가 ShinyHunters 해킹 그룹에 의한 대규모 데이터 침해 사실을 확인했다. Canvas 학습관리시스템(LMS)을 운영하는 Instructure는 전 세계 약 8,000개 기관을 고객으로 보유하고 있다. 유출된 데이터에는 학생 이름, 개인 이메일, 교사-학생 간 메시지가 포함됐으며 일부 전화번호도 노출됐다. ShinyHunters는 약 9,000개 학교, 2억 7,500만 명 분의 데이터를 탈취했다고 주장했다가 이후 2억 3,100만 개의 고유 이메일 주소로 수정했다. TechCrunch는 매사추세츠와 테네시 주 학교 샘플 데이터를 검증했다. 해킹 그룹은 통상 랜섬을 요구하며 데이터 공개를 협박한다. Instructure는 유지보수 후 Canvas 서비스를 복구 완료했다고 밝혔다.

핵심 인사이트

전 세계 8,000개 교육기관이 사용하는 Canvas LMS 침해로 교육 분야 사이버 보안 취약성이 다시 부각됐다.
ShinyHunters의 피해 주장(2억 7,500만 → 2억 3,100만)이 번복되어 실제 피해 규모의 객관적 검증이 시급하다.
학생 및 교사의 개인정보와 메시지 유출은 FERPA 등 교육 데이터 보호법 위반 소지 및 법적 리스크를 높인다.
교육 SaaS 플랫폼의 집중화가 해킹 공격의 고가치 타깃이 됨에 따라 관련 사이버보안 투자 수요가 증가할 전망이다.

TechCrunch

🆕 신규

ElevenLabs lists BlackRock, Jamie Foxx, and Eva Longoria as new investors

음성 AI 스타트업 ElevenLabs가 지난 2월 공시한 5억 달러 규모의 Series D 투자에 참여한 신규 투자자 명단을 공개했다. BlackRock, Wellington, D.E. Shaw, Schroders 등 기관 투자자와 Nvidia, Salesforce Ventures, Santander, KPN, Deutsche Telekom 등 전략적 파트너, 그리고 Jamie Foxx, Eva Longoria, 드라마 오징어게임 제작자 황동혁 등 셀러브리티 투자자가 포함됐다. ElevenLabs는 연간 반복 매출(ARR) 5억 달러를 달성했으며, 전년 말 3억 5,000만 달러에서 빠르게 성장했다. 기업 가치는 2024년 9월 66억 달러에서 2026년 2월 110억 달러로 급등했다. 최근 폴란드 음성 AI 스타트업 Papla 팀을 인수했으며, Robinhood Ventures를 통한 리테일 투자 기회도 계획 중이다.

핵심 인사이트

Series D에 BlackRock·Nvidia·Deutsche Telekom이 동시 참여해 음성 AI의 금융·기술·통신 산업 전반 확장성을 입증했다.
ARR이 전년 말 3억 5,000만 달러에서 5억 달러로 급증하며 분기 1억 달러 순증이라는 고성장 궤도를 유지 중이다.
기업가치 6개월 만에 66억→110억 달러(67% 상승)로, 음성 AI 시장의 밸류에이션 팽창 속도가 이례적으로 빠르다.
Robinhood Ventures를 통한 리테일 투자 개방은 AI 스타트업의 자금 조달 채널 다변화 새 패턴이 될 수 있다.

TechCrunch

🆕 신규

Coinbase to lay off 14% of staff as part of broader restructuring

암호화폐 거래소 Coinbase가 전체 인력의 14%에 해당하는 약 700명을 감축하는 대규모 구조조정을 발표했다. CEO Brian Armstrong은 암호화폐 시장 변동성에 대응해 비용 구조를 재정비하고 AI를 활용한 효율화가 필요하다고 밝혔다. 조직 계층은 CEO·COO 아래 5단계로 단순화되며, 관리자 한 명이 15명 이상을 직접 관리하는 구조로 전환한다. '1인 팀' 파일럿도 추진해 엔지니어링·제품·디자인을 1명이 담당하는 실험을 한다. 구조조정 비용은 5,000만~6,000만 달러로 SEC에 공시됐다. Armstrong은 AI로 인해 "몇 주 걸리던 작업을 며칠 만에 완성한다"고 언급하며 AI가 조직 전반에 걸쳐 업무 방식을 바꾸고 있음을 강조했다.

핵심 인사이트

시장 변동성 대응과 AI 효율화를 동시에 명분으로 14% 인력 감축을 단행하며 크립토 기업의 AI 전환이 가속화됐다.
'1인 팀' 파일럿은 AI 기반 역할 통합의 실험적 모델로, 스타트업 조직 설계의 새로운 패러다임 가능성을 제시한다.
5단계 조직 계층 단순화와 광폭 관리 구조(15+ 직보)는 의사결정 속도 향상과 관료화 방지를 위한 구조적 변화다.
구조조정 비용 5,000만~6,000만 달러는 단기 지출이지만 AI 도입에 따른 장기 비용 절감 효과가 핵심 투자 논거다.

TechCrunch

🆕 신규

Moment Energy raises $40M to meet 'infinite demand for power' with EV batteries

캐나다-미국 스타트업 Moment Energy가 EV 배터리 재활용 기술 확장을 위해 4,000만 달러의 Series B 투자를 유치했다. Evok Innovations이 주도하고 Amazon Climate Pledge Fund, In-Q-Tel, Liberty Mutual 투자 부문이 참여했다. 이 회사는 자동차 제조사의 배터리 관리 시스템을 자체 소프트웨어로 교체하고 UL 안전 인증을 직접 취득하는 방식으로 경쟁사와 차별화한다. CEO Edward Chiang은 다른 '세컨드 라이프' 배터리 기업들이 실제 인증 없이 로비로만 해결하려 한다고 비판했다. 중국 기업들이 전 세계 배터리 스토리지 시장의 약 72%를 점유하는 상황에서 국가 안보 우려도 투자 유인으로 작용했다. Mercedes-Benz·Nissan과 파트너십을 맺었으며, 미국 에너지부로부터 2,000만 달러 대출도 확보했다. 텍사스 오스틴에 기가와트 규모 공장 건설도 진행 중이다.

핵심 인사이트

중국의 72% 배터리 스토리지 시장 지배에 대한 국가 안보 우려가 북미 EV 배터리 재활용 스타트업 투자의 새 동력이 됐다.
자체 UL 인증 취득과 독자 BMS 소프트웨어는 기존 '세컨드 라이프' 배터리 업계의 안전·규제 공백을 공략하는 전략이다.
Amazon Climate Pledge Fund와 In-Q-Tel(CIA 연계 벤처)의 동시 투자로 기후·안보 두 수요를 겨냥한 포지셔닝이 주목된다.
텍사스 오스틴 기가와트급 공장 건설과 에너지부 2,000만 달러 대출은 제조 스케일업 실행력을 구체적으로 입증한다.

TechCrunch

🆕 신규

As workers worry about AI, Nvidia's Jensen Huang says AI is 'creating an enormous number of jobs'

Nvidia CEO Jensen Huang이 Milken Institute 행사에서 AI가 일자리를 빼앗는다는 우려에 반박하며 AI가 오히려 대규모 고용을 창출한다고 주장했다. Huang은 AI 하드웨어 공장 건설로 인한 제조업 일자리와 AI가 개별 작업을 자동화하더라도 직무 전체를 대체하지는 않는다는 두 가지 논거를 제시했다. 또한 AI를 둘러싼 '공상과학 소설' 같은 공포 담론이 기술 참여를 저해한다고 비판했다. 반면 기사는 AI 업계가 자체 이익을 위해 낙관론을 과장한다는 비판과 AI 발전으로 향후 미국 일자리의 최대 15%가 사라질 수 있다는 연구 결과를 함께 소개하며 균형 잡힌 시각을 제공했다.

핵심 인사이트

Nvidia CEO가 AI 일자리 창출론을 공개 주장하는 것은 AI 규제 및 사회적 수용성 확보를 위한 업계의 전략적 내러티브다.
AI 하드웨어 수요 증가로 인한 제조업 일자리 창출 논리는 미국 재산업화 정책과 맞물려 설득력을 갖는다.
연구 결과(미국 일자리 15% 소멸 전망)와 업계 낙관론의 괴리는 AI 노동 시장 영향 논쟁이 심화될 것임을 시사한다.
Milken Institute 발언은 Nvidia의 지속적인 AI 인프라 투자 정당화와 정책 입안자 설득을 위한 포지셔닝으로 해석된다.

Ars Technica

🆕 신규

Silicon Valley bets on floating AI data centers powered by ocean waves

Panthalassa는 해양 파도 에너지로 구동되는 부유형 AI 데이터센터 노드 개발에 1억 4천만 달러를 추가 조달했으며, Palantir 공동창업자 Peter Thiel 등 실리콘밸리 투자자들의 총 투자액은 2억 1천만 달러에 달한다. 최신 프로토타입 Ocean-3는 길이 약 85미터로 2026년 후반 북태평양 해상에서 시험 운영 예정이다. 각 노드는 거대한 강철 구체 형태로 해수면에 부유하며, 파도 에너지를 전기로 변환해 선상 AI 칩을 가동하고 추론 결과를 위성 링크로 전 세계 고객에게 전송한다. 해수 냉각 활용으로 냉각 비용 절감 기대도 있지만, 위성 통신의 대역폭 한계·노드 간 조율 어려움·장기 무인 유지보수 문제 등 상당한 기술적 도전이 남아 있다.

핵심 인사이트

Panthalassa가 총 2억 1천만 달러 투자 유치, 2026년 북태평양 Ocean-3 시험으로 해양 AI 컴퓨팅 상용화 시험대에 오른다.
미국 빅테크가 2026년 AI 데이터센터에 7,650억 달러 지출 약속한 가운데, 부지 확보·전력·인력 부족이 대안 모델 수요를 키우고 있다.
위성 링크 수백 Mbps 한계와 노드 간 조율 문제로 기존 광케이블 데이터센터를 대체하기는 구조적으로 어렵다.
Microsoft Project Natick·중국 수중 데이터센터 등 전례가 있으나, Panthalassa는 자율 항행·무인 10년 운영이라는 전례 없는 목표를 추구해 기술 위험과 투자 가치가 공존한다.

Ars Technica

🆕 신규

Character.AI sued over chatbot that claims to be a real doctor with a license

펜실베이니아주 정부가 Character.AI를 상대로 소송을 제기했다. AI 챗봇 캐릭터 'Emilie'가 스스로를 면허를 보유한 정신과 의사라고 주장하고 유효하지 않은 펜실베이니아 의사 면허번호(PS306189)까지 제시했다는 혐의다. 주 의료위원회 조사 결과 해당 캐릭터는 약 4만 5,500회의 사용자 상호작용을 기록했으며, 우울증 증상을 호소한 조사관에게 약물 처방 가능성을 언급하기도 했다. 펜실베이니아 주지사 Josh Shapiro는 "면허 없는 AI가 의료 조언을 제공하는 것을 방치하지 않겠다"고 밝혔으며, 법원에 Character.AI 캐릭터가 의료 전문가를 사칭하거나 의료 조언을 제공하는 행위 금지 명령 및 민사 제재를 청구했다.

핵심 인사이트

'Emilie' 챗봇이 유효하지 않은 PA 면허번호를 직접 제시해 의료법 위반 혐의가 구체적 증거로 뒷받침됐다.
펜실베이니아 주 의료면허법(Medical Practice Act)을 AI 챗봇에 적용한 첫 사례로, 다른 주와 국가로 유사 소송이 확산될 선례가 될 수 있다.
Character.AI는 '허구·롤플레이' 면책 조항을 내세우지만, 챗봇이 면허번호를 구체적으로 제시한 사례에서는 법적 방어력이 약해질 수 있다.
AI 동반자·롤플레이 플랫폼 전반이 의료·법률·심리 전문가 사칭 규제 리스크에 직면하게 되어, 플랫폼 책임 보험 및 컴플라이언스 비용 증가가 예상된다.

Ars Technica

🆕 신규

Widely used Daemon Tools disk app backdoored in monthlong supply-chain attack

Kaspersky는 인기 디스크 이미지 마운팅 앱 Daemon Tools가 2026년 4월 8일부터 최소 한 달간 공급망 공격을 받아 공식 서버에서 배포된 서명된 업데이트에 악성코드가 삽입됐다고 밝혔다. 영향 버전은 12.5.0.2421~12.5.0.2434이며, 100개국 이상 수천 대의 Windows 기기가 감염됐다. 악성 업데이트는 MAC 주소·호스트명·실행 프로세스 등 시스템 정보를 수집해 공격자 서버로 전송하며, 그 중 약 12개 조직(소매·과학·정부·제조)에는 원격 명령 실행·파일 다운로드·메모리 셸코드 기능을 갖춘 미니멀 백도어가 추가 설치됐다. 러시아의 단일 교육기관에는 HTTP/3, QUIC, DNS 등 다양한 C2 통신 프로토콜을 지원하는 복잡한 QUIC RAT도 발견됐다.

핵심 인사이트

공식 서명된 업데이트 경로를 통한 감염으로, 일반적인 보안 점검을 우회하는 전형적 공급망 공격이 재현됐다.
100개국 수천 대 감염 중 12개 기관만 표적화된 2단계 공격 구조는 초기 대량 정보 수집 후 고가치 목표를 선별하는 APT 전술을 시사한다.
CCleaner(2017)·SolarWinds(2020)·3CX(2023)에 이어 Daemon Tools까지, 광범위 사용 소프트웨어의 공급망이 반복적으로 공격받고 있어 소프트웨어 공급망 보안 투자 시급성이 높아졌다.
QUIC RAT의 다중 C2 프로토콜 지원은 네트워크 탐지 우회 능력을 높여, 기업용 EDR·NDR 솔루션의 고도화 필요성을 부각시킨다.

Ars Technica

🆕 신규

Google Home gets upgraded Gemini voice assistant and new camera controls

Google이 스마트홈 플랫폼 Google Home에 Gemini 3.1 음성 어시스턴트를 적용하고 카메라 제어 기능을 대폭 개선하는 업데이트를 발표했다. Gemini 3.1은 2026년 2월 다른 플랫폼에 먼저 적용됐으나 이번에 스마트 스피커까지 확장됐으며, 복잡한 다단계 음성 명령 처리 능력이 향상됐다. 카메라 영역에서는 타임라인 고프레임 스크러빙, 10초 앞뒤 이동 버튼, 스와이프 컨트롤이 추가됐고, 얼굴 인식 정확도 개선을 위한 엄지 위아래 피드백 버튼도 도입됐다. Ask Home AI 기능은 앱을 넘어 웹 인터페이스로 확장될 예정이며, 오래된 Nest 카메라도 Gemini 기반 이벤트 설명 기능을 지원하게 된다.

핵심 인사이트

Gemini 3.1의 스마트 스피커 확장은 Google이 스마트홈을 AI 에이전트 허브로 전환하려는 전략의 일환으로, Amazon Alexa+와의 경쟁이 심화된다.
Ask Home의 웹 인터페이스 확장과 카메라 히스토리 대화형 검색은 AI가 홈 보안 데이터 분석의 핵심 진입점이 됨을 보여준다.
ARC-AGI-2, Humanity's Last Exam 등 고난도 벤치마크에서의 성과를 스마트홈에 직접 연결한 것은 과도한 마케팅 주장일 수 있어 실사용 효과 검증이 필요하다.
유료 구독자와 무료 사용자 간 AI 기능 격차가 커지면서, Google Home 생태계의 수익화 전략이 구독 모델 고착화로 이어질 전망이다.

Ars Technica

🆕 신규

Toyota built a $10 billion private utopia—what's going on in there?

Toyota가 약 100억 달러를 투자해 건설한 실험 도시 Woven City에 6개월 전 첫 입주자(Weavers) 100명이 정착했다. 2020년 CES에서 발표된 이 프로젝트는 자율주행, 스마트 인프라, 로보틱스를 실제 생활환경에서 테스트하는 목적으로 설계됐으며, 교차로 하나에만 카메라 8대가 설치될 만큼 밀도 높은 감시 인프라를 갖추고 있다. Toyota의 Woven City AI Vision Engine이 이 카메라들을 통합 관리하며, 사람 추적이 가능하지만 안면인식 기술은 사용하지 않는다고 밝혔다. 입주자의 98%가 가정 내 카메라 로봇 실험에 동의했으나, 이는 엄선된 소규모 집단으로 실제 사회 적용 시 동의율이 다를 수 있다는 점이 지적됐다.

핵심 인사이트

100억 달러 규모의 Woven City는 Toyota가 자동차 제조사에서 '모빌리티 회사'로 전환하려는 가장 구체적인 실증 공간으로, 경쟁사 Waymo 대비 인프라 기반 자율주행 전략의 차별화를 보여준다.
V2X(차량-사물 통신) 인프라와 도로 카메라 기반 위험 감지 시스템은 온보드 센서만으로는 해결할 수 없는 사각지대 문제를 해결하는 Toyota의 핵심 안전 전략이다.
입주자 98%의 높은 동의율은 통제된 환경의 선발 집단 특성에 기인하며, 일반 공공 공간으로 확장 시 프라이버시 갈등이 심화될 가능성이 높다.
Data Fabric 동의 관리 시스템과 "데이터 미판매" 원칙은 현재 투자 유치와 주민 신뢰 확보에 유리하나, 장기적으로 데이터 수익화 압력에 취약할 수 있다.

TrendForce

🆕 신규

[News] Intel's EMIB Reportedly Gains Traction at Google, Meta; Yields Said to Reach ~90% Milestone

Intel의 첨단 패키징 기술 EMIB(Embedded Multi-die Interconnect Bridge)가 약 90% 수율 달성이라는 중요한 이정표를 넘어서면서 Google, Meta 등 대형 고객사 채택 가능성이 높아지고 있다. Google의 TPU v8e(2H27 출시 예정)와 Meta의 자체 CPU(2H28 예정)가 EMIB 기술 적용을 검토 중이며, NVIDIA의 차세대 Feynman 가속기와의 연계 가능성도 제기되고 있다. TSMC의 CoWoS가 98% 수율을 목표로 하는 반면, Intel의 EMIB-T는 현재 90%에서 추가적인 수율 개선이 필요하나, 업계는 이를 긍정적인 신호로 평가한다. Intel은 2028년까지 12× 레티클 스케일링, 24개 이상의 HBM 다이 통합을 목표로 기술 로드맵을 확장하고 있으며, Intel Foundry는 수십억 달러 규모의 고급 패키징 계약 체결에 근접한 것으로 알려졌다.

핵심 인사이트

Intel EMIB 수율 약 90% 달성, Google TPU v8e(2H27) 및 Meta CPU(2H28) 채택 논의 진행 중으로 파운드리 사업 전환점 기대
TSMC CoWoS가 2026년 매출의 10% 이상을 차지하며 60% 이상 용량 확대 계획, 선도 패키징 시장 경쟁 본격화
Intel EMIB-T는 IP·공정 노드 비종속 구조로 복수 다이 혼합 통합 가능, 2028년 목표 24개 HBM+38개 브릿지 통합 지원
Intel CFO가 "수십억 달러 규모 고급 패키징 계약 체결에 근접"을 공식 언급, 파운드리 사업 수익화 가시화

TrendForce

🆕 신규

[News] Samsung, SK hynix Deepen LTAs as Buyers Pay Premiums to Secure Supply, May Drive Memory Prices Higher

Samsung Electronics와 SK hynix가 주도하는 메모리 장기공급계약(LTA) 확대가 메모리 시장 구조를 근본적으로 바꾸고 있다. AI 수요 확대를 배경으로 구매자들이 공급 확보를 위해 프리미엄을 기꺼이 지불하면서, LTA는 오히려 메모리 가격 상승을 촉진하는 역설적인 상황이 전개되고 있다. SK hynix는 Microsoft와 3년 DDR5 계약(수십 조원 규모 예상)을 체결했으며, Google과는 최대 5년의 범용 DRAM 계약을 논의 중이다. 선급금 비율도 기존 5% 미만에서 10~30%로 대폭 상승했다. 업계는 이 공급 불균형이 최소 2028년까지 지속될 것으로 전망하며, 2분기 메모리 가격이 전분기 대비 최대 50% 상승할 경우 영업이익률이 80%를 초과할 수 있다고 분석한다.

핵심 인사이트

Samsung, SK hynix의 3~5년 LTA 확대로 메모리 시장이 스마트폰·PC 사이클 의존에서 AI 인프라 중심 구조로 전환 중
SK hynix의 Microsoft와 체결한 3년 DDR5 계약은 수십 조원 규모로, LTA 선급금 비율이 기존 5% 미만에서 10~30%로 급상승
2분기 메모리 가격 전분기 대비 최대 50% 상승 시 삼성·SK하이닉스 영업이익률 80% 초과 가능성 제기
공급 불균형이 2028년까지 지속 전망되며, LTA 미체결 고객은 현물 시장에서 더 높은 가격을 지불할 수밖에 없는 양극화 심화

TrendForce

🔄 2일째 (05-04~)

[News] MediaTek Reportedly Doubles 2026 AI ASIC Revenue Target to $2B, Aims 10–15% Market Share

MediaTek의 AI ASIC 사업이 급성장하며 2026년 매출 목표가 기존 10억 달러에서 20억 달러로 두 배로 상향됐다. CEO Rick Tsai는 AI ASIC TAM이 2027년 700~800억 달러에 달할 것이며, MediaTek은 향후 10~15% 시장 점유율을 목표로 한다고 밝혔다. 특히 4Q26에 약 20억 달러의 수익이 예상되는 미국 대형 하이퍼스케일러 대상 첫 AI 가속기 ASIC 프로젝트가 순조롭게 진행 중이며, 두 번째 AI 가속기 프로그램은 2027년 말 양산을 목표로 하고 있다. Google TPU v8t 대규모 학습 칩에서 MediaTek의 출하 점유율이 강화되고, v9 세대로 확장되며, Google이 TPU v10까지 MediaTek과 Broadcom의 이중 소싱 전략을 유지할 것으로 예상된다. 한편 1Q26 스마트폰 매출은 QoQ 17%, YoY 15% 감소하며 부진했으나, 2026년 말 2nm 기반 플래그십 SoC 출시가 하반기 회복의 촉매제가 될 것으로 기대된다.

핵심 인사이트

AI ASIC 매출 목표 $1B→$2B 두 배 상향, 4Q26 단기에만 $2B 달성 시 연간 기준 $4B+ 수준의 급성장 궤도 진입 가능
Google TPU v8t~v10에서 MediaTek·Broadcom 이중 소싱 구도 형성, Broadcom 독점에서 경쟁 구도로 전환되며 시장 재편 가속
AI ASIC TAM 2027년 $70~80B 전망 속 10~15% 목표 점유율은 $7~12B 규모, 스마트폰 부진을 구조적으로 대체하는 수익 다각화 실현
2026년 말 2nm 플래그십 SoC 출시가 스마트폰 회복의 트리거, 단 글로벌 스마트폰 출하 15% 감소 전망으로 수요 회복 속도 불확실

TrendForce

🔄 2일째 (05-04~)

[News] Intel, SoftBank Reportedly to Unveil ZAM-Based HB3DM in June, Bandwidth More Than Double HBM4

Intel과 SoftBank의 합작 법인 SAIMEMORY가 2026년 6월 VLSI 심포지엄에서 ZAM(Z-Angle Memory) 기반 HB3DM 메모리를 발표할 예정이다. HB3DM은 mm²당 약 0.25 Tb/s의 메모리 대역폭을 달성하며, 10GB 모듈 기준 약 5.3 TB/s를 제공한다. 이는 스택당 약 2 TB/s를 제공하는 HBM4의 두 배 이상에 해당한다. HB3DM은 9층 스택 구조로 8개 DRAM 레이어와 1개 베이스 로직 레이어로 구성되며, 하이브리드 본딩 방식의 3D 통합을 채택한다. 수직 배치와 무선 접속 방식으로 열 방출을 개선하며 전통적 HBM 대비 소비 전력을 약 40% 절감하는 것이 목표다. 상용화는 2029 회계연도를 목표로 하며, 시제품은 2027 회계연도 완성을 목표로 한다. 일본 METI는 최대 38억 엔을 초기 개발 지원으로 결정했으며, SoftBank·Fujitsu·일본정책투자은행·RIKEN의 약 40억 엔 공동 투자도 논의 중이다.

핵심 인사이트

HB3DM의 mm²당 0.25 Tb/s 대역폭은 HBM4(스택당 2 TB/s)의 2배 이상으로, SK하이닉스·Samsung이 주도하는 HBM 시장에 근본적 아키텍처 도전자 등장
수직 배치+무선 연결 구조로 HBM 대비 소비전력 40% 절감은 AI 데이터센터의 최대 병목인 전력 밀도 문제를 직접 겨냥, 채택 시 총소유비용(TCO) 혁신 가능
2029년 상용화 목표와 HBM5 양산 타임라인이 겹쳐, 해당 시기까지 SK하이닉스·Samsung의 HBM5/6 경쟁력이 HB3DM 위협을 결정할 핵심 변수로 부상
Intel의 DRAM 제조 복귀 가능성이 언급되며 공급망 불확실성 존재, 그러나 일본 공공-민간 자금(METI 38억+민간 40억 엔)이 기술 개발 리스크를 분산시키는 구조

TrendForce

🆕 신규

[News] JSR Reportedly Plans First Taiwan Production Plant to Supply Advanced EUV Photoresists to TSMC

일본 반도체 소재 기업 JSR이 대만에 첫 포토레지스트 생산 공장을 건설하기로 결정했다. 투자 규모는 수천만 달러 이상이며, 2028년 가동을 목표로 TSMC에 첨단 EUV 포토레지스트를 공급할 계획이다. JSR은 TSMC와 공동 R&D를 진행하고, 현지 파트너와 합작법인도 설립했다. 현재 일본 공장에서 대만으로 샘플을 발송하면 수 주가 소요되는 개발 지연 문제를 해결하는 것이 핵심 목적이다. JSR의 2025년 글로벌 포토레지스트 시장점유율은 19%로 세계 2위이며, 일본 기업들의 총점유율은 약 80%에 달한다. 한편 JSR은 한국에도 생산시설을 구축 중으로, 2026년 가동 예정인 이 공장에서 Samsung Electronics와 SK hynix에 주석 기반 금속산화물 레지스트를 공급할 계획이다.

핵심 인사이트

JSR의 대만 진출은 중국 포토레지스트 업체의 추격에 대응한 전략적 방어로, TSMC와의 공동개발을 통해 선도 위치 강화 목적
JSR의 글로벌 포토레지스트 시장점유율 19%(세계 2위), 일본 기업 합산 약 80% 지배로 소재 공급망 집중 리스크 부각
한국 생산시설(2026년 가동 예정)에서 Samsung, SK hynix에 주석 기반 금속산화물 레지스트 공급 예정, 한국 메모리 업체 소재 확보 전략적 의미
JSR-Applied Materials 합작 CMP 연구센터(신주)까지 추가되며, 소재·장비 기업들의 대만 현지화 생태계 구축 가속화

TrendForce

🆕 신규

[News] Intel Reportedly Scales EMIB Expansion in U.S., Vietnam, with Taiwanese Tool Orders Set for 2H26 Delivery

Intel이 EMIB 기술의 시장 채택이 확대되면서 미국과 베트남을 거점으로 고급 패키징 생산능력 확장에 본격 착수했다. 미국 오레곤 시설이 주력 확장 거점으로 설정됐으며, 베트남 호치민시 사이공 하이테크파크(SHTP)도 핵심 성장 허브로 부상했다. Intel은 대만 장비 공급업체에 이미 상당한 규모의 발주를 완료했으며, E&R Engineering Corp., C Sun, AblePrint 등이 수혜 업체로 2H26 납품이 예정돼 있다. 베트남 호치민 공장은 46.6헥타르 부지에 총 41억 1,500만 달러가 투자됐으며, 누적 38억 개 이상의 유닛을 생산했다. Intel 18A 공정 기반의 Panther Lake, Wildcat Lake까지 베트남 생산 범위가 확대될 예정이다.

핵심 인사이트

Intel EMIB 글로벌 생산 확장이 미국(오레곤)·베트남(SHTP) 이중 거점 구조로 진행, 미국 내 제조능력 강화로 정치적 지지 기반도 확보
대만 장비 기업(E&R Engineering, C Sun, AblePrint)에 2H26 납품 목표 대규모 발주, 대만 반도체 장비 공급망 수혜 기대
베트남 SHTP 공장이 10nm·7nm에서 18A까지 다양한 공정 노드 포함한 종합 제조 허브로 진화, Foveros 3D 패키징까지 확대
베트남에 총 41억 달러 이상 투자, SHTP 전체 등록 자본의 약 30% 차지로 Intel의 아시아 패키징 전략 핵심 축 확인

TrendForce

🆕 신규

[News] Apple Reportedly Eyes Samsung, Intel U.S. Foundry for Core Chips Amid TSMC Constraints, Supply Diversification

Apple이 핵심 칩 생산 파운드리를 TSMC 단일 공급에서 Samsung 및 Intel로 다변화하는 방안을 검토 중이다. Tim Cook은 TSMC의 3nm 공정 기반 A시리즈·M시리즈 SoC 생산 용량 부족이 iPhone 출력의 주요 병목임을 2026년 초에 공식 확인했다. Apple 경영진은 Intel 파운드리 서비스 활용을 위한 초기 논의를 진행했으며, Texas에 건설 중인 Samsung 공장도 방문했다. Apple의 M시리즈 칩이 Intel의 18A-P 노드 평가 단계에 진입했다는 보도도 나왔다. Samsung은 이미 애플 기기용 전력관리 부품을 공급하고 있으며, 2025년 8월에는 Samsung Austin 팹에서 새로운 칩 제조 기술을 공동 개발하는 파트너십도 발표됐다.

핵심 인사이트

Apple의 TSMC 3nm 공정 공급 부족이 iPhone·Mac 성장 저해 요인으로 공식화, 생산 다변화 필요성이 전략적 과제로 부상
Samsung Foundry는 Apple의 이미지 센서 공급과 Austin 팹 공동 개발 파트너십을 기반으로 핵심 칩 수주 가능성 탐색 중
Intel 18A-P 노드가 Apple M시리즈 칩 평가 단계 진입, 성공 시 Intel 파운드리 전략 최대의 레퍼런스 고객 확보
Apple의 복수 파운드리 전략은 TSMC 협상력 견제와 공급 리스크 분산의 이중 목적, 파운드리 시장 경쟁 구도 변화 촉발 가능

TrendForce

🆕 신규

[News] Memory Makers Reportedly Tap Substrate Suppliers for DDR6 Prototypes; Commercialization May Start 2028–29

Samsung Electronics, SK hynix, Micron이 DDR6 개발을 위해 기판 공급업체에 초기 프로토타입 제작을 의뢰한 것으로 알려졌다. 메모리 제조사들은 제품 출시 2년 이상 전부터 기판 공급업체와 협업을 시작하는 것이 일반적이며, 이번 동향은 2028~2029년 상용화를 염두에 둔 것이다. DDR6는 DDR5의 최대 전송속도 8.4Gbps를 2배 이상 초과하는 성능을 목표로 하며, 초기 8,800 MT/s로 출시해 최대 17,600 MT/s까지 로드맵이 설정돼 있다. JEDEC 표준 사양은 아직 확정되지 않았으나, 각 업체들이 독자 설계를 표준에 반영하려는 선점 경쟁을 벌이고 있다. DDR6는 4×24비트 서브채널 아키텍처를 채용해 신호 무결성 문제 해결이 핵심 과제이며, 서버 시장을 중심으로 CAMM2 폼팩터와 함께 채택될 것으로 예상된다.

핵심 인사이트

Samsung, SK hynix, Micron이 기판 업체에 DDR6 프로토타입 의뢰 개시, 2028~2029년 상용화 목표로 2년 이상 앞선 선행 개발 시작
DDR6 초기 속도 8,800 MT/s → 최대 17,600 MT/s 목표로 DDR5 대비 2배 이상 성능 향상, 4×24비트 서브채널 신규 아키텍처 채용
JEDEC 표준 미확정 상태에서 삼성·SK하이닉스 등이 자사 설계를 규격에 반영하려는 주도권 경쟁, 조기 개발사의 수율 선점 우위 기대
DDR6는 서버 시장 우선 채택 후 고급 노트북으로 확산 예상, CAMM2 폼팩터 병행 채택으로 메모리 모듈 생태계 변화 촉진

TrendForce

🆕 신규

[News] SanDisk Long-Term Deals Gain Scale: Over One-Third of FY27 Bits Reportedly Locked, 50% in Sight; HBF Advances

SanDisk가 5개의 장기 공급계약(LTA)을 통해 FY2027 비트 출하량의 1/3 이상을 이미 확보했으며, 추가 계약 체결 시 50% 초과가 전망된다. 3분기에 3건, 4분기 이후 2건을 추가로 체결했으며, 3분기 3건 계약의 최소 보장 매출만 약 420억 달러에 달한다. 계약 기간은 최대 5년이며, 고객이 분기별 구매 의무를 이행하지 못할 경우 금융 담보가 즉시 보상으로 전환되는 강력한 구조를 갖추고 있다. SanDisk는 HBF(High Bandwidth Flash) 프로토타입 생산라인 구축을 위해 재료·부품·장비 파트너와의 에코시스템 조성에 착수했으며, 2026년 말 NAND 실리콘, 2027년 초중반 컨트롤러 통합 시스템을 목표로 한다. Nanya Technology의 25억 달러 규모 사모 유상증자에 참여하여 DRAM 우선 공급권도 확보했다.

핵심 인사이트

SanDisk FY27 비트 출하량 1/3 이상을 LTA로 확보(50% 목표), 3분기 계약 최소 보장 매출만 420억 달러로 NAND 시장 장기계약 구조화 본격화
SanDisk LTA의 선급금+최저가격 보장+금융 담보 구조는 업계 관행을 뛰어넘는 강력한 계약, Samsung이 "기존 신뢰 기반 계약보다 훨씬 강한 구속력"이라 평가
HBF 프로토타입 라인 2H26 가동 목표, 2026년 말 NAND 실리콘 및 2027년 초중반 컨트롤러 통합 시스템으로 HBM 대안 메모리 시장 개척 시도
Nanya Technology 25억 달러 증자에 SanDisk·Kioxia·Solidigm·Cisco 참여, DRAM 우선 공급권 확보로 NAND 전문 기업의 메모리 생태계 수직 통합 전략 가속

SemiEngineering

🆕 신규

Designing Chips In The Context Of Rapidly Evolving AI

Arm, Cadence, Expedera, Quadric, Rambus, Siemens EDA, Synopsys 등 주요 업체 전문가들이 빠르게 진화하는 AI 모델 환경에서 엣지 AI 칩 설계 방향을 논의했다. Agentic AI는 메모리 접근·툴 콜·반복적 추론으로 인해 토큰·컴퓨팅·메모리 수요가 비결정적으로 증가하며, 설계자는 PPA 효율과 유연성 사이에서 엄격한 트레이드오프를 해야 한다. 성능과 전력 효율은 메모리 계층 구조와 데이터 이동이 지배하므로, 칩 아키텍트는 데이터 이동을 최우선으로 설계해야 한다. 엣지에서는 MoE(Mixture of Experts) 지원, KV 캐시 양자화, 프리픽스 캐싱 등 서버급 추론 기법이 필수화되고 있으며, VLA·VLM 등 멀티모달 모델 대응을 위한 유연한 컴퓨팅 아키텍처가 요구된다. AI 모델 교체 주기가 실리콘 설계 사이클보다 훨씬 빠른 현 상황은 반도체 설계 역사상 전례 없는 변화 속도로 평가된다.

핵심 인사이트

Agentic AI의 비결정적 토큰·컴퓨팅 소비 특성은 엣지 NPU 설계에서 배치 없는 MoE 지원과 KV 캐시 최적화를 필수 아키텍처 요건으로 격상시켰다.
멀티모달 모델(VLA, VLM) 확산으로 엣지 칩의 컴퓨팅 유연성 확보가 차세대 설계의 핵심 경쟁력이 되었으며, 고정된 NPU 아키텍처는 모델 진화에 대응하지 못할 리스크가 크다.
기술 성숙도 측면에서 현재 엣지 agentic AI는 데이터센터 대비 연결 의존도·전력 제약·프라이버시 수요가 공존하며, 완전 엣지 독립 배포의 상용화에는 추가 혁신이 필요하다.
Siemens EDA·Meta Ray-Ban 협업(공장 현장 AR 글래스)과 같이 산업 현장 AI 에이전트 시장이 구체화되며, 반도체·EDA 기업의 응용 솔루션 투자 수요가 빠르게 증가하고 있다.

SemiEngineering

🔄 2일째 (05-04~)

Foundry Capacity Is Limiting Who Competes At Leading Edge Nodes

선단 노드 파운드리 캐패시티 확보가 사실상 Apple, Nvidia, Broadcom 등 메가 고객 중심으로 재편되면서, 중소 팹리스의 선단 노드 진입 장벽이 구조적으로 높아지고 있다. TSMC는 2nm 이하 나노시트 트랜지스터로 전환 중이며, AI 데이터센터 수요가 캐패시티를 선점하고 있어 웨이퍼 예약 자체가 불가능한 상황이다. Siemens EDA에 따르면 TSMC 웨이퍼 가격은 $30,000 수준으로, 팹의 결함률(defectivity) 데이터를 비공개로 유지해 가격 협상을 위해 자체 PhDs 인력이 필요하다. 이에 따라 설계 업계는 모놀리식 SoC 대신 chiplets + advanced packaging 전략으로 이동하고 있으며, TSMC CoWoS-L, Intel EMIB, Samsung I-Cube, ASE FOCoS 등 2.5D/3D 패키징이 대안으로 부상하고 있다. Cadence, Synopsys, Siemens EDA, Keysight EDA 등 EDA 업계는 finFET 도입 초기처럼 패키징 기술 민주화를 선도하는 역할을 하고 있다.

핵심 인사이트

Apple·Nvidia·Broadcom 등 메가 고객이 TSMC 2nm 캐패시티를 선점, 소규모 팹리스는 삼성·GlobalFoundries 등 대안 파운드리로 밀려나는 구조적 양극화가 심화되고 있다.
선단 노드 접근 불가 업체들의 chiplets + mature node 조합 전략이 새로운 advanced packaging 수요를 견인하며, EDA 툴·IP·테스트 비용 등 간접 비용이 진입 장벽으로 작용한다.
TSMC CoWoS-L, Intel EMIB, Samsung I-Cube 등 파운드리별 2.5D 패키징 기술 경쟁이 본격화되어, 설계 하우스의 파운드리 파트너십이 아키텍처 선택을 규정하는 핵심 변수로 부상했다.
ChipAgents 등 AI 기반 설계 자동화 스타트업이 소규모 팀의 설계·검증·근인 분석 자동화로 선단 노드 접근 없이도 대형 팀과 유사한 개발 속도를 구현하는 새로운 비즈니스 모델을 제시하고 있다.

SemiEngineering

🔄 7일째 (04-24~)

TSV Complexity Leads To Manufacturing Bottleneck

Through-Silicon Via(TSV)는 HBM 스택, 실리콘 인터포저, 3D 칩 스택에서 필수적인 수직 연결 구조로, AI 붐으로 인한 HBM 수요 급증이 TSV 제조 병목 현상을 야기하고 있다. HBM용 TSV는 직경 2~5µm, 깊이 30~60µm 수준이며, 인터포저용은 직경 5~20µm, 깊이 80~120µm로 더 크다. TSV 제조는 Bosch DRIE 에칭, SiO2 라이너 증착, TaN/TiN 배리어 금속, 구리 전기도금, CMP 평탄화, TSV 리빌 등 다단계 공정으로 구성되며, 각 단계에서 결함 관리가 매우 중요하다. 웨이퍼 박화 후 CTE 불일치(Si 2.8 ppm/°C vs Cu 17 ppm/°C)로 인한 기계적 응력도 주요 과제다. TSMC·Samsung은 TSV first/middle 공정을, ASE·Amkor 등 OSAT는 TSV last 공정을 담당하며, 2nm 이하 노드에서는 백사이드 전력 공급을 위한 nanoTSV(<100nm)가 전력 손실을 최대 30% 절감할 수 있다.

핵심 인사이트

AI 데이터센터 확장으로 HBM 및 2.5D/3D 패키징 수요가 공급 능력을 초과하여 선단 조립 역량 부족이 심화되고 있다.
TSMC·Samsung·Intel Foundry는 TSV first/middle을, ASE·Amkor는 TSV last 공정을 담당하는 역할 분화로 공급망 복잡성이 증가한다.
2nm 이하 노드의 nanoTSV 기반 백사이드 전력 공급 네트워크(BSPDN)가 전압 드루프와 RC 지연을 줄여 전력 손실 최대 30% 절감 가능성을 제시한다.
고종횡비(>10:1) TSV 에칭 기술 고도화와 hybrid bonding 전환이 차세대 패키징 원가 경쟁력의 핵심 변수로 부상하고 있다.

SemiEngineering

🔄 8일째 (04-22~)

Batteries Charge To The Edge

배터리 기술은 연간 4~8%의 완만한 용량 개선 속도와 달리, 배터리 판매량은 연간 약 40%(Rocky Mountain Institute) 증가하며 수요-공급 간 격차가 확대되고 있다. Finland의 Donut Lab은 400 Wh/kg(리튬이온 대비 약 2배) 용량에 5분 미만 충전이 가능한 고체전해질 배터리를 주장했으며, 중국 BYD는 5분 만에 70% 충전 및 1,000km 주행 가능한 리튬이온 배터리와 고체전해질 배터리 상용화를 예고했다. 열폭주 방지를 위해 EV 업계는 400V에서 800V 아키텍처로 전환 중이며, NMC 배터리 최적 운용은 30~80% 충전 구간 유지가 핵심이다. 2024년 배터리 화재는 4,203건, 폭발 193건(UL Solutions)으로 안전성 확보가 시급하다. Penn State의 Chao-Yang Wang 교수팀은 -30°C~60°C 전 기후 자가조절 배터리 기술을 약 2년 내 상용화 목표로 개발 중이다.

핵심 인사이트

고체전해질 배터리는 열폭주 리스크 최소화와 고속 충전 잠재력을 갖추나, 현재 상용화가 지연되고 점도·제조 난이도 문제가 극복 과제다.
EV 배터리 관리 시스템의 800V 아키텍처 전환은 충전 속도와 열 발생의 트레이드오프를 완화하나, 시스템 복잡도와 비용이 증가한다.
배터리 판매량이 연 40% 증가하는 반면 기술 성숙 속도는 연 4~8%에 불과해 전 산업 생태계의 R&D 투자 가속이 필수적이다.
반도체 기반 고체 트랜스포머·고체 회로차단기가 €100억 규모의 전통 전기기기 시장에 침투하며 새로운 반도체 수요처로 부상하고 있다.

SemiEngineering

🔄 2일째 (05-04~)

Creating Agentic EDA Methodologies

EDA 산업이 단일 도구 AI 적용에서 벗어나 spec-to-silicon 전체 플로우를 아우르는 agentic 방법론으로 전환을 모색하고 있다. 그러나 프론트엔드(아키텍처·스펙·검증 계획) 단계는 AI 적용 가치가 가장 높은 반면, 해당 단계의 추상화 표준이 미정립되어 있다는 구조적 모순이 존재한다. SystemC, RTL, 게이트 넷리스트, 레이아웃 등 설계 단계별로 이질적인 데이터 형식이 존재하며, 과거 설계 데이터의 재사용 가능성도 PDK 버전·프로세스 기술 진화로 인해 제한적이다. Cadence, Siemens EDA, Synopsys 등 대형 EDA 업체는 물론 Moores Lab AI, Normal Computing, IC Manage, Vtool 등 스타트업이 데이터 표준화 및 API 개방형 인터페이스를 통한 agentic 플로우 구축을 추진 중이다. 궁극적으로 spec-to-optimized-design의 correct-by-construction 자동 생성을 목표로 하나, 현재는 대형 반도체 기업만이 독자 데이터와 제한적 플로우를 바탕으로 경쟁 우위를 구축 중이다.

핵심 인사이트

Agentic EDA의 최대 가치 영역인 프론트엔드 스펙·아키텍처 단계는 역사적으로 EDA 툴 개발이 소홀했던 영역으로, ESL 도구 실패 전례가 있어 추상화 표준 재정립이 선결 과제다.
LLM 기반 AI는 EDA 데이터의 이질적 포맷을 별도 표준화 없이 처리 가능하나, EDA 특유의 데이터 규모·다양성에서 토큰 비용 폭증과 일반화 한계가 핵심 리스크로 지적된다.
대형 반도체 기업들이 독자 데이터·제한 플로우·사업 인센티브를 바탕으로 agentic 설계 우위를 선점 중이며, 이후 EDA 대기업으로 기술 이전되는 패턴이 예상된다.
EDA 벤더의 데이터 개방 여부가 AI 네이티브 설계 플로우에서의 생존 조건으로 부상하며, 독점 포맷 고수 업체는 LLM의 리버스 엔지니어링으로 장벽이 무력화될 가능성이 크다.

SemiEngineering

🔄 2일째 (05-04~)

NoC Coherency Challenges Balloon With AI SoCs And Chiplets

AI SoC와 chiplet 기반 멀티다이 시스템이 복잡해지면서 NoC(Network-on-Chip) 코히런시 설계가 시스템 성능을 결정하는 핵심 변수로 부상하고 있다. CPU 클러스터는 공유 메모리 프로그래밍 모델로 인해 완전 캐시 코히런트 NoC가 필수인 반면, NPU·AI 가속기는 명시적 데이터 이동과 로컬 메모리 방식으로 비코히런트 NoC를 활용해 전력·처리량을 최적화한다. Cadence의 Physical AI 칩렛 플랫폼은 최소 3개 칩렛(시스템·CPU·AI 가속기) 구성으로, 시스템 칩렛이 CPU와는 캐시 코히런트, AI 가속기와는 I/O 코히런트 인터페이스를 동시 지원한다. 데이터센터 스케일에서는 랙→카드→칩→칩렛 계층별 NoC 토폴로지를 탑다운 설계 관점에서 통합해야 하며, Arteris의 통합 NoC 소프트웨어 등 상용 IP 솔루션 도입이 가속화되고 있다. 외부 메모리 접근 레이턴시는 최대 100ns에 달해 캐시 계층 최적화가 AI 추론 성능의 병목 해소에 직결된다.

핵심 인사이트

AI SoC의 컴퓨팅 성능이 Moore's Law를 훨씬 초과하는 속도로 확장되는 반면, 데이터 이동·혼잡·에너지 효율이 실질적 성능 병목으로 부상하여 NoC 설계가 선행 과제로 격상되었다.
캐시 코히런트 NoC는 비코히런트 대비 면적·전력 오버헤드가 크므로, 코히런트 도메인을 CPU-메모리 사이로 최소화하고 나머지를 비코히런트로 처리하는 혼합 토폴로지 설계가 현업 표준으로 자리잡고 있다.
칩렛 기반 멀티다이에서 부팅 시 칩렛 간 자기 발견(discovery)과 라우팅 재구성이 필요해져, NoC의 프로그래머빌리티와 관리 에이전트 요건이 대폭 강화되고 있다.
Arteris, Baya Systems, Cadence, ChipAgents 등 NoC IP 및 AI 설계 자동화 업체들이 데이터센터-패키지-칩렛 계층 전체를 아우르는 탑다운 NoC 설계 플로우 시장을 놓고 경쟁을 본격화하고 있다.

SemiEngineering

🔄 3일째 (04-30~)

How Long Will CAN Stick Around As Rival Networks Speed Up?

차량 내 네트워킹 기술이 CAN(Controller Area Network)에서 Automotive Ethernet으로 전환되는 과정과 그 도전 과제를 분석한 기사다. AI 및 소프트웨어 정의 차량(SDV)의 확산으로 인해 기가비트급 대역폭과 TSN(Time-Sensitive Networking), MACsec 보안 기능을 갖춘 Automotive Ethernet이 차량 네트워크의 핵심 백본으로 부상하고 있다. Infineon은 향후 5~10년 내에 10BASE-T1S(10Mbps)가 CAN/CAN FD를 대체할 것으로 전망했으며, 현재 백본 속도는 1~2.5Gbps에서 최대 10Gbps까지 확장되고 있다. 다만 수십 년간 자동차에 내재화된 ECU, 센서, 액추에이터의 레거시 CAN/LIN 의존성, 낮은 비용 민감도, 수백만 줄의 코드 통합 복잡성이 전환을 지연시키는 요인으로 작용하며, 디지털 트윈 기반 시스템 모델링이 전환 기간의 핵심 솔루션으로 제시됐다.

핵심 인사이트

Infineon은 10BASE-T1S가 5~10년 내 CAN/CAN FD를 대체하고, 차량 네트워크가 순수 Ethernet으로 통합될 것으로 전망했다.
주요 OEM 한 곳이 Ethernet 전환 결정을 내리면 공급망 전체가 따라가는 '티핑포인트' 동학이 이미 형성 중이다.
SerDes는 Automotive Ethernet과 불가분의 관계로, SGMII·25GBASE-X 등 고속 SerDes 기술이 차량과 데이터센터 간 상호 기술 이전 채널이 되고 있다.
Keysight, Infineon, Rambus, Siemens, Cadence, Synopsys 등 반도체·EDA 기업이 SDV 네트워크 전환 수혜 포지션을 선점 중이며, 차량용 IP 시장 경쟁이 본격화됐다.

SemiEngineering

🔄 5일째 (04-28~)

When Semiconductor Materials Misbehave

고성능 AI 하드웨어용 이종 패키징이 복잡해지면서 실험실 재료 특성과 실제 양산 환경의 괴리가 심화되고 있다. 단일 패키지에 수십 종의 이종 재료가 통합되면서 조합론적 상호작용이 폭발적으로 늘어났고, 기존 시뮬레이션 도구는 전기·기계·열 물리를 개별 도메인으로 처리해 결합 효과를 놓치는 구조적 한계가 있다. 재료 특성 데이터베이스는 최신 유리 기판·고분자 접착제 같은 신소재의 정밀 물성 데이터를 확보하지 못하고 있으며, 공정 중 잠재 결함은 품질 검사를 통과한 뒤 현장에서 뒤늦게 드러난다. 몰리브덴(Mo)의 텅스텐 대체 사례는 단위 공정 검증과 고객 통합 공정 간의 간극을 잘 보여준다.

핵심 인사이트

이종 패키징의 재료 수 급증으로 시뮬레이션 예측 불가 영역이 확대 — 양산 수율 예측의 근본적 한계
전기·기계 시뮬레이션 분리 설계 관행이 실제 패키지 실패의 주요 원인 — co-design 툴체인 필요성 부각
신소재 물성 데이터의 IP 기밀성과 시뮬레이션 정확도 요구 간의 구조적 모순 — 업계 표준화 논의 시급
몰리브덴 등 신소재의 단위 공정 개발 완료 후에도 고객별 통합 공정 학습이 별도 필요 — TSMC·삼성·SK하이닉스 등 파운드리의 노하우 장벽 더욱 공고화

The Register

🆕 신규

OpenAI exec says company hopes to burn $50B of somebody else's money on compute this year

OpenAI 공동창업자 겸 사장 Greg Brockman이 Elon Musk와의 법적 소송 증언에서 2026년 한 해 동안 컴퓨팅 비용으로 500억 달러를 지출할 계획이라고 밝혔다. 이 금액은 대부분 외부 투자자 자금으로, OpenAI는 여전히 흑자 전환에 실패한 상태다. 2026년 2월 Amazon, Nvidia, SoftBank가 발표한 1,100억 달러 투자 중 최소 800억 달러는 조건부 계약이다. 예컨대 Amazon의 350억 달러는 OpenAI가 Trainium 가속기 2기가와트 임대 및 AWS에 GPT 모델 배포를 이행해야 받을 수 있으며, Nvidia의 300억 달러 투자는 학습·추론용 컴퓨팅 5기가와트(약 3,000억 달러 추정) 배포 달성이 조건이다. 사실상 이 투자는 직접 출자가 아닌 대규모 할인·리베이트 구조에 가깝다.

핵심 인사이트

OpenAI의 2026년 컴퓨팅 지출 목표 500억 달러는 실제 수익 없이 외부 자금에 전적으로 의존하는 구조다.
Amazon·Nvidia·SoftBank의 1,100억 달러 투자 중 800억 달러가 조건부로, 실질적 가치는 리베이트·할인 성격이다.
OpenAI가 자체 매출 목표를 달성하지 못한다는 보도가 있어, 500억 달러 소진 가능 여부에 불확실성이 크다.
클라우드 하이퍼스케일러(AWS, Nvidia)가 AI 스타트업 투자와 컴퓨팅 판매를 연계하는 새로운 자본 구조가 업계 표준으로 부상하고 있다.

The Register

🆕 신규

Astera speaks softly and carries a big switch

Astera Labs가 Nvidia의 NVSwitch를 대체할 수 있는 랙 스케일 AI 패브릭 스위치 'Scorpio X'를 공개했다. 단일 ASIC에 PCIe 6.0 레인 320개를 집적해 양방향 대역폭 5.12 TB/s를 구현하며, 사실상 모든 가속기와 호환된다는 점이 핵심 차별화 요소다. Nvidia의 NVSwitch 6(14.4 TB/s)에 비해 대역폭은 약 3분의 1 수준이지만, 별도 칩 설계 없이 기존 PCIe 인터페이스만으로 연결 가능하다. 특히 혼합 전문가(MoE) 모델 추론에 최적화된 자체 멀티캐스트 기술 'Hypercast'를 탑재했다. Nvidia RTX Pro 6000 서버 카드처럼 NVLink를 지원하지 않는 GPU 32개 이상을 연결하거나, Nvidia-Groq, AWS-Cerebras, Intel-SambaNova와 같은 분리 추론 아키텍처에서 유용하다. Scorpio P시리즈(32~320레인)도 함께 확장하며, 생산 양산은 2026년 하반기로 예정되어 있다.

핵심 인사이트

Scorpio X는 5.12 TB/s 대역폭의 PCIe 6.0 기반 AI 패브릭 스위치로, 벤더 중립적 NVSwitch 대안을 표방한다.
MoE 추론에 최적화된 Hypercast 멀티캐스트 기술이 집합 통신 지연을 스위치 내에서 처리해 GPU 효율을 높인다.
PCIe 범용성 덕분에 NVLink 미지원 GPU나 이기종 가속기 혼합 환경에서 직접 경쟁 없이 시장 침투 가능하다.
Astera는 NVLink Fusion 지원도 병행 발표해, Nvidia 생태계 내 보완재와 대체재 양쪽 포지셔닝을 동시에 취하고 있다.

The Register

🆕 신규

Anthropic wants Claude to play with money, unleashes finance agents

Anthropic이 금융 업무 자동화를 위한 AI 에이전트 템플릿 세트를 공개했다. 각 템플릿은 도메인 지식을 담은 스킬(마크다운 파일), 외부 서비스 연동 커넥터, 특화 서브에이전트 세 가지 구성요소로 이루어진다. 제공 에이전트로는 KYC/AML 스크리너, 피치 빌더, 수익 검토, 모델 빌더, 시장 조사, 밸류에이션 검토, 총계정원장 조정, 월말 결산, 재무제표 감사 등 총 10가지다. Claude Cowork, Claude Code 플러그인 또는 Claude Managed Agents 코드스니펫 형태로 적용 가능하다. Anthropic의 Opus 4.7 모델은 Vals AI 금융 에이전트 벤치마크에서 64.37%를 기록해 업계 최고 수준이라고 발표했으나, 이는 반대로 약 36%의 실패율을 의미한다. Anthropic은 모든 출력물에 사람이 검토·승인하는 과정이 필수라고 강조한다.

핵심 인사이트

Anthropic Claude Opus 4.7의 금융 에이전트 벤치마크 점수 64.37%는 업계 최고지만, 오류율 35.6%는 고위험 금융 업무 적용에 주의를 요한다.
금융 AI 에이전트 시장이 KYC·AML부터 밸류에이션까지 전 단계로 확대되며, 기존 금융 SaaS 기업들과의 경쟁 구도가 형성된다.
스킬-커넥터-서브에이전트의 모듈형 아키텍처는 재사용성과 표준화를 높여 기업 도입 장벽을 낮추는 전략적 설계다.
'사람이 루프 안에' 원칙을 강조함으로써 Anthropic은 책임 소재를 최종 사용자에게 이전하는 안전 포지셔닝을 취하고 있다.

The Register

🆕 신규

IBM asks DBAs to trust AI to act on their behalf

IBM이 Db2 데이터베이스 자동화 플랫폼 'Db2 Genius Hub'를 업그레이드해 Google Vertex AI와 Intel Gaudi 가속기 지원을 추가했다. 이로써 기존의 Amazon Bedrock, IBM watsonx.ai에 더해 Microsoft Azure AI Foundry까지 총 4개 주요 AI 플랫폼을 지원하게 됐다. IBM에 따르면 Db2 Genius Hub는 관리 비용 25%, 수동 개입 30%, 장애 해결 시간 35% 절감 효과가 있다. 특히 은행이 전체 Db2 사용자의 약 43%를 차지하며 American Express, Bank of America, Citibank, Deutsche Bank 등이 포함된다. AI 에이전트가 사용자 승인하에 DB 운영 작업을 직접 제안·실행하는 '승인 기반 자율화' 방식을 채택해, DBA가 기술적 운영보다 비즈니스 의사결정에 집중할 수 있는 구조를 지향한다.

핵심 인사이트

Db2 Genius Hub의 AI 자동화 성과 지표(비용 -25%, 개입 -30%, 해결시간 -35%)는 벤더 자체 발표로, 실제 검증 데이터가 필요하다.
전체 사용자 43%가 금융권인 Db2에 AI 자율화 도입은 규제 환경과 리스크 허용 범위에 민감한 고위험 시장 공략이다.
AWS·Google·Microsoft·IBM 4대 AI 플랫폼 동시 지원으로 멀티클라우드 전략을 강화, DBA 도구 시장에서 플랫폼 종속성을 낮추는 포지셔닝이다.
Intel Gaudi 통합은 Nvidia 의존도를 낮추려는 IBM의 AI 인프라 비용 최적화 전략의 일환이며, 가격대비 성능 개선을 핵심 차별점으로 내세운다.

The Register

🆕 신규

ServiceNow clears agents for landing with new AI control tower

ServiceNow가 AI Control Tower를 단순 거버넌스 대시보드에서 기업 전체의 AI 자산 통합 관리 플랫폼으로 확장했다. 신규 기능은 발견, 관찰, 거버넌스, 보안, 측정 5개 영역을 커버하며, AWS·Google Cloud·Microsoft Azure 3대 하이퍼스케일러와 SAP·Oracle·Workday 등 엔터프라이즈 앱과 연결하는 30개 신규 커넥터를 포함한다. Veza 인수(2024년 12월)로 확보한 액세스 그래프 기술은 현재 300억 개 이상의 세밀한 권한을 매핑하며, AI 에이전트 ID 및 권한 관리에 적용된다. Traceloop 인수(2025년 3월)로는 모든 LLM 호출에 대한 실시간 런타임 모니터링이 가능해졌다. Action Fabric을 통해 Claude, Copilot 등 외부 AI 에이전트가 ServiceNow의 엔터프라이즈 워크플로우를 직접 실행할 수 있으며, Anthropic이 첫 번째 설계 파트너다. ServiceNow는 내부적으로 1,600개 이상의 AI 자산을 운용하고 2025년 AI 내부 활용 누적 가치 5억 달러를 달성했다고 밝혔다.

핵심 인사이트

ServiceNow AI Control Tower의 핵심은 AI 에이전트 스프롤(무분별한 확산)을 통제하는 거버넌스·보안 인프라로, 엔터프라이즈 AI 관리 시장의 주도권을 선점하려는 전략이다.
Veza의 300억+ 권한 매핑 기술로 AI 에이전트 ID 거버넌스가 가능해져 최소 권한 원칙을 자동 적용하고 보안 감사 체계를 강화했다.
Action Fabric + MCP 서버로 Claude·Copilot 등 외부 에이전트가 ServiceNow 워크플로우를 실행 가능해져, AI 에이전트 간 상호운용성 표준 경쟁이 본격화된다.
AI 지출 추적 및 ROI 대시보드 기능 추가로 CFO 레벨의 AI 비용 가시성 확보가 가능해져, 기업 AI 투자 정당화 도구로서의 포지셔닝이 강화됐다.

The Register

🆕 신규

Microsoft fixes VS Code after app gives Copilot credit for human's work

Microsoft가 VS Code 1.110 버전(2026년 3월 초 배포)에서 Git 커밋에 "Co-authored-by: Copilot" 태그를 기본값으로 추가한 변경 사항을 되돌리기로 했다. 개발자들은 Copilot AI 기능을 비활성화했음에도 불구하고 커밋 메타데이터에 해당 태그가 삽입된다는 점, 그리고 변경 전 확인한 커밋 메시지와 실제 저장된 Git 히스토리가 다르다는 점에서 강하게 반발했다. Microsoft의 VS Code 리뷰어 Dmitriy Vasyura는 커뮤니티 반응을 확인하지 않고 변경 승인한 것을 공개 사과했다. 수정 버전(VS Code 1.119)에서는 Copilot 어트리뷰션 태그가 opt-in 방식으로 전환될 예정이다. 한편 Anthropic Claude Code와 OpenAI Codex도 기본값으로 AI 어트리뷰션을 추가하고 있어 업계 전반의 표준 통일이 필요한 상황이다.

핵심 인사이트

AI 어트리뷰션 기본값 정책이 개발자 신뢰를 훼손할 수 있음을 보여준 사례로, opt-in vs opt-out 논쟁이 업계 표준 문제로 부상했다.
AI 생성 코드의 저작권 불확실성(순수 AI 생성 코드는 저작권 보호 불가)으로 인해, 어트리뷰션 기록이 지식재산권 및 보험 청구 분쟁에서 불리하게 작용할 위험이 있다.
Microsoft(VS Code)는 opt-in, Anthropic·OpenAI는 opt-out으로 AI 어트리뷰션 정책이 제각각이어서 엔터프라이즈 코드 관리 정책 수립에 혼선이 발생한다.
Linux 커널은 인간의 서명 및 AI 기여 명시 의무화, Zig는 AI 코드 기여 전면 금지 등 오픈소스 생태계도 AI 코드 기여 정책을 분화시키고 있다.

The Register

🆕 신규

Shadow IT has given way to shadow AI. Enter AI-BOMs

기존 소프트웨어 자재명세서(SBOM)가 AI 시대에 더 이상 충분하지 않다는 문제의식에서 AI-BOM(AI Bill of Materials) 개념이 부상하고 있다. AI-BOM은 조직 내 모든 AI 모델, 데이터셋, SDK 라이브러리, MCP 서버, ML 프레임워크, 에이전트, 프롬프트, 아이덴티티 등을 목록화하고 상호 연결 관계를 추적한다. Cisco는 자체 AI-BOM을 오픈소스로 공개하고, 추가로 약 150개 베이스 모델·45개 이상 패밀리·20개 이상 퍼블리셔를 대상으로 한 모델 출처 추적 도구(Model Provenance Kit)를 함께 공개했다. Google Wiz는 빌드 도구와 개발자 아이덴티티까지 포함한 광의의 AI-BOM을 제공한다. Cursor Composer 2가 중국 오픈소스 모델 Kimi 2.5를 기반으로 구축한 사례처럼, 무허가 모델 포함이 규제·컴플라이언스 위험으로 이어질 수 있다. EU AI Act는 고위험 시스템에 대한 훈련 데이터 및 방법론 문서화를 의무화하고 있다.

핵심 인사이트

Shadow AI(비공인 AI 도구 사용)는 Shadow IT의 AI 버전으로, 기업이 인지하지 못하는 AI 자산이 공격 표면을 급격히 넓히고 있다.
Cisco의 AI-BOM + Model Provenance Kit 오픈소스 공개는 AI 공급망 보안 표준화를 선도하는 전략이며, 보안 제품 번들 판매로 이어질 수 있다.
AI 에이전트 시스템 프롬프트 탈취·변조 공격 실사례가 보고됨에 따라, AI-BOM을 통한 설정 상태 변경 감지가 새로운 보안 통제 수단으로 부상했다.
EU AI Act의 고위험 시스템 문서화 요건은 AI-BOM 도입을 규제 컴플라이언스 관점에서 사실상 의무화할 수 있어, 관련 시장이 빠르게 성장할 전망이다.

The Register

🆕 신규

AI inference just plays by different rules

AI 추론(inference) 워크로드가 기존 클라우드 스토리지 아키텍처의 한계를 폭로하고 있다는 기술 분석이다. AI 에이전트는 ReAct(Reasoning and Acting) 루프에서 밀리초 단위로 수백 개의 병렬 벡터 유사도 검색을 동시에 실행해, 기존 인간 행동 패턴 기반으로 설계된 AWS EBS 같은 스토리지 레이어가 I/O 버스트 크레딧을 소진시키고 레이턴시가 1ms에서 50ms까지 급등하는 "성공 재앙" 시나리오를 유발한다. 주요 지표로는 p99/p999 꼬리 레이턴시를 강조하며, 단순 평균 레이턴시는 AI 추론 환경에서 의미가 없다. 실제 유사 사례에서 RAG 기반 쇼핑 어시스턴트가 프로덕션 출시 15분 만에 EBS 버스트 크레딧을 소진하고 전체 사이트가 다운된 사례가 소개된다. 솔루션으로 소프트웨어 정의 스토리지 추상화(Silk)를 통해 AWS EBS의 물리적 한계를 넘어서는 20 GiB/s 처리량을 달성했다는 내용이다. 단, 이 기사는 Silk의 스폰서 콘텐츠임을 명시하고 있다.

핵심 인사이트

AI 에이전트의 OLTP++ 특성(밀리초 단위 수백 병렬 벡터 검색)은 기존 클라우드 스토리지 용량 계획의 가정 자체를 무력화시킨다.
AWS EBS 버스트 크레딧 모델은 AI 추론 트래픽의 예측 불가한 스파이크에 구조적으로 취약하며, "슬라이더 IOPS 증설"로 해결되지 않는 한계가 있다.
RAG+벡터DB 프로덕션 환경에서 p99 꼬리 레이턴시 관리가 핵심 엔지니어링 지표로 부상하며, 기존 평균 레이턴시 중심의 인프라 설계 패러다임 전환이 필요하다.
소프트웨어 정의 스토리지 레이어가 클라우드 네이티브 AI 추론 인프라의 새 시장으로 부상하고 있으며, Silk와 같은 스타트업이 하이퍼스케일러의 스토리지 제약을 틈새 시장으로 공략한다.

The Register

🆕 신규

Five Eyes spook shops warn rapid rollouts of agentic AI are too risky

미국·영국·캐나다·호주·뉴질랜드 Five Eyes 정보동맹 5개국의 사이버보안 기관이 공동으로 에이전틱 AI의 빠른 도입에 경고를 발령했다. 공동 발표된 가이드 "Careful adoption of agentic AI services"는 AI 에이전트가 기존 조직의 취약점을 증폭시키고, 다수의 도구·외부 데이터 소스를 연결하는 과정에서 광범위한 공격 표면을 생성한다고 경고한다. 가이드에는 23가지 위험 사항과 100개 이상의 모범 실천 방안이 수록되어 있다. 구체적 위협 시나리오로는 과도한 권한을 가진 패치 설치 에이전트가 내부자 공격자의 프롬프트로 방화벽 로그까지 삭제하는 사례, 조달 에이전트를 침해해 계약 변조 및 미승인 결제를 실행하는 사례 등이 포함된다. OWASP와 MITRE ATLAS가 아직 에이전틱 AI 고유 공격 벡터를 충분히 다루지 못하고 있다는 점도 지적했다. 핵심 권고 사항은 효율성보다 복원력·가역성·위험 억제를 우선시하고, 명확히 정의된 저위험 업무부터 단계적으로 도입하라는 것이다.

핵심 인사이트

Five Eyes 5개국 기관의 공동 경고는 에이전틱 AI 거버넌스가 국가 안보 수준의 사안으로 격상됐음을 의미하며, 향후 규제 강화의 신호탄이 될 수 있다.
가이드에서 23가지 위험과 100개+ 모범 실천 방안을 제시한 것은 에이전틱 AI 보안 프레임워크가 아직 성숙하지 않았음을 방증하며, OWASP·MITRE 표준의 공백이 크다.
과도한 권한 부여(overpermissioning)가 에이전틱 AI의 핵심 취약점으로 지목됐으며, 최소 권한 원칙과 인간 감독이 방어의 핵심 요소로 강조됐다.
생산성 우선 도입이 아닌 복원력·가역성 우선 접근을 권고함으로써, AI 에이전트 도입 속도를 늦추려는 기관들에게 공식적인 근거가 제공됐다.

The Register

🔄 2일째 (05-04~)

Inference is giving AI chip startups a second chance to make their mark

AI 산업이 모델 훈련에서 추론(inference) 배포 중심으로 전환되면서, AI 칩 스타트업들이 Nvidia 독점에 도전할 새로운 기회를 얻고 있다. 추론 워크로드는 훈련과 달리 사용 사례에 따라 다양한 특성이 요구되는데, 이 이질성이 분산 추론 아키텍처 수요를 자극하고 있다. Nvidia는 $200억에 Groq를 인수해 GPU(prefill)와 전용 칩(decode)을 결합한 하이브리드 시스템을 구현했으며, AWS는 Trainium과 Cerebras 웨이퍼 스케일 장치를 병행 사용한다. Lumai는 광자 행렬 연산을 활용한 전기-광학 하이브리드 아키텍처를 개발 중이다. 다만 Tenstorrent CEO Jim Keller는 다양한 전용 하드웨어 확산이 AI 모델 변화에 대한 호환성 문제를 야기한다며 통합적이고 단순한 접근 방식을 주장한다.

핵심 인사이트

Nvidia의 Groq 인수($200억)는 단순 경쟁 제거를 넘어 GPU+전용 칩 하이브리드 추론 아키텍처 구현 전략의 일환이다.
추론 시장의 다양성(배치처리 vs 실시간 응답)이 단일 칩 독점보다 이종 컴퓨팅 생태계를 조성하는 구조적 동인이 되고 있다.
광학 기반 추론 가속기(Lumai) 등 비전통적 접근이 등장하며, 전통 반도체를 넘어선 새로운 기술 경쟁이 시작되고 있다.
클라우드 사업자(AWS, Intel 등)의 스타트업 기술 채택은 칩 스타트업의 엑시트 경로를 훈련 칩보다 추론 특화 솔루션 파트너십으로 바꾸고 있다.

IEEE Spectrum

🆕 신규

DAIMON Robotics Wants to Give Robot Hands a Sense of Touch

홍콩 기반 스타트업 DAIMON Robotics가 세계 최대 규모의 옴니모달 로봇 조작 데이터셋 'Daimon-Infinity'를 공개했다. 1,000만 시간 규모의 멀티모달 데이터에 110,000개 이상의 감지 유닛을 핑거팁 크기 모듈에 집적한 고해상도 촉각 센서 데이터가 포함되어 있으며, 80개 이상의 실제 시나리오와 2,000개 이상의 인간 스킬 데이터를 망라한다. Google DeepMind, Northwestern University, National University of Singapore와 공동 개발했으며, 10,000시간 분량은 오픈소스로 공개했다. 기존 Vision-Language-Action(VLA) 모델에 촉각(Tactile) 모달리티를 추가한 VTLA 아키텍처를 제안하며, 단색(monochromatic) 비전 기반 촉각 센싱 방식으로 촉각 데이터를 비전 프레임워크에 자연스럽게 통합할 수 있음을 입증했다. 중국 주요 호텔 배달 로봇 전면 배치 사례처럼 편의점·공장 등 특화 도메인 선행 상용화를 목표로 한다.

핵심 인사이트

핑거팁 1개에 110,000개 이상 감지 유닛 집적—업계 최고 밀도의 촉각 센서로 로봇 손 조작 능력의 물리적 한계 돌파
Daimon-Infinity 데이터셋 공개로 물리적 AI 학습 데이터 부족 문제 해소—산업 전체 Embodied AI 발전 속도 가속 예상
VTLA 아키텍처는 촉각 데이터를 시각 이미지 포맷으로 처리, 기존 VLA 기반 파운데이션 모델과 호환성 유지가 핵심 강점
중국 호텔 딜리버리 로봇 100% 배포 선례처럼 편의점·공장 등 특화 도메인 집중 전략이 범용 휴머노이드 로봇 대비 조기 ROI 창출 가능

IEEE Spectrum

🆕 신규

Why Perfect AI Alignment Is Mathematically Out Of Reach

King's College London의 Hector Zenil 등 영국 연구팀이 PNAS Nexus 저널에 발표한 논문에서 AI 정렬(alignment)의 완전한 달성이 수학적으로 불가능하다는 증명을 제시했다. 이 연구는 Gödel의 불완전성 정리와 Turing의 정지 문제 결정불가능성에 근거하며, 충분히 복잡한 일반 지능 AI 시스템은 본질적으로 예측 불가능한 행동을 산출할 수밖에 없음을 논증한다. 연구팀은 완전한 정렬 대신 "관리된 비정렬(managed misalignment)" 전략을 제안한다. 이는 완전 정렬형·부분 정렬형·비정렬형 행동 지향을 가진 다양한 AI 에이전트들로 구성된 "인지 생태계(cognitive ecosystem)"를 구축하고, 에이전트들이 서로 감시·견제·도전하는 구조를 만드는 방식이다. 인간 사회의 법원·감사인·경쟁 기관처럼 단일 지배 AI 없이 분산 제어를 실현하는 것이 목표다.

핵심 인사이트

AI 정렬 불완전성을 Gödel·Turing 수학적 토대로 증명—정렬은 공학 문제가 아닌 형식 시스템의 구조적 한계임을 확인
"관리된 비정렬" 패러다임 전환 제안—단일 초지능 AI 통제 환상 포기하고 다양한 에이전트 간 상호 견제로 안전성 확보
AI 안전 연구의 방향이 '완벽한 제어' 추구에서 '분산 제어 생태계 설계'로 근본적 전환 필요성 부각
인지 생태계 전략은 AI 거버넌스 정책·규제 설계에 직접 영향—단일 AI 기업/모델 의존 리스크 분산 비즈니스 모델 부상 예고

IEEE Spectrum

🆕 신규

Meet the AI Familiar That Wants to Fix Your Daily Routine

iRobot 공동창업자 Colin Angle이 설립한 스타트업 Familiar Machines & Magic(FM&M)이 첫 번째 로봇 'Familiar'를 공개했다. 23 DOF(자유도) 4족 보행 로봇으로, 맞춤형 터치 감응 외피, 비전 시스템, 마이크로폰 어레이를 탑재하고 온디바이스 엣지 AI 스택이 소형 멀티모달 모델로 구동된다. 애완동물처럼 주인을 찾아다니며 스마트폰 과다 사용·운동 부족 등 일상 루틴을 모니터링해 개선을 유도하는 '라이프스타일 코치' 역할을 목표로 한다. Disney Research 출신의 Creative Director Morgan Pope는 강화학습 기반 이족보행 성과와 생성형 AI의 지능 연출 능력이 이 제품을 현실적으로 만든 두 가지 핵심 진전이라고 설명했다. 2012~2019년 Anki, Jibo 등 소셜 로봇 스타트업의 실패 원인이었던 장기 인게이지먼트 문제 해결이 핵심 과제다.

핵심 인사이트

23 DOF 4족 로봇에 온디바이스 소형 멀티모달 모델 탑재—엣지 AI 기반 소셜 로봇의 기술 실현 가능성 첫 상업적 검증 시도
iRobot 창업자 재등판으로 소셜 홈 로봇 카테고리 부활 신호—강화학습·생성형 AI 결합이 과거 실패 극복 열쇠로 제시
Roomba 식 단순 기능 로봇과 달리 행동 변화 유도 '라이프스타일 어시스턴트' 포지셔닝—홈 로봇 가치 제안의 패러다임 전환
소형 멀티모달 모델 최적화 시장 성장 촉진—온디바이스 실시간 소셜 AI 추론 수요가 엣지 AI 칩 및 경량 모델 투자 기회 확대

IEEE Spectrum

🆕 신규

With $1 Cyberattacks on the Rise, Durable Defenses Pay Off

NYU의 Evan Johnson·Justin Cappos 교수가 AI 기반 사이버 공격의 비용이 $1 이하로 떨어진 현실에서 지속 가능한 방어 전략을 논한다. 2025년 8월 NYU Tandon 연구팀이 LLM 기반 시스템이 인간 개입 없이 랜섬웨어 공격 주요 단계를 $0.70에 자동 완료함을 시연했다. Anthropic의 Claude Mythos는 방어 측에서 모든 주요 OS·브라우저를 포함한 1,000개 이상의 제로데이 취약점을 선제 발굴했다. 그러나 연구진은 AI 가드레일이나 자동화 패치는 임시방편에 불과하다고 지적하며, 근본 해법으로 메모리 안전 언어(Rust 등) 도입, 소프트웨어 샌드박싱(WebAssembly, RLBox), 형식 검증(formal verification)의 3단 방어 체계를 제안한다. Google·Microsoft 연구에 따르면 심각한 보안 결함의 약 70%가 메모리 관리 오류에서 비롯된다.

핵심 인사이트

LLM 기반 랜섬웨어 공격 자동화 비용 $0.70 실측—공격의 민주화로 비전문가도 정교한 사이버 공격 가능한 시대 도래
Google·Microsoft 실증 데이터: 심각한 보안 취약점의 70%가 메모리 관리 오류—Rust 등 메모리 안전 언어 전환이 가장 효과적인 구조적 방어
AI 가드레일·자동 패치는 증상 치료에 불과—형식 검증(formal verification)으로 취약점 자체를 수학적으로 존재 불가능하게 만드는 근원 해결이 필요
레거시 C/C++ 코드베이스의 Rust 전환 수요 급증 예상—생성형 AI 활용 코드 마이그레이션 자동화 시장과 형식 검증 툴체인 투자 기회 부상

IEEE Spectrum

🔄 2일째 (04-30~)

GPU Renters Are Playing a Silicon Lottery

William & Mary 대학, Jefferson Lab, Silicon Data가 공동 수행한 연구에 따르면 동일 모델의 GPU라도 클라우드 렌탈 시 성능 편차가 최대 34.5%에 달하는 "실리콘 복권" 현상이 확인됐다. 11개 클라우드 제공업체에서 3,500개 GPU를 대상으로 6,800회 벤치마크 테스트를 실시한 결과, H100 PCIe GPU는 컴퓨팅 성능이 최대 34.5%, H200 SXM GPU는 메모리 대역폭이 최대 38% 차이를 보였다. 주요 원인은 반도체 제조 공정의 고유한 불균일성에 따른 제조 편차로, 클라우드 제공업체들이 특정 GPU 유닛 정보를 공개하지 않아 사용자가 예측할 수 없다. LLM 학습·추론 등 성능 민감 워크로드 실행 시 사전 벤치마크 측정이 필수적이며, 2026 HPCA 심포지엄에서 발표됐다.

핵심 인사이트

동일 모델 H100 GPU 간 컴퓨팅 성능 편차 최대 34.5%, H200 메모리 대역폭 편차 최대 38% 실측 확인
AI 클라우드 인프라 비용 예측 불가능성 증가—장기 렌탈 계약 전 성능 검증이 기업 리스크 관리의 필수 요소로 부상
반도체 웨이퍼 내 제조 편차가 근본 원인으로, CMOS 공정 미세화 진전에도 완전 해소 불가능한 물리적 한계
클라우드 제공업체의 GPU 성능 투명성 규제 압박 강화 예상—SiliconMark 같은 표준 벤치마크 생태계 성장 기회

IEEE Spectrum

🔄 3일째 (04-29~)

Better Hardware Could Turn Zeros into AI Heroes

스탠퍼드대 연구팀이 스파스(희소) 컴퓨팅 전용 칩 SIGMA를 개발해 CPU 대비 평균 70배 에너지 절감, 8배 속도 향상을 달성했다. 대규모 AI 모델의 파라미터 중 상당 부분이 실제로 0에 가까운 스파스 특성을 지니는데, 기존 GPU·CPU는 이를 활용하지 못한다. Cerebras는 LLM의 70~80% 파라미터를 0으로 설정해도 정확도 손실이 없음을 이미 시연했다. 스파스 하드웨어, 펌웨어, 소프트웨어를 통합 설계할 때만 이점을 극대화할 수 있다.

핵심 인사이트

CPU 대비 70x 에너지 절감, 8x 속도 향상으로 AI 추론 전력 위기에 대한 하드웨어 차원 해법 제시
기존 GPU는 스파스 포맷 디코딩 오버헤드로 오히려 성능 저하, 스파스 전용 아키텍처 필요성 명확
하드웨어·펌웨어·컴파일러·ML 프레임워크 전 스택 공동 설계가 필수, 개별 최적화로는 효과 미미
Meta Llama 2조 파라미터 등 초거대 모델 확장 추세에서 스파스 컴퓨팅이 에너지 효율 대안으로 부상

IEEE Spectrum

🔄 7일째 (04-16~)

Crypto Faces Increased Threat from Quantum Attacks

Google Quantum AI가 암호화 위협을 가할 수 있는 양자 컴퓨터의 필요 규모가 기존 추정치보다 약 20배 작다는 백서를 발표해 post-quantum cryptography 전환에 긴박감이 더해졌다. RSA와 타원곡선 암호(ECC)를 깨는 데 필요한 큐비트는 현재 최대 기기(약 1,000큐비트)의 500배 이상이 필요하지만, 하드웨어 개선과 알고리즘 효율화가 동시에 진행되며 위협 시간표가 앞당겨지고 있다. 이 발표로 post-quantum cryptography를 이미 도입한 블록체인 Algorand의 코인 가격이 44% 급등했다. lattice cryptography 전문가 Chris Peikert는 향후 10년 이내 양자 공격 성공 확률을 5~10%로 추산하며, 미국 정부의 2035년 전환 목표가 시의적절하다고 평가했다.

핵심 인사이트

양자 위협 규모 기존 대비 20분의 1로 축소 확인, 암호화 전환 시간표 긴급 재평가 필요성 대두
10년 이내 양자 공격 성공 확률 5~10% 추산, 미국 정부의 2035년 post-quantum 전환 목표 재조명
Algorand의 post-quantum 선도 도입이 44% 가격 급등으로 이어져, 보안 선점의 실질적 비즈니스 가치 입증
lattice cryptography 기반 post-quantum 표준은 키 크기 증가 문제 미해결, 블록체인 적용 시 공간 효율 과제 상존

Next Platform

🆕 신규

Broadcom Helps CPU And XPU Makers Go Vertical With Compute

Broadcom이 3.5D Extreme Dimension System in Package(XDSiP) 기술을 통해 CPU 및 XPU 제조사들의 수직 적층(vertical stacking) 설계를 지원하고 있다. 기존 시스템 보드에서 다이-투-다이 연결 시 소비되는 3~5 picojoules/bit 에너지를 0.2 picojoules/bit 이하로 대폭 줄일 수 있으며, 신호 밀도는 기존 face-to-back 방식의 1,500 signals/mm² 대비 약 10배인 14,000 signals/mm²를 달성한다. Fujitsu의 "Monaka" Arm 서버 CPU(144 Armv9-A 코어, 2nm+5nm 혼합 공정)가 도입 예정이며, AWS Trainium4, Meta MTIA 500 포함 6개 XPU 업체가 3.5D XDSiP를 채택 중이다. 최소 한 개 제품이 2026년 하반기에 출시될 예정이다.

핵심 인사이트

Broadcom의 3.5D XDSiP는 신호 밀도 14,000 signals/mm²로 기존 대비 ~10배 향상, 칩렛 간 대역폭 혁신을 이끔
AWS Trainium4, Meta MTIA 500 등 주요 하이퍼스케일러 XPU 6종이 동시 도입 중으로 AI 칩 공급망 재편 가속화
1.4nm 위에 3nm 적층 구성까지 지원하며 최첨단 공정 조합이 가능해 열 관리와 성능 밀도 동시 최적화 실현
소켓 내부 전력 효율이 25배 이상 개선되어 대규모 AI 클러스터의 총소유비용(TCO) 절감 효과가 실질적으로 커짐

Next Platform

🆕 신규

Microsoft Committed To Doubling AI Infrastructure In Two Years

Microsoft는 FY2026 3분기(3월 종료)에 매출 $82.89B(+18.3% YoY), 순이익 $31.78B(+23.1%)를 기록했으며, Azure 추정 매출은 약 $23B(+39%)에 달한다. Satya Nadella CEO는 분기 중 1 GW의 데이터센터 용량을 추가했으며, 2년 내 AI 인프라 용량을 2배로 늘리겠다는 계획을 재확인했다. AI 비즈니스 ARR은 전년 대비 123% 성장하여 $37B에 도달했다. 2026년 연간 capex 계획은 $190B으로 상향되었으며(원자재 가격 상승분 $25B 포함), 2027년에는 추가 "significant increase"가 예고됐다. OpenAI와의 독점 계약이 해제되어 Microsoft는 멀티-모델 전략으로 전환 중이다.

핵심 인사이트

Azure AI 비즈니스 ARR이 $37B(+123% YoY)에 달해 클라우드 AI 수익화가 본격 궤도에 진입함을 증명
OpenAI 독점 계약 해제로 Microsoft는 멀티-벤더 AI 전략 전환, 의존도 리스크 분산과 Azure 개방성 강화
2년 내 전력 용량 2배(~20 GW) 목표는 글로벌 데이터센터 에너지·냉각 인프라에 전례 없는 수요 창출
연간 capex $190B 중 $25B이 원자재 가격 인상분으로, AI 인프라 투자의 인플레이션 구조화가 경쟁사에도 연쇄 압박

Next Platform

🔄 2일째 (05-04~)

Google Is A Full Stack AI Player, And Is Playing Well

Google Cloud는 2026년 1분기 매출 $200억을 돌파하며 YoY 63.4% 성장, AWS 성장률의 2배를 기록했다. Gemini 기반 GenAI 모델이 분당 160억 토큰을 처리(QoQ 60% 증가)하며 엔터프라이즈 AI 수요를 견인 중이다. GenAI 모델 기반 제품 매출은 YoY 800% 급성장했고, $1억~$10억 규모 대형 딜도 YoY 2배 증가했다. Google Cloud의 수주잔고는 $4,620억에 달하며, 향후 2년 내 절반 인식 예정이다. CEO Sundar Pichai는 Google이 전체 엔터프라이즈 AI 스택을 단독으로 제공하는 유일한 공급자임을 강조했다.

핵심 인사이트

Google Cloud 1Q26 영업이익 $66억(YoY 3배 이상), 수년간의 수익성 개선 투자가 본격적으로 결실을 맺는 변곡점 도달
분당 160억 토큰 처리·수주잔고 $4,620억은 GenAI 워크로드가 클라우드 성장의 구조적 주도 요인임을 수치로 입증
TPU~Gemini~Vertex AI(Gemini Enterprise Agent Platform)로 이어지는 풀스택 수직 통합이 AWS·Azure 대비 경쟁 우위의 핵심
검색(YoY +19%), YouTube(YoY +11%) 광고 수익이 AI 시대에도 견조 성장, Google의 AI 투자 여력($1,800억 capex)을 뒷받침

Next Platform

🔄 2일째 (05-04~)

AWS Will Be An OEM, Just Like Google And Maybe Microsoft

대형 AI 모델 기업들이 클라우드 임대 대신 자체 하드웨어 소유를 추구하면서, AWS·Google·Microsoft가 사실상 OEM 역할로 전환 중이다. Google은 이미 Anthropic에 3.5 GW분 TPU 랙을 판매하기로 합의했고, AWS는 Anthropic·OpenAI와 각각 5 GW($1,000억 규모), 2 GW 규모의 Trainium 공급 계약을 체결했다. CEO Andy Jassy도 향후 Trainium 랙 판매 가능성을 공식 인정했다. AWS 1Q26 매출은 $375.9억(YoY +28.4%), 영업이익은 $141.6억(영업이익률 37.7%)으로 Amazon 전체 영업이익의 59.4%를 차지했다. 클라우드 프리미엄을 피하려는 모델 기업들의 수요가 하이퍼스케일러를 칩·시스템 공급자로 재편하고 있다.

핵심 인사이트

AWS·Google의 OEM 전환은 클라우드 비즈니스 모델의 구조적 전환점으로, 임대 수익 대신 시스템 판매 수익이 새로운 성장 축으로 부상
Anthropic-AWS 5 GW/$1,000억 딜과 Anthropic-Google 3.5 GW TPU 랙 구매는 AI 모델 기업들이 인프라 비용 절감을 위해 클라우드 종속에서 탈피하는 구조적 흐름
Trainium·TPU 시스템을 외부 판매할 경우 Nvidia·AMD GPU OEM과 동일한 박리다매 구조에 편입, 하이퍼스케일러의 마진 압박 심화 우려
AWS 1Q26 영업이익률 37.7%는 Anthropic·OpenAI가 감당 불가한 수준, OEM 공급 전환은 고객 이탈 방지를 위한 불가피한 선택

Next Platform

🔄 4일째 (04-29~)

New Google Networks Tuned Up For GenAI Inference And Training

Google이 TPU 8 세대에 맞춰 추론용과 학습용 네트워크를 분리 설계했다. 추론용 TPU 8i(Zebrafish)는 기존 3D 토러스 대신 Boardfly 토폴로지(dragonfly 파생)를 채택해 홉 수를 16→7로 줄이고 평균 레이턴시를 50% 절감, 1,152개 TPU를 단일 이미지로 연결한다. 학습용 TPU 8t(Sunfish)는 새로운 Virgo Ethernet 패브릭으로 134,000 TPU를 단일 패브릭으로, OCS 스위치 연결 시 100만 TPU를 단일 논리 클러스터로 묶는다. Ironwood 대비 GenAI 추론 처리량이 3배 이상 향상됐다.

핵심 인사이트

추론·학습 전용 네트워크 분리로 AI 워크로드별 최적 인터커넥트 전략 수립, 범용 인프라 시대 종료
Boardfly ICI-Apollo OCS 조합으로 1,152 TPU 추론 클러스터 홉 56% 감소, 레이턴시 절반으로 단축
Virgo 패브릭의 134,000 TPU 단일 패브릭, OCS 연결 시 100만 TPU 논리 클러스터로 학습 규모 한계 대폭 확장
TPUDirect RDMA·Storage 추가로 Nvidia GPU 생태계와 동등한 데이터 접근 효율 확보

Next Platform

🔄 4일째 (04-29~)

Microsoft And OpenAI Remain Friends, Are Looking To Hook Up With Others

7년간 $137.5억을 투자하고 독점 계약을 유지하던 Microsoft와 OpenAI가 파트너십을 재편했다. Microsoft는 2032년까지 비독점 라이선스를 유지하고 수익 공유 의무를 폐지하는 대신, OpenAI는 AWS·GCP·CoreWeave 등 타 클라우드와도 자유롭게 계약할 수 있게 됐다. OpenAI의 Microsoft 수익 공유(20%)는 2030년까지 상한을 두고 지속된다. Microsoft는 Anthropic에 $50억 투자 및 $300억 컴퓨팅 계약을 체결, OpenAI 의존도를 낮추는 동시에 Anthropic과의 관계를 강화 중이다.

핵심 인사이트

Microsoft-OpenAI 독점 해제로 클라우드 AI 공급망이 완전 개방, 멀티클라우드 AI 시대 본격 시작
Microsoft의 Anthropic $50억 투자+$300억 컴퓨팅 계약은 OpenAI 탈의존 전략의 핵심 축
OpenAI·Anthropic 동시 IPO 추진 중, 독점 해제가 기업가치 극대화에 긍정적으로 작용
Google의 Anthropic $400억 투자 vs. Microsoft의 $50억 투자, AI 동맹 경쟁에서 규모 격차 존재

Next Platform

🔄 4일째 (04-29~)

AI-Driven CPU Shortage Saves Intel’s Financial Cookies

AI 추론 시스템 확산으로 GPU:CPU 비율이 8:1에서 4:1, 2:1로 줄면서 Intel 데이터센터 CPU 수요가 급증했다. Intel의 1Q26 DCAI 그룹 매출은 전년 동기 대비 22.4% 증가한 $50.5억, 영업이익은 2.7배 급등한 $15.4억을 기록했다. AI 관련 비즈니스가 Intel 전체 매출의 60%, YoY 40% 성장을 달성했다. CEO Lip-Bu Tan 체제 하에서 더 보수적이고 현실적인 Intel로 변모 중이며, 14A 공정은 외부 고객 확보 없이 독자 진행하지 않는다는 원칙을 유지 중이다.

핵심 인사이트

AI 추론 확산으로 GPU:CPU 비율 감소, 역설적으로 Intel CPU 수요가 급증하는 구조적 반전
1Q26 DCAI 영업이익 2.7배 급등($15.4억, 마진 30.5%)으로 수년간의 수익성 위기에서 탈출 신호
전체 2026년 X86 CPU 생산량이 사실상 이미 배분 완료, 공급 부족분이 최소 수십억 달러 수준
Lip-Bu Tan의 보수적 14A 전략은 IBM/AMD 사례 교훈, 외부 고객 없이 첨단 공정 독자 진행 거부

Next Platform

🔄 4일째 (04-29~)

The GenAI Battle Shifts From Frontier Models To Agentic Platforms

PwC의 글로벌 시니어 임원 300명 조사 결과 88%가 에이전틱 AI 등장으로 AI 예산을 늘릴 계획이며, 79%는 이미 AI 에이전트를 채택했다. Google Cloud Next 2026에서 Google은 Vertex AI를 'Gemini Enterprise Agent Platform'으로 재편, Agent Studio(로우코드)·Agent Development Kit·Agent Runtime(장시간 실행+영구 메모리)·MCP 네이티브 통합 등을 발표했다. '크로스 클라우드 레이크하우스'로 AWS·Azure 데이터에 직접 접근하는 'Agentic Data Cloud'도 공개됐다. Google Cloud 고객의 75%가 이미 AI 제품을 사용 중이다.

핵심 인사이트

프론티어 모델 경쟁에서 에이전틱 플랫폼 경쟁으로 AI 패권 전장 이동, Google Cloud의 전면 베팅
Gemini Enterprise Agent Platform이 200개 이상 모델 지원(Anthropic·Meta·Mistral 포함), 멀티모델 통합 플랫폼 전략
크로스 클라우드 레이크하우스로 AWS·Azure 데이터 직접 접근, 멀티클라우드 AI 데이터 사일로 해소 시도
PwC 조사: 79% 에이전트 채택, 66% 생산성 가치 확인, 88% 예산 증액 계획으로 에이전트 시장 폭발적 성장

Next Platform

🔄 6일째 (04-27~)

With TPU 8, Google Makes GenAI Systems Much Better, Not Just Bigger

Google이 TPU 역사상 처음으로 학습용(Sunfish TPU 8t)과 추론용(Zebrafish TPU 8i) 두 가지 별도 설계를 공개했다. Sunfish 8t는 216 GB HBM3e(6,528 GB/sec), 128 MB SRAM, FP4 지원으로 12.6 petaflops 피크 성능을 달성하며 이전 세대 Ironwood TPU v7e 대비 학습 비용 효율 2.7배 향상됐다. Zebrafish 8i는 384 MB SRAM(3배 증가)과 새로운 Collectives Acceleration Engine(CAE)으로 칩 내 레이턴시를 5배 감소시켜 에이전틱 AI 추론을 최적화했다. 두 변형 모두 2nm 공정으로 제조되며 와트당 성능이 2배 향상됐다. 학습 포드는 3D 토러스 인터커넥트로 9,600 TPU 단일 메모리 도메인을 구성하며, 신규 데이터센터 패브릭 "Virgo"가 학습·추론 각각에 최적화된 네트워크 토폴로지를 제공한다.

핵심 인사이트

Google의 TPU 학습/추론 분리 설계는 단일 칩으로 두 워크로드를 처리하는 범용 접근에서 목적별 특화 아키텍처로 AI 가속기 패러다임 전환을 선언한 것이다.
Zebrafish 8i의 CAE 엔진은 자동 회귀 디코딩 레이턴시를 5배 감소시켜 수백만 동시 AI 에이전트 운영을 가능하게 하는 핵심 인프라 혁신이다.
Sunfish 8t의 Ironwood 대비 2.7배 학습 비용 효율 향상은 대형 언어모델 학습 TCO를 직접 낮추어 Google Cloud 고객사의 AI 투자 부담을 완화한다.
신규 데이터센터 패브릭 Virgo의 도입은 학습·추론 분리 아키텍처가 칩 수준을 넘어 네트워크·인프라 전체로 확산되는 시스템 레벨 투자임을 시사한다.

Next Platform

🔄 7일째 (04-24~)

Cisco Scales Out Quantum Systems With A Quantum Network Switch

Cisco의 인큐베이션 조직 Outshift이 Universal Quantum Switch 프로토타입을 공개했다. 이 스위치는 IBM(초전도), QuEra(중성 원자), IonQ(이온 트랩) 등 다양한 양자 컴퓨터 모달리티를 단일 네트워크로 연결해 분산 양자 컴퓨팅을 가능케 한다. 편광(polarization), 시간 빈(time-bin), 주파수 빈(frequency-bin), 경로(path) 등 4가지 인코딩 방식을 지원하며, 소비 전력은 1밀리와트 미만, 전기-광학 전환 속도는 나노초 이하다. 양자 상태 열화율은 4% 미만으로 측정됐다. 현재 편광 인코딩 검증이 완료됐고, 나머지 모달리티 검증이 진행 중이다. 이를 통해 현재 100~1,000 큐비트 수준의 시스템을 네트워킹으로 수십만~수백만 큐비트 규모로 확장하려는 것이 목표다.

핵심 인사이트

Cisco는 클라우드 컴퓨팅의 스케일 아웃 패러다임을 양자 컴퓨팅에 적용, 1,000 큐비트 시스템 100대를 연결해 10만 큐비트 달성을 목표로 한다.
이종 양자 모달리티 간 상호 운용성 확보가 차세대 양자 데이터센터 인프라의 핵심 경쟁 요소로 부상하고 있다.
실온 동작, 1밀리와트 미만 소비전력, 기존 텔레콤 광섬유 호환으로 실용적 배포 가능성을 높인 설계가 주목된다.
DARPA의 HARQ 프로그램 등 정부 주도 이종 양자 아키텍처 이니셔티브와 맞물려 Cisco의 양자 네트워크 스택 투자가 가속화될 전망이다.

📰 한국어 뉴스 대시보드

⭐ 중요 기사 목록