표시할 기사가 없습니다.
글로벌 여행 예약 플랫폼 Booking.com이 해커들이 고객의 개인정보에 무단 접근했음을 공식 확인했다. 유출된 데이터에는 이름, 이메일, 전화번호, 예약 세부 정보 등이 포함되며, 재무 정보는 침해되지 않았다고 밝혔다. 회사는 유출 사실을 인지한 즉시 해당 예약의 PIN 번호를 변경하고 고객에게 통보했다. Reddit 사용자 제보에 따르면, 피해 고객 중 일부는 이미 예약 정보를 활용한 WhatsApp 피싱 메시지를 수신한 것으로 나타났다. Booking.com은 영향받은 고객 수 공개를 거부했으며, 회사 웹사이트 기준으로 2010년 이후 누적 예약 고객은 68억 명에 달한다.
핵심 인사이트
- Booking.com이 고객 성명·이메일·전화번호·예약 세부 정보 유출을 공식 확인하며 대규모 여행 플랫폼 보안 취약성이 재차 드러났다.
- 해커들이 탈취 데이터를 활용해 피싱 공격을 이미 실행 중이어서 2차 피해가 진행 중이며 고객 피해 규모가 확대될 가능성이 높다.
- 누적 고객 68억 명 규모의 플랫폼임에도 영향 받은 고객 수를 공개하지 않아 투명성 부재에 대한 비판이 제기된다.
- 2024년에도 Booking.com 호텔 파트너 시스템 침해 사례가 있었던 만큼, 반복적인 보안 사고는 규제 당국의 강화된 조사를 불러올 수 있다.
Stanford University의 연간 AI 산업 보고서에 따르면, AI 전문가 집단과 일반 대중 사이의 인식 격차가 점점 확대되고 있다. AI가 의료에 긍정적 영향을 줄 것이라는 전문가 비율은 84%에 달하는 반면, 일반 대중은 44%에 그쳤다. 고용 분야에서도 전문가의 73%가 긍정적이지만 일반인은 23%만이 동의한다. Gallup 조사에 따르면 Z세대는 AI에 대한 기대가 줄고 분노가 증가하는 추세다. AI 전반에 대한 부정적 감정은 확대되는 한편, AI 제품이 혜택이 더 많다고 응답한 비율은 2024년 55%에서 2025년 59%로 소폭 상승했다. 미국은 AI 규제 당국 신뢰도가 조사 국가 중 가장 낮은 31%를 기록했다.
핵심 인사이트
- AI 전문가 56%가 AI의 미국 사회 긍정 영향을 낙관하는 반면, 일반 대중의 우려가 지속 확대되며 사회적 합의 형성이 어려워지고 있다.
- 의료(전문가 84% vs 대중 44%), 고용(73% vs 23%), 경제(69% vs 21%) 전 분야에서 극심한 인식 격차가 AI 거버넌스 논쟁을 심화시킨다.
- 미국 정부의 AI 규제 신뢰도가 31%로 조사 국가 최하위를 기록해, 규제 공백에 따른 산업 불확실성이 고조될 전망이다.
- AI에 대한 긍정 평가가 55%→59%로 상승하면서도 '불안감' 응답도 50%→52%로 동반 상승, 기술 확산과 사회적 불안이 공존하는 양상이다.
Microsoft가 오픈소스 로컬 에이전트 OpenClaw와 유사한 기능을 Microsoft 365 Copilot에 통합하는 작업을 진행 중인 것으로 확인됐다. 신규 기능은 기업 고객을 대상으로 하며, 오픈소스 OpenClaw 대비 강화된 보안 통제를 제공할 예정이다. Microsoft는 이미 3월에 Copilot Cowork를, 2월에 Copilot Tasks를 발표하는 등 에이전트 경쟁에 적극적이다. Copilot Cowork에는 Anthropic의 Claude가 탑재됐다. 이번에 개발 중인 에이전트는 멀티스텝 작업을 장기간 자율 수행하는 '항시 작동' 방식을 지향하며, 6월 Microsoft Build 컨퍼런스에서 공개될 것으로 예상된다.
핵심 인사이트
- Microsoft가 OpenClaw 방식의 로컬 에이전트를 Microsoft 365 Copilot에 통합함으로써 오픈소스 진영의 기업용 시장 잠식을 방어하려는 전략적 움직임이다.
- Copilot Cowork에 Anthropic Claude를 채택한 데 이어 새 에이전트 개발까지 진행하며, Microsoft의 에이전트 포트폴리오가 빠르게 확장되고 있다.
- '항시 작동하는 멀티스텝 에이전트' 개념은 단순 챗봇 수준을 넘어 비즈니스 워크플로우 자동화를 겨냥한 것으로, 기업용 AI 경쟁의 핵심 전장이 되고 있다.
- Mac Mini 기반의 OpenClaw 사용자를 끌어들이려는 Microsoft의 시도는 Apple 하드웨어 의존도를 줄이고 Windows 생태계 내 AI 수요를 강화하려는 의도로 분석된다.
Jeff Bezos가 지원하는 전기차 스타트업 Slate Auto가 6억 5천만 달러 규모의 시리즈 C 라운드를 완료해 누적 조달액이 약 14억 달러에 달하게 됐다. 이번 라운드는 Guggenheim Partners CEO 겸 LA Dodgers 구단주 Mark Walter와 투자자 Thomas Tull이 이끄는 TWG Global이 주도했다. Slate Auto는 2026년 말까지 첫 번째 저가형 전기 픽업트럭 생산을 시작할 계획으로, 예상 시작 가격은 $20,000대 중반이다. 현재 16만 건 이상의 환불 가능한 예약이 접수된 상태이며, 인디애나주 옛 인쇄공장을 개조해 수억 달러를 투자 중이다. SUV 변환 키트 등 고객 맞춤형 옵션도 약 $5,000에 제공할 예정이다.
핵심 인사이트
- 연방 전기차 세액공제($7,500) 폐지와 테슬라 판매 2년 연속 감소라는 역풍 속에서도 Slate Auto가 $650M 유치에 성공해 저가형 EV 시장의 잠재력을 입증했다.
- Amazon 출신 창업팀과 Jeff Bezos 패밀리 오피스 투자가 결합한 구조로, 아마존 특유의 대량 생산·물류 DNA를 EV 제조에 이식하는 전략이 주목된다.
- 시작가 $20,000대 중반의 극저가 전기 픽업트럭은 Tesla, Rivian 대비 가격 경쟁력으로 틈새 시장을 공략하며 16만 건 이상의 예약을 확보했다.
- 최종 가격 발표(2026년 6월)와 생산 개시(2026년 말)가 모두 올해 예정되어 있어, EV 스타트업 중 가장 빠른 시장 진입 타임라인을 보여준다.
캐나다 위성 통신 기업 Kepler Communications가 현재 궤도상 최대 규모의 컴퓨트 클러스터를 운영 중이며, 10기의 위성에 약 40개의 Nvidia Orin 엣지 프로세서를 탑재하고 레이저 통신으로 연결했다. Kepler는 18개 고객사를 확보했으며, 최신 파트너 Sophia Space와 협력해 궤도상 자체 운영체제 소프트웨어를 위성에서 테스트할 예정이다. Sophia는 수동 냉각 방식의 우주용 컴퓨터를 개발 중으로, 2027년 말 첫 위성 발사를 계획하고 있다. SpaceX, Blue Origin 등의 대형 우주 데이터센터는 2030년대에나 가능할 전망이며, 현재는 합성개구레이더 등 고전력 센서 데이터의 궤도 내 엣지 처리가 핵심 비즈니스 모델이다.
핵심 인사이트
- 궤도 컴퓨트 시장의 현실적 첫 단계는 대형 데이터센터가 아닌 Nvidia Orin 기반 분산 엣지 처리임이 확인되며, Kepler의 비즈니스 모델이 검증 단계에 진입했다.
- 미국 지자체와 의회의 지상 데이터센터 신설 제한 움직임이 우주 기반 컴퓨팅 인프라의 대안적 매력을 높이는 예상치 못한 성장 동력이 되고 있다.
- Sophia와 Kepler의 파트너십은 궤도상 첫 멀티 우주선 소프트웨어 배포 및 구성 시도로, 우주 데이터센터 상용화의 핵심 기술 리스크를 검증하는 선례가 된다.
- 미 군사 미사일 방어 시스템 등 정부 수요가 궤도 엣지 컴퓨팅의 초기 수익화를 이끌며, 상업-군사 이중 용도 시장으로 빠르게 확대되고 있다.
비즈니스 모니터링 소프트웨어 기업 Anodot(Glassbox 소유)이 해킹 피해를 입어 최소 12개 이상의 고객사 데이터가 유출되고 랜섬 협박에 직면했다. 해킹 그룹 ShinyHunters는 4월 4일 Anodot의 데이터 커넥터를 중단시키고 클라우드 인증 토큰을 탈취해 고객사의 클라우드 저장 데이터를 대거 훔쳤다. 클라우드 데이터 플랫폼 Snowflake는 이상 징후를 감지하고 일부 Anodot 고객의 데이터 접근을 차단했다. 피해 기업 중에는 Rockstar Games(GTA, Max Payne 제작사)가 포함되었으며, Rockstar는 "비중요 회사 정보 일부"가 유출됐다고 확인했다. ShinyHunters는 Gainsight, Salesloft 등 대규모 클라우드 데이터를 다루는 SaaS 기업을 지속 표적으로 삼고 있다.
핵심 인사이트
- Anodot 단일 침해로 12개 이상 기업이 연쇄 피해를 입은 사례는 SaaS 공급망 보안 취약성의 구조적 위험을 다시 한번 드러냈다.
- ShinyHunters가 클라우드 인증 토큰을 탈취해 Snowflake 등 제3자 클라우드 저장소까지 연쇄 침해하는 방식은 기존 네트워크 침투보다 탐지가 어려워 대응 전략 재편이 필요하다.
- Rockstar Games의 연속 침해(2022년 GTA VI 유출, 2026년 Anodot 경유)는 게임사 등 IP 집약 기업이 특히 표적화되는 경향을 보여준다.
- 소셜 엔지니어링으로 IT 헬프데스크를 속이는 ShinyHunters의 수법은 기술적 방어만으로는 한계가 있어, 인적 보안 교육과 다단계 인증 강화가 시급하다.
샌프란시스코 Moscone Center에서 열린 HumanX AI 컨퍼런스에서 참가자들 사이에 가장 많이 언급된 AI 챗봇은 Anthropic의 Claude였다. 반면 ChatGPT와 OpenAI에 대한 언급은 현저히 줄었으며, 일부 벤더는 OpenAI가 "하락세"에 접어들었다고 평가했다. OpenAI는 최근 $122억 펀딩 라운드와 IPO 준비에도 불구하고 집중력 부족이라는 인식을 받고 있다. Sora 프로젝트 중단, ChatGPT 광고 도입 등이 부정적 여론을 키웠다. 이에 대응해 OpenAI는 Codex 접근성을 강화한 월 $100 구독 플랜을 새로 출시하며 Claude Code 사용자 유치를 노리고 있다. WSJ 분석에 따르면 두 회사는 "기술 역사상 가장 빠르게 성장하는 기업"이며 수익 면에서 팽팽한 경쟁 중이다.
핵심 인사이트
- HumanX 컨퍼런스에서 Claude가 ChatGPT를 압도하는 인지도를 보이며 기업용 AI 시장 선호도가 뒤집히고 있다.
- OpenAI는 $122억 펀딩과 IPO 준비에도 불구하고 집중력 분산과 신뢰도 하락으로 브랜드 위기를 맞고 있다.
- Anthropic과 OpenAI 모두 WSJ 기준 "기술 역사상 가장 빠른 성장"을 기록하며 AI 시장 전체가 급격히 확대 중이다.
- OpenAI의 월 $100 Codex 구독 플랜은 Claude Code 사용자 이탈을 막기 위한 직접적인 경쟁 대응 전략이다.
Uber와 자율주행 기술 기업 Nuro가 Lucid Gravity SUV 기반 프리미엄 로보택시 서비스의 샌프란시스코 직원 테스트 단계를 시작했다. Lucid Gravity에는 Nuro의 자율주행 시스템과 Nvidia Drive AGX Thor 컴퓨터, 고해상도 카메라, 솔리드스테이트 라이다, 레이더가 장착됐다. 차량은 자율 모드로 운행되며 안전 운전자가 동승한다. 2025년 7월 파트너십 발표 이후 Uber는 Lucid에 $3억 달러를 투자하고 6년간 최소 2만 대의 Gravity SUV 구매를 약정했으며, Nuro에도 수억 달러 규모의 별도 투자를 집행했다. 공개 서비스 출시는 2026년 내로 계획돼 있으며, 차량 양산은 2026년 말 예정이다.
핵심 인사이트
- Lucid Gravity 기반 프리미엄 로보택시는 일반 자율주행 서비스와 차별화된 프리미엄 포지셔닝을 통해 고수익 세그먼트를 선점하려는 Uber의 전략적 시도다.
- Uber의 Lucid $3억 투자와 2만 대 구매 약정은 단순 파트너십을 넘어 EV-자율주행 수직 통합 공급망 구축의 첫 단계로 해석된다.
- Nvidia Drive AGX Thor 기반 Nuro 자율주행 스택과 솔리드스테이트 라이다 결합은 프리미엄 자율주행 차량의 센서 퓨전 표준을 제시하는 기술 레퍼런스가 된다.
- 샌프란시스코 직원 테스트는 Waymo 독주 시장에서 Uber-Nuro 연합의 공개 서비스 출시를 위한 필수 운영 데이터 확보 단계로, 2026년 내 경쟁 본격화를 예고한다.
대학 지구과학 강사인 Scott K. Johnson이 ChatGPT 등 생성형 AI가 교육 현장에 미치는 심각한 폐해를 고발한다. College Board의 고교생 600명 설문에서 84%가 학업에 생성형 AI를 사용했다고 답했으며, 대학 교수 약 3,000명 대상 조사에서는 85%가 LLM이 학생의 비판적 사고 능력 발달을 저해한다고 우려했다. 실제로 2019년부터 출제한 과제의 정답률이 ChatGPT 등장 후 3명 중 1명에서 절반 이상으로 급등했지만, 이는 학생들이 AI에 그대로 입력해 답을 받아내기 때문이다. 온라인 비동기 수업에서는 구술 시험 등 AI 차단 대안을 적용하기 어려워 교육의 질 저하가 불가피하며, 강사는 부정행위 적발에만 매건당 4~8시간을 소비하고 있다.
핵심 인사이트
- 고교생 84%가 학업에 생성형 AI 사용, AI 부정행위는 위키피디아 표절보다 탐지·처벌이 훨씬 어렵다.
- 대학 교수 85%가 LLM이 비판적 사고 저해한다고 우려하며, 72%는 AI 사용 관리에 어려움을 겪는다.
- 온라인 비동기 수업은 구술시험 등 AI 차단 대안 적용 불가로 AI 폐해에 가장 취약하다.
- 교육 행정가들은 AI를 "효과적으로 활용하는 법 교육"을 지시하지만, 현장 강사의 실질적 문제를 외면하고 있다.
Google이 Pixel 10 스마트폰의 셀룰러 모뎀에 메모리 안전 언어인 Rust를 접목해 보안을 강화했다. 모뎀 펌웨어는 수십 년간 축적된 C/C++ 레거시 코드로 구성되어 있으며, Google Project Zero 팀은 Exynos 모뎀에서 최근 수년간 24개 이상의 취약점을 발견했고 이 중 18개가 '심각' 등급으로 분류됐다. Google은 전체 모뎀 코드를 재작성하는 대신, DNS 파싱 부분에만 오픈소스 Rust 라이브러리인 hickory-proto를 적용했다. 해당 Rust 컴포넌트는 371KB로 기존 C/C++ 코드에 추가되었으며, 악성 DNS 패킷을 통한 메모리 조작 공격을 원천 차단한다. Pixel 10은 이 개선된 모뎀 구현을 최초 탑재한 기기다.
핵심 인사이트
- Google Project Zero가 Exynos 모뎀에서 수년간 24개 이상 취약점 발견, 18개는 '심각' 등급으로 분류됐다.
- 모뎀 전체 재작성 대신 DNS 파서에만 Rust를 적용하는 현실적 접근법으로 기술 부채 문제를 우회했다.
- Rust의 borrow checker가 컴파일 타임에 메모리 안전성을 보장, GC 기반 언어 대비 실시간 성능 유지가 가능하다.
- Rust 컴포넌트 371KB 추가로 악성 DNS 패킷 공격 차단, 향후 더 많은 모뎀 구성요소에 확대 적용 계획이다.
홍역 환자가 미국에서 백신 접종률이 가장 낮은 아이다호주의 보이시 공항을 통과해 보건 당국에 비상이 걸렸다. 감염자는 2026년 3월 29일 오전 1시 30분~7시 40분 사이 공항에 체류했으며, 당국은 같은 항공편 탑승객에게 직접 통보하는 작업을 진행 중이다. 아이다호주는 2024~2025학년도 유치원생 MMR 백신 접종률이 78.5%에 불과해 집단면역 기준인 95%를 크게 밑돈다. 비의료적 면제 비율이 15.1%로 전국 최고 수준이며, 최대 접종률도 약 85%에 그쳐 구조적 취약성이 크다. 2026년 들어 현재까지 아이다호에서 9건의 홍역이 보고되었으며, 모두 미접종 또는 접종 여부 불명 환자였다.
핵심 인사이트
- 아이다호 유치원생 MMR 접종률 78.5%로 전국 최저, 집단면역 기준 95%에 크게 미달한다.
- 비의료적 백신 면제율 15.1%로 최고 수준, 구조적으로 집단면역 달성 불가능한 상태다.
- MMR 2회 접종 시 예방 효과 97%이며 평생 지속되지만, 주 정책으로 인해 접종률이 낮다.
- 2026년 아이다호 홍역 9건 모두 미접종·접종 불명자 발생, 공항 노출로 추가 확산 우려가 크다.
PC 하드웨어 기업 NZXT가 논란이 된 'Flex' 월 구독 PC 렌탈 프로그램과 관련해 19,322명을 대상으로 하는 345만 달러 규모의 집단소송 합의에 동의했다. 2024년 8월 출시된 Flex는 월 59~279달러에 게이밍 데스크톱을 임대하는 서비스였으나, 광고와 다른 사양의 PC 제공, 임대 조건 오도, 인플루언서를 통한 허위 '렌트-투-오운' 광고 등으로 소비자 불만을 샀다. 합의 조건에 따라 일부 고객은 현재 사용 중인 PC를 소유할 수 있으며(추정 가치 약 121만 달러), 90일 이상 연체 계정에는 최대 5,000달러의 채무가 탕감되고, 145만 달러의 현금 합의 기금이 조성된다. NZXT는 2027년 12월 31일까지 광고 관행 개선과 명확한 제품 사양 고지 의무를 지킨다.
핵심 인사이트
- NZXT Flex 렌탈 PC 프로그램, 광고 사양 불일치 및 렌트-투-오운 오도 광고로 소비자 집단소송에 직면했다.
- 19,322명 대상 $3,450,000 합의 확정, PC 소유권 이전·채무 탕감·현금 기금으로 구성된 복합 구제책 적용된다.
- 결제·추심 파트너 Fragile도 공동 피고로 포함, 렌탈 서비스의 제3자 파트너 책임 문제를 부각시켰다.
- NZXT, 2027년 말까지 인플루언서 광고 제한·정확한 사양 공시 등 영업 관행 개선 의무 이행해야 한다.
IBM이 트럼프 행정부의 반(反)DEI 압박에 굴복해 1,707만 달러를 미국 정부에 납부하기로 합의했다. 법무부(DOJ)는 이를 2025년 5월 창설된 '시민권 사기 이니셔티브(Civil Rights Fraud Initiative)'의 첫 번째 합의 사례로 발표했다. 이 이니셔티브는 정부 계약업체의 DEI 관련 위반을 1863년 허위청구법(False Claims Act) 적용 대상으로 삼아 3배 손해배상과 민사 제재를 가하는 제도다. 정부는 IBM이 인종·성별 기반 채용 목표 설정, 인터뷰 기준 조정, 다양성 관련 프로그램 운영에 연방 계약 비용을 전용했다고 주장했다. IBM은 위법 행위를 전면 부인했지만 관련 프로그램을 종료·수정하고 $8.2백만 환급금을 포함한 합의금을 서명 후 14일 내 납부한다.
핵심 인사이트
- IBM, 위법 부인에도 $17,077,043 납부 합의, 트럼프 '시민권 사기 이니셔티브' 첫 번째 집행 사례로 기록됐다.
- 허위청구법을 DEI 정책에 적용하는 새 법적 틀 등장, 정부 계약업체의 다양성 프로그램 전반에 위기를 초래한다.
- 트럼프 행정부는 FCC 합병 승인 거부 등 다양한 규제 수단으로 민간기업 DEI 폐지를 광범위하게 압박 중이다.
- IBM은 위반 사실 조기 자진 공개와 프로그램 자발적 종료로 협조 크레딧을 받아 합의 성사를 앞당겼다.
Intel Foundry Services가 세계 최박형 질화갈륨(GaN) 칩렛을 개발했다고 발표했다. 실리콘 기판 두께는 19마이크로미터로 줄였으며, 300mm GaN-on-실리콘 웨이퍼 공정을 사용해 기존 반도체 제조 인프라와 호환된다. 핵심 기술적 성과는 GaN 전력 트랜지스터와 실리콘 기반 디지털 로직 회로의 단일 칩 통합으로, 보조 칩 없이 고성능 전력 회로와 연산 기능을 동시에 구현했다. GaN 트랜지스터는 최대 78V 전압에서 작동하고, 300GHz 이상의 RF 차단 주파수를 달성하며, 인버터 스위칭 속도는 33피코초에 달한다. 4개 업계 표준 신뢰성 시험을 통과해 상업적 배포 요건을 충족하며 대량 생산 가능성을 시사한다.
핵심 인사이트
- 세계 최박형 19μm GaN 칩렛 달성 — 300mm 웨이퍼 공정으로 기존 팹 인프라 재활용 가능, 생산 비용 절감 기대
- GaN 전력 트랜지스터 + 실리콘 디지털 로직 단일 칩 통합 최초 달성 — 보조 칩 제거로 시스템 아키텍처 혁신
- 78V 내압·300GHz 이상 RF 성능 확인 — 고주파 통신(5G/6G), 데이터센터 전력 변환 시장 겨냥
- 4개 신뢰성 시험 통과, 웨이퍼 전체 균일 성능 — 대량 생산 및 상업 배포 현실성 검증 완료
Apple 폴더블 아이폰의 공급망 구조가 구체화되고 있다. 패널은 삼성디스플레이가 3년 독점 공급하며, CoE(Color-on-Encapsulation) 기술과 M14 OLED 소재를 적용한다. 메모리는 삼성이 12GB LPDDR5X를 공급하며 전년 대비 약 두 배의 조달 가격이 책정됐다. 렌즈는 라간(Largan), 힌지는 SZS(신주성)가 공급하며, 최종 조립은 폭스콘이 단독 담당해 2026년 4분기 양산 예정이다. 중국 A주 기업들도 LY iTECH(힌지·지지대), 렌즈테크(UTG 유리·PET 필름), FII·룩스쉐어·BYD 등이 공급망에 포함됐다. 다만 Nikkei는 엔지니어링 테스트에서 기술적 병목이 발생해 지연 위험이 있다고 보도했다.
핵심 인사이트
- 삼성디스플레이, 애플 폴더블 OLED 패널 3년 독점 공급 확정 — CoE 기술 채택으로 굴곡부 패널 내구성 해결
- 삼성 LPDDR5X 12GB 메모리 조달가 전년비 약 2배 — 폴더블 수요가 메모리 고부가 제품 믹스 개선에 기여
- 폭스콘 단독 조립, 2026년 4분기 양산 계획 — 엔지니어링 테스트 기술 병목으로 초기 공급 제약 가능성 존재
- 중국 A주 LY iTECH·렌즈테크 등 다수 공급망 참여 확정 — Apple 폴더블 출시가 중국 부품 업체 수혜 촉매
대만 DRAM 제조사 Nanya Technology가 2026년 1분기 사상 최대 분기 실적을 기록했다. 연결 매출은 NT$49.09억으로 전분기 대비 63.1% 증가했으며, 순이익은 NT$26.06억으로 전분기비 134.9%, 전년동기비 1,442.8% 급증했다. EPS는 NT$8.41을 기록했다. 출하량이 중간 한 자릿수 감소했음에도 ASP(평균 판매 단가)가 70% 이상 급등하며 실적을 견인했다. 2분기 DRAM 가격도 두 자릿수 추가 상승이 예상된다. 한편 SanDisk·Kioxia·SK하이닉스 계열 Solidigm·Cisco의 참여로 NT$787.2억의 사모 배정이 완료됐으며, 4대 주요 고객이 총 지분의 약 10.19%를 보유하게 됐다. DDR5는 매출의 약 10%, UWIO(Ultra Wide I/O) 커스텀 제품도 초기 매출에 기여 중이다.
핵심 인사이트
- 1분기 순이익 전년동기비 1,442.8% 급증, EPS NT$8.41 사상 최고 — ASP 70% 이상 상승이 출하량 감소를 압도
- 2분기 DRAM 가격 두 자릿수 추가 상승 전망 — 단기 스팟가 약세는 일시적 조정, 계약가 상승세 지속
- SanDisk·Kioxia·Solidigm·Cisco 사모 배정 NT$787.2억 완료 — 고객 지분 참여로 AI 메모리 로드맵 공동 개발
- 추가 협력사 복수 논의 중 — 지분 투자 넘어 공동 R&D·생산 할당·공급망 통합으로 확장 가능
일본 공공-민간 합작 파운드리 Rapidus가 2nm 칩 양산을 2027년 회계연도 하반기를 목표로 추진 중이다. 일본 경제산업성(METI)이 4월 11일 추가로 6,315억 엔의 지원을 승인하며 정부 총 지원액이 약 2조 4천억 엔에 달했다. 후공정(Back-End) 프로토타입 라인도 본격 가동에 들어갔으며, Analysis Center와 Rapidus Chiplet Solutions(RCS) 개소식도 진행됐다. RCS는 600mm 정사각형 RDL 인터포저 패널 프로토타입을 이미 생산했다. 또한 METI는 후지쓰에 최대 585억 엔, IBM Japan에 175억 엔의 AI 반도체 R&D 보조금을 지원하며, 두 회사 모두 Rapidus에 2nm급 제조를 위탁할 예정이다. 후지쓰는 1.4nm 공정의 AI NPU 개발을 Rapidus에 발주할 계획으로, 이는 캐논에 이은 두 번째 국내 주요 고객 확보다.
핵심 인사이트
- METI 추가 6,315억 엔 지원으로 정부 총 지원 약 2.4조 엔 — 국가 차원의 2nm 파운드리 독립 의지 재확인
- Rapidus RCS, 600mm RDL 인터포저 패널 프로토타입 생산 완료 — 전공정·후공정 통합 사이트로 진화 중
- 후지쓰 AI NPU(1.4nm 공정) 및 IBM Japan 위탁 계약 확보 — 양산 신뢰성 확보를 위한 핵심 고객 확보
- 삼성·TSMC 대비 후발 주자지만 정부 지원·고객 계약으로 2027년 양산 로드맵 현실화 가능성 상승
NAND 플래시 컨트롤러 업체 Silicon Motion의 쿠오 사장은 메모리 시장이 구조적 전환기를 맞고 있으며, 공급-수요 격차가 2027년에 더욱 확대될 것으로 전망했다. 2026년 전체 업계 생산 능력은 약 15~25% 증가에 그칠 것으로 예상되지만 수요 가속화는 이를 웃돌고 있다. 지난해 8월부터 올해 3월까지 NAND 플래시와 DRAM 가격은 용량에 따라 수배까지 급등했다. 삼성전자·마이크론·SK하이닉스 등 주요 공급업체들은 자본 지출에 신중한 태도를 유지하며 증설 사이클을 늦추고 있다. 새로운 팹의 생산 가속은 2026년 하반기~2027년에 시작될 예정이지만, 이는 공급 부족을 완전히 해소하기에는 부족할 것으로 분석된다.
핵심 인사이트
- 2026년 업계 생산능력 증가 15~25% 예상 — AI·데이터센터 수요 가속과 격차 확대로 타이트한 균형 지속
- NAND·DRAM 가격 지난 7개월간 수배 급등 — 빠른 추가 조정보다는 고가 안착 기조 이어질 전망
- 삼성·마이크론·SK하이닉스 자본 지출 보수적 유지 — 공급 증가 속도 의도적 지연, 가격 상승 사이클 연장
- 2027년 공급 격차 더 확대 예상 — CSP·중국 인터넷 기업 수요 급증이 신규 팹 가동을 앞지를 가능성
삼성의 2세대 2nm 공정 칩 Exynos 2700의 벤치마크 결과가 Geekbench 데이터베이스에서 포착됐다. 평가 보드(ERD) 테스트에서 멀티코어 성능이 최대 클럭 2.88GHz에서 10,000점을 넘어섰으며, 이는 퀄컴 스냅드래곤 8시리즈가 4.3~4.6GHz에서 약 11,000점을 기록하는 것과 비교해 전력 효율 측면에서 주목받고 있다. CPU는 10코어 1+4+1+4 쿼드 클러스터 구조를 채택했다. GPU는 AMD 지원 없이 삼성이 자체 개발한 Xclipse 970으로 OpenCL 점수 15,618을 기록했다. OS로 안드로이드 17이 탑재돼 삼성-구글의 차세대 OS 공동 최적화 가능성을 시사하며, NPU와의 초기 통합도 진행 중이다. 삼성 파운드리는 2026년 하반기 SF2P(2세대 2nm) 양산을 목표로 하고 있다.
핵심 인사이트
- Exynos 2700, 2.88GHz에서 멀티코어 10,000점 돌파 — 저클럭 고효율 전략으로 퀄컴 대비 전력 효율 우위 가능성
- Xclipse 970 GPU AMD 완전 독립 개발 — GPU 자체설계 역량 강화, 외부 IP 의존 탈피 신호
- Android 17 탑재 및 NPU 통합 진행 — 삼성-구글 소프트웨어-하드웨어 공동 설계 파트너십 시사
- 삼성 파운드리 SF2P 2026년 하반기 양산 목표 — Exynos 2700 실증이 파운드리 경쟁력 회복의 핵심 바로미터
대만 메모리 모듈 제조사 Transcend의 쉬 회장은 실제 계약 거래에서 2분기 DDR5 가격이 1분기 대비 40~50% 급등했다고 밝혔다. 이는 중국 소매 시장의 가격 하락 우려를 일축하는 내용으로, TrendForce의 전망치(계약 DRAM 가격 2분기 58~63% 상승)와도 방향성이 일치한다. DRAM과 NAND 플래시 모두 심각한 공급 부족 상태로, 고객들이 매일 주문을 넣을 정도다. 삼성과 마이크론의 공급 이행률은 여전히 매우 낮은 수준이다. 2026년 3월 Transcend 매출은 NT$56.8억을 기록했으며, 1분기 연결 매출은 NT$136.3억으로 역대 최고 분기 매출을 달성했다. 주요 수익 동인은 출하량 증가가 아닌 평균 판매 단가의 급격한 상승이다.
핵심 인사이트
- DDR5 계약 가격 2분기 40~50% 급등 확인 — 중국 소매 스팟 약세는 글로벌 계약 시장과 괴리, 실수요 기반 가격 상승 지속
- 삼성·마이크론 공급 이행률 극히 낮음 — LTA(장기계약) 체결에도 완전 공급 보장 불가, 공급 타이트 장기화
- DDR4 단종·MLC NAND 생산 축소 — 레거시 제품 수급 불균형 심화, 공급사 제품 믹스 고부가 전환 가속
- Transcend 1분기 매출 NT$136.3억 역대 최고 — ASP 주도 성장, 중국 메모리 대체재 부재로 글로벌 공급사 지위 강화
삼성전자가 기존 Galaxy Z Fold 라인업에 더해 새로운 'Wide Fold' 모델을 추가해 폴더블 스마트폰 라인업을 확장할 계획이라고 보도됐다. Galaxy Z Fold 8은 기존 폼팩터를 유지하며 성능 및 카메라 개선이 예상되고, Wide Fold는 더 넓은 화면 비율을 채택해 태블릿에 가까운 사용 경험을 제공할 것으로 알려졌다. 두 제품 모두 2026년 하반기 출시를 목표로 한다. 이는 Apple의 폴더블 아이폰 출시에 앞서 삼성이 폴더블 시장 지배력을 공고히 하려는 전략으로 해석된다. 삼성디스플레이의 CoE 기술 기반 패널 공급이 예정되어 있으며, 퀄컴 스냅드래곤 8 Elite 또는 삼성 자체 Exynos 2700 탑재 가능성이 거론되고 있다.
핵심 인사이트
- 삼성, Z Fold 8 외 'Wide Fold' 신규 라인 추가 — 폴더블 시장 세분화로 Apple 폴더블 아이폰 출시 전 방어선 구축
- Wide Fold, 넓은 화면 비율로 태블릿 대체 수요 공략 — 폴더블 폼팩터 다양화로 전체 시장 파이 확대 전략
- Exynos 2700 탑재 가능성 — 자체 AP 채택 시 파운드리·반도체 부문 시너지 효과 기대
- 2026년 하반기 출시 시 Apple 폴더블과 경쟁 구도 — 초기 공급 안정성과 가격 전략이 시장 점유율 결정 변수
중국 전역에서 AI 컴퓨팅 가격 인상 물결이 거세지고 있다. Tencent Cloud가 2026년 5월 9일부터 AI 컴퓨팅·컨테이너 서비스 약 5% 인상을 예고했고, Alibaba Cloud는 4월 18일부터 T-head Zhenwu 810E 칩 기준 5~34%, CPFS 파일 스토리지는 30% 인상한다. Baidu Cloud도 4월 18일부터 5~30% 인상을 예고했다. 글로벌 차원에서는 Amazon AWS가 1월 EC2 인스턴스 15% 인상에 이어 Google Cloud가 AI 인프라를 최대 100% 인상해 공급 부족이 전 세계적 현상임을 확인시켰다. 중소 기업과 스타트업의 AI 진입 장벽이 높아지며 산업 통합이 가속화될 전망이다.
핵심 인사이트
- Alibaba Cloud Zhenwu 810E 5~34% 인상, CPFS 30% 인상 — 중국 AI 칩 내재화에도 컴퓨팅 단가 급등
- Google Cloud AI 인프라 최대 100% 인상, AWS EC2 15% 인상 — 글로벌 고급 GPU 공급 부족의 가격 전이 현상
- Zhipu, 코딩 플랜 2월 30% 인상 후 GLM-5.1 출시와 함께 최소 8% 추가 인상 — 중국 AI 기업 수익화 전환 신호
- 컴퓨팅 비용 급등으로 스타트업 AI 시장 진입 더욱 어려워져 — 대형 테크 기업 중심의 AI 산업 통합 가속화 전망
AI 가속기의 급속한 확산이 반도체 테스트 분야에 전례 없는 복잡성을 가져오고 있다. 하나의 AI 가속기 패키지는 수천 개의 코어와 HBM(High Bandwidth Memory)을 포함하며, HBM은 전체 패키지 비용의 50% 이상을 차지해 불량 스택 조기 감지가 필수적이다. 테스트는 웨이퍼 프로브부터 HBM 스택 모듈, 최종 패키지, 데이터센터 내 시스템 레벨까지 다단계로 이루어진다. 각 패키지의 소비 전력이 300W~2,000W에 달해 열 관리도 핵심 과제다. HBM은 HBM3E에서 HBM4로 진화하면서 스택 높이 775마이크론 이내에 20개의 DRAM 다이를 집적하고, 인터페이스 폭도 4K 비트로 확장된다. IEEE 1838 표준이 멀티다이 스택 테스트 접근성을 지원하지만, 수천 개 코어에서의 불량 격리와 비트 정밀 예상 결과 검증은 여전히 난제로 남아 있다.
핵심 인사이트
- HBM이 AI 가속기 패키지 비용의 50% 이상을 차지하므로, HBM3E→HBM4 전환기에 Known Good Stack 검증이 수율 및 비용 관리의 핵심이 된다.
- AI 가속기는 수천 개의 동일 코어를 반복 배치하는 homogeneous 구조로, 기존 CPU 대비 스트리밍 스캔 및 병렬 테스트 최적화가 상대적으로 유리하다.
- 300W~2,000W의 고전력 밀도는 패키지 설계 단계에서 칩렛의 열 격리 배치를 필수 아키텍처 결정 사항으로 만들며, 테스트 중 전력 무결성 검증도 요구한다.
- Advantest, Synopsys, PDF Solutions, Amkor 등 주요 테스트·패키징 기업들이 AI 가속기 테스트 인프라 구축에 집중 투자하고 있으며, 이 분야의 시장 성장 잠재력이 크다.
비트 플립(bit flip)은 우주 방사선, 전압 글리치, 적대적 공격 등으로 인해 0이 1로 또는 1이 0으로 뒤바뀌는 현상으로, 프로세스 노드 축소·고클럭·저전압 추세와 맞물려 단순 신뢰성 이슈를 넘어 시스템 전반의 구조적 보안 위협으로 진화하고 있다. 실제로 에어버스 A320 항공기 전체 기단의 리콜 사태가 태양 방사선에 의한 비행 제어 데이터 변조에서 비롯됐다. DRAM 셀 축소로 노이즈 마진이 낮아지고 rowhammer 공격 위험이 높아지며, AI/ML 신경망 가중치 단 1비트 변조만으로도 백도어 삽입이 가능하다. Secure-IC(Cadence), Synopsys, Rambus 전문가들은 ECC 단독으로는 불충분하며, CFI(제어 흐름 무결성)·물리적 메모리 감지·잠금 스텝(lockstep) 등을 계층적으로 결합하는 Defense in Depth 전략이 필수라고 강조한다.
핵심 인사이트
- 비트 플립은 이제 예외적 장애가 아닌 설계의 기본 가정이 되어야 하며, 첨단 노드에서 모델링되지 않은 비트 플립은 곧 설계 보안 취약점(gap)임
- rowhammer·클럭 글리칭·레이저 주입 등 의도적 fault injection이 보안 우회 수단으로 부상, 하드웨어 보안 IP 시장(Rambus, Secure-IC, Synopsys)의 수요 급증 예상
- ECC·CFI·물리적 센서·잠금 스텝을 계층화하는 Defense in Depth가 기술 표준으로 자리잡으며, 단일 완화책 의존 설계는 상용화·인증 단계에서 탈락 리스크 증가
- AI 가속기와 자동차·항공 등 고신뢰 시스템에서 비트 플립 방어 요구사항이 SI 설계 계약 조건에 포함되기 시작하는 단계로, 관련 EDA 도구 및 보안 IP 벤더에 신규 비즈니스 기회
2nm 이하 공정으로의 스케일링은 와트당 성능 향상을 위해 계속되고 있으나, 기술·경제적 복잡성이 전례 없는 수준으로 증가하고 있다. FinFET에서 GAA(Gate-All-Around) 나노시트 트랜지스터로의 전환은 이전 노드 전환 대비 1개 차원 이상 복잡성이 높으며, 금속 배선의 저항·열 이동·전기이동 문제가 신뢰성을 직접 위협한다. High-NA EUV 스캐너(Intel 기준 3억 5천만 달러 이상)가 도입되고, 다이 설계 비용은 일괄 working silicon까지 1억 달러를 초과한다. 칩렛·인터포저 기반 2.5D/3D 패키징은 수익과 물리적 한계를 동시에 늘리며, 하이브리드 본딩 피치는 35µm에서 9µm(Intel 18A 기준)으로 줄어들고 있다. Rapidus는 IBM 2nm 나노시트 기술 기반 양산을 2027년, 패키징을 2028년으로 계획하며, 실제 3D-IC 양산은 아직 어느 기업도 달성하지 못한 상태다.
핵심 인사이트
- GAA 나노시트 전환은 FinFET 대비 구조적 복잡도가 1개 오더 이상 증가, EDA·소재·공정 장비 전 영역에 동시 혁신이 요구됨
- 설계~테이프아웃 비용 1억 달러 초과로 사실상 AI 데이터센터 기업과 대형 파운드리 고객만이 첨단 노드 접근 가능 — 반도체 산업의 구조적 과점화 가속
- 완전 3D-IC는 2D 인터포저 대비 신호 경로·전력 밀도에서 도약적 개선을 이론상 제시하지만, 열 분산·수율·플로어플래닝 복잡도로 인해 양산 시점이 불확실한 상태
- Lam Research·Synopsys·proteanTecs 등 공정·EDA·인-칩 모니터링 업체가 마진 관리, 실시간 타이밍 가드밴드 계측 분야에서 신규 비즈니스 기회를 확보 중
2026년 1분기 반도체 스타트업 투자 시장은 80개사가 총 80억 달러 이상을 조달하며 강세를 보였다. 18개사가 1억 달러 초과의 메가 라운드를 달성했고, Rapidus(17억 달러)와 Cerebras(10억 달러)가 10억 달러를 돌파했다. AI 추론 칩, 칩간 인터커넥트, 포토닉스 분야가 투자를 주도했으며, EDA 자동화에 AI 에이전트를 적용하는 스타트업(Ricursive Intelligence: 3억 달러, ChipAgents: 5,000만 달러)도 주목받았다. 특히 6개 이상 스타트업이 최근 1년 내 추가 자금을 유치하며 재투자 빈도가 증가했다. 포토닉스 분야에서는 Ayar Labs(5억 달러), Olix(2.2억 달러), Neurophos(1.1억 달러) 등이 대규모 투자를 받았으며, 리소그래피·에피택시·전력 관리 등 제조·장비 분야의 신기술 스타트업도 자금을 유치했다.
핵심 인사이트
- AI 추론 칩과 데이터센터 인터커넥트 분야가 Q1 2026 반도체 스타트업 투자의 핵심 테마로, AI 인프라 수요가 스타트업 생태계 전반의 자금 흐름을 주도하고 있다.
- Ricursive Intelligence(3억 달러)·ChipAgents(5,000만 달러) 등 agentic EDA 플랫폼에 대한 대규모 투자가 집중되며, AI 기반 칩 설계 자동화가 독립 시장으로 부상하고 있다.
- 포토닉스 분야(Ayar Labs, Olix, Neurophos 등)가 AI 데이터센터 광 인터커넥트 수요를 기반으로 총 수억 달러 규모의 투자를 유치하며 차세대 고성장 섹터로 자리잡았다.
- Rapidus(17억 달러)의 대규모 전략적 투자 유치는 미국·한국 중심의 AI 칩 공급망에 일본 파운드리가 진입하는 지정학적 반도체 경쟁의 심화를 나타낸다.
Rowhammer 취약점이 수십 년간 DRAM 보안 위협으로 지속되고 있으며, 최근에는 유사 메커니즘인 Rowpress까지 등장해 상황이 악화되고 있다. Rowhammer는 셀 간 전자 간섭으로 발생하며, 공정 스케일링으로 셀 간격이 좁아질수록 심화된다. 이를 완화하기 위해 TRR, RFM, ARFM에 이어 행 단위로 동작하는 DRFM(Directed Refresh Management)이 DDR5, LPDDR5, HBM4에 표준화되었으나, DRFM 명령 자체가 새로운 전이적 Rowhammer 공격 수단으로 악용되는 역설이 발생했다. GDDR은 여전히 이러한 표준 명령을 지원하지 않는다. 근본적 해결책은 수직 트랜지스터를 사용하는 4F2 아키텍처로의 전환이지만, 이는 수년 후에나 양산 가능하며 기존 메모리 세대는 장기간 유지될 전망이다.
핵심 인사이트
- DRFM이 DDR5/LPDDR5/HBM4에 표준화됐지만, DRFM 명령 자체가 새로운 공격 벡터로 전용되는 Whac-A-Mole 구조적 문제가 반복되고 있다.
- 근본 해결책인 4F2 수직 트랜지스터 DRAM 셀은 인접 셀 간 기판 공유를 없애 Rowhammer를 원천 차단하지만, 양산까지 수년이 소요된다.
- DRAM 내부 레이아웃 비공개 정책이 메모리 컨트롤러 측 방어를 약화시키며, Microsoft 연구팀은 위상 공개가 더 효율적인 방어를 가능케 한다고 주장한다.
- 기존 DRAM 세대의 긴 수명을 고려할 때, 신규 셀 아키텍처 전환 이후에도 취약 메모리가 인프라에 수년간 잔류해 보안 리스크가 지속될 전망이다.
AI 시대를 맞아 코프로세서 아키텍처가 빠르게 진화하고 있지만, 단일 프로세서로 모든 워크로드를 효율적으로 처리하는 것은 여전히 불가능하다. CPU는 50년간 범용 연산의 핵심이었으나, AI의 등장으로 NPU, TPU, GPU 등 전용 가속기와의 협업 구조가 필수가 됐다. 핵심 병목은 연산 성능이 아니라 데이터 이동 효율성으로, 최고 TOPS가 아닌 최저 데이터 이동 에너지를 가진 코프로세서가 경쟁 우위를 갖는다. Arm은 agentic AI 워크로드가 CPU 바운드임을 강조하며 CPU 성능-전력비를 끌어올리는 전략을 택했고, RISC-V 기반 가속기는 제어·데이터 전송 오버헤드를 제거하는 통합 방향을 모색 중이다. UCIe, CXL 같은 표준이 물리·프로토콜 호환성을 제공하지만, 시스템 수준의 동작 통합은 여전히 미해결 과제다.
핵심 인사이트
- agentic AI 워크로드 확산으로 데이터센터에서 GPU 가속기의 토큰 처리 속도와 CPU의 데이터 전송 처리 속도 간 병목이 심화되고 있다.
- 데이터 이동 에너지가 연산 에너지보다 훨씬 크다는 원칙 하에, 코프로세서 선택 기준이 peak TOPS에서 데이터 이동 최소화 효율로 이동하고 있다.
- RISC-V ISA 기반 가속기는 제어 프로세서와 가속기를 통합해 오버헤드를 제거하는 방향으로 발전하며, 특화 아키텍처의 새로운 접근법을 제시한다.
- UCIe, CXL 표준이 물리·프로토콜 수준의 호환성을 해결했지만, 시스템 수준 동작 통합이 남은 핵심 과제로 칩렛 생태계 성숙을 좌우할 전망이다.
Edge AI 시대에 성능 지표가 peak TOPS에서 지연 시간 보장, 전력 효율, 메모리 대역폭, 모델 배포 속도로 근본적으로 전환되고 있다. Arm, Cadence, Rambus, Synopsys 등 업계 전문가들은 공통적으로 "평균이 아닌 매번" 지연 시간 목표를 충족해야 한다고 강조한다. Edge 추론에서 메모리 대역폭 요구치는 300~500 GB/s 이상이며, 워크로드가 연산이 아닌 대역폭에 의해 제한되는 경우가 많다. Cadence는 Edge 생성 AI에서 초당 40~50 토큰을 실시간 성능 기준으로 제시했다. 자동차·산업 분야에서는 1밀리초 미만 지연이 요구되며, 모델 교체 주기 단축에 따른 새 모델의 기존 하드웨어 신속 탑재(landing) 능력도 핵심 경쟁 요소로 부상했다. 이는 하드웨어·소프트웨어·모델 양자화를 아우르는 전체 스택 최적화 문제다.
핵심 인사이트
- Edge 추론의 메모리 대역폭 요구치가 300~500 GB/s 이상으로, 연산 성능보다 메모리 대역폭이 실질적 성능 병목이 되는 경우가 점증하고 있다.
- 자동차·산업 Edge AI에서 1밀리초 미만 지연이 요구되며, "평균 지연"이 아닌 "확정적 지연 보장"이 하드웨어 선택의 핵심 기준이 된다.
- 생성 AI 모델의 빠른 교체 주기로 인해 새 모델을 기존 하드웨어에 신속히 탑재하는 능력이 TOPS만큼이나 중요한 경쟁력 요소로 부상했다.
- 효과적인 TOPS/W 및 TOPS/mm² 지표가 순수 peak TOPS를 대체하며, 소형 폼팩터와 전력 제약 환경에서의 실질 성능을 측정하는 기준으로 확립되고 있다.
첨단 패키징에서 불량은 인터페이스에서 가시화되지만, 실제 원인은 소재, 기하학적 변동, 열-기계적 스트레스, 테스트 환경 전반에 걸쳐 분산되어 있다. 마이크로범프 크랙, TSV 저항 증가, 하이브리드 본드 불안정성은 초기에는 규격 내에 있다가 시간이 지남에 따라 서서히 저하되어 이진 테스트로는 감지되지 않는다. 특히 테스트 소켓(임시 상호연결)이 측정 체인에서 가장 큰 변수로 작용해, 소켓의 동적 변화 폭이 기판이나 실리콘의 변화보다 커지면 패키지 고유의 불량을 식별할 수 없게 된다. Bruker, proteanTecs, Nordson, Onto Innovation 등은 파라메트릭 드리프트, 박막 불균일성, 범프 잔류물 등을 탐지하기 위한 심층 텔레메트리와 다파장 계측 기술을 제시하고 있다. 결론적으로, 인터페이스 불량의 근원을 정확히 파악하려면 실시간 온-다이 파라메트릭 가시성이 필수적이다.
핵심 인사이트
- 첨단 패키징 불량의 상당수는 time-zero에서 스펙 내에 있다가 열-기계적 사이클링 중 드리프트하는 저항성 인터페이스 효과로, 기존 이진 테스트로는 탐지 불가하다.
- 테스트 소켓(임시 상호연결)이 측정 체인에서 가장 큰 변수로, 소켓 불량이 실리콘 불량으로 오진되어 불필요한 반복 테스트가 발생하는 구조적 문제가 존재한다.
- 박막 불균일성, 범프 산화·잔류물 등 초미세 결함이 첨단 노드에서 더 이상 무시할 수 없는 인터페이스 신뢰성 위협으로 부상하고 있다.
- proteanTecs의 심층 텔레메트리처럼 온-다이 파라메트릭 가시성을 구조적·기능적 테스트에 통합하는 솔루션이 첨단 패키징 시장의 핵심 투자 영역으로 성장하고 있다.
Stanford 대학교 HAI(인간중심 AI 연구소)의 2026 AI Index Report에 따르면, AI는 PC나 인터넷보다 빠른 3년 만에 전 인구의 53%에 도달하며 대중화를 완성했다. 그러나 안전 기준이 능력 발전을 따라가지 못하면서 2025년 실제 AI 피해 사고가 362건으로 전년 대비 55% 급증했다. AI 전문가와 일반 대중 모두 선거와 인간관계 훼손을 AI 최대 위험으로 꼽았다. 미국 AI 투자액은 $2,859억으로 중국의 23배이나, AI 연구인력의 미국 유입은 2017년 대비 89% 급감했다. Arena 벤치마크에서 Claude Opus 4.6과 ByteDance Dola-Seed Preview의 점수 차이가 2.7%포인트에 불과해 미중 AI 성능 격차가 사실상 소멸했다.
핵심 인사이트
- AI 피해 사고가 1년 만에 55% 급증(233건→362건)했음에도 안전 규제 체계가 따라가지 못해 기업 AI 리스크 관리 부담이 증가할 전망
- Arena 벤치마크 미중 격차 2.7%포인트 수준으로 수렴은 미국 독점 AI 기술 우위 전략의 실효성에 근본적 의문을 제기
- 미국 AI 연구인력 유입 89% 급감은 단기적 수치 우위에도 불구하고 장기 기술 경쟁력 기반이 붕괴 중임을 시사
- 전문가들이 2030년까지 생성형 AI가 미국 근무시간의 80%에 기여할 것으로 전망해 기업 조직 구조·인력 계획 전면 재편이 불가피
Linus Torvalds가 Linux 커널 7.0을 공식 출시했다. 버전 넘버는 단순히 6.x 시리즈가 x.19에 도달해 혼란을 피하기 위한 진화적 릴리즈지만, 두 가지 중요한 기술적 이정표를 담고 있다. 첫째, Rust 언어에 대한 실험적 지원이 공식 지원으로 전환되어 커널 개발에 메모리 안전 언어가 본격 합류했다. 둘째, Torvalds가 릴리즈 노트에서 "AI 도구 사용이 엣지 케이스를 계속 발견할 것"이라고 언급해 AI 기반 버그 발견이 커널 유지보수의 새로운 일상이 되고 있음을 시사했다. 커널 2IC Greg Kroah-Hartman도 AI 툴에 더 나은 보안 버그 리포트 방법을 안내하는 문서를 업데이트할 정도로 AI발 보고 건수가 급증 중이다.
핵심 인사이트
- Rust의 Linux 커널 공식 지원 확정은 메모리 안전성이 시스템 소프트웨어의 새로운 표준으로 자리잡는 분수령으로, C 기반 인프라 소프트웨어 생태계 전반에 파급 효과 예상
- AI 도구가 커널 코드베이스의 엣지 케이스를 대량 발굴하는 현상은 오픈소스 프로젝트의 보안·품질 향상에 기여하는 동시에 유지보수 팀의 검토 부담을 급증시킴
- AI 발 보안 버그 보고 급증을 공식 문서화한 Kroah-Hartman의 대응은 AI가 사이버보안 취약점 발견의 주요 행위자로 부상했음을 오픈소스 커뮤니티가 공식 인정한 것
- ARM, RISC-V, Loongson 지원 강화는 x86 중심에서 다중 아키텍처 분산으로의 하드웨어 생태계 다변화 추세를 반영하며 반도체 공급망 탈중앙화 흐름과 맞닿아 있음
Anthropic이 Claude Code의 프롬프트 캐시 TTL(유효시간)을 2월 1일 1시간으로 연장했다가 3월 7일 다시 5분으로 단축하면서 사용자 할당량 고갈 불만이 폭증했다. 5분 TTL은 장시간 고컨텍스트 세션 중심인 Claude Code 특성상 불리하며, 특히 1M 토큰 컨텍스트 창 사용 시 캐시 미스가 발생하면 비용이 폭등한다. Anthropic 측은 서브에이전트를 많이 쓰는 원샷 요청에는 5분 TTL이 오히려 저렴하다고 해명했으나, 월 $200 구독자가 처음으로 할당량 한도에 부딪히는 사례가 속출하고 있다. Claude Code 개발자 Boris Cherny는 기본 컨텍스트 창을 40만 토큰으로 줄이고 100만 토큰은 선택 옵션으로 전환하는 방안을 검토 중이라고 밝혔다.
핵심 인사이트
- 캐시 TTL 단축이 장기 세션 사용자에게는 사실상 가격 인상으로 작용해 Anthropic의 가격 정책 투명성에 대한 신뢰가 훼손될 위험
- 1M 토큰 컨텍스트 창의 캐시 미스 비용 급증 문제는 초대형 컨텍스트 제공이 오히려 비용 불확실성을 키우는 역설적 결과를 낳아 경쟁사 대비 차별화 전략 재검토 필요성 제기
- 할당량 소진 문제가 캐시 정책만의 문제가 아닐 수 있다는 의혹 — "쿼터가 예전보다 적은 처리 시간을 구매"한다는 분석은 실질 서비스 품질 저하 가능성을 시사
- 컨텍스트 창 기본값 40만 토큰으로 하향 검토는 인프라 비용 압박을 반영하며 AI 코딩 어시스턴트 시장의 지속가능한 가격 모델 정립이 업계 공통 과제임을 드러냄
엔터프라이즈 AI와 프론티어 AI 모델 간의 격차가 확대되면서 오픈 웨이트 모델이 기업 시장의 실용적 대안으로 부상하고 있다. Google Gemma 4(31B), Alibaba Qwen 3.5, Microsoft MAI 등 최신 오픈 모델들은 단순 연구용 수준을 넘어 기업 제품 수준에 도달했다는 평가를 받는다. Gemma 4 31B는 $8,000~$10,000 수준의 RTX Pro 6000 Blackwell 단일 GPU에서 완전 구동이 가능하다. IDC 수석 연구이사 Andrew Buss는 대형 범용 모델과 소형 특화 모델로의 양극화가 심화되고 있으며, 중간 시장을 겨냥한 경량 모델의 역할이 확대될 것이라고 분석했다.
핵심 인사이트
- Google Gemma 4(31B), Qwen 3.5 등 오픈 모델이 $8,000~$10,000 단일 GPU에서 구동 가능해져 기업 AI 도입 비용 장벽이 크게 낮아짐
- OpenAI·Anthropic 프론티어 모델의 저작권 소송 이력이 기업의 독점 데이터 노출 우려를 키우며 온프레미스 오픈 웨이트 모델 수요를 촉진
- DeepSeek R1 방식의 강화학습 기반 추론(test-time scaling)이 소형 모델의 품질 격차를 줄이는 핵심 기술로 자리 잡음
- Google·Nvidia 모델이 함수 호출(function calling) 최적화로 독립 실행보다 에이전트 프레임워크 통합 방향으로 진화하며 플랫폼 생태계 락인 강화
Cloudflare가 AI 에이전트를 최우선 고객으로 설정하고 Wrangler CLI를 전면 재설계하고 있다. "에이전트가 점점 우리 API의 주요 고객이 되고 있다"는 공식 선언과 함께, 기존에 CLI 지원이 없던 다수의 Cloudflare 제품군을 에이전트가 일관되게 제어할 수 있도록 새로운 TypeScript 스키마 기반 아키텍처로 재구축했다. Workers 바인딩, Terraform 프로바이더, OpenAPI 스키마, 에이전트 스킬 등 전체 API 표면을 단일 CLI로 커버하는 것이 목표다. 에이전트가 비표준 명령어로 실패하지 않도록 스키마 레이어에서 CLI 명령어를 강제 표준화(always get, always --force)하는 것도 핵심 설계 원칙이다. 기술 미리보기는 `npx cf` 또는 `npm install -g cf`로 즉시 사용 가능하다.
핵심 인사이트
- Cloudflare의 "에이전트가 주요 API 고객" 선언은 인터넷 인프라 기업의 설계 철학이 인간 개발자 중심에서 AI 에이전트 중심으로 전환하는 업계 패러다임 변화의 신호탄
- CLI 명령어 표준화(get/--force 강제)는 AI 에이전트의 비결정적 오류를 차단하는 실용적 접근이나, 인간 개발자 유연성 희생이라는 트레이드오프를 내포
- TypeScript 스키마 기반 단일 API 표면 구축은 Cloudflare 플랫폼 위 에이전트 생태계의 진입 장벽을 낮춰 Workers 중심 AI 애플리케이션 개발 허브로서의 경쟁 우위 강화
- MCP 서버로 전체 API를 노출하고 CLI까지 에이전트 최적화하는 이중 전략은 Cloudflare를 에이전트 컴퓨팅 시대의 필수 인프라 레이어로 포지셔닝하려는 장기 구도
Oracle이 OpenAI($3,000억/5년), xAI, Meta 등과의 AI 인프라 계약을 수주하며 대규모 데이터센터 확장에 나선 가운데, 기존 엔터프라이즈 고객들은 지원 품질 저하와 가격 인상이라는 이중 부담에 직면하고 있다. Oracle은 2026 회계연도 구조조정 비용을 $21억으로 상향하며 수천 명 규모 감원을 단행했고, $180억 차입에 이어 추가 자금조달 계획을 발표해 Moody's로부터 부정적 자유현금흐름 경고를 받았다. 컨설팅 어드바이저들에 따르면 OCI 갱신 시 기존 기업 할인 폐지로 9~10% 가격 인상이 현실화되고 있으며, Java 감사도 공격적으로 재개됐다. 소프트웨어 지원의 고마진 구조가 AI 데이터센터 저마진 사업을 보전하는 내부 보조 구조가 형성되고 있다는 분석이다.
핵심 인사이트
- Oracle이 AI 인프라 공급자로 변신하면서 전통 소프트웨어 고객 관계를 수익 보전 수단으로 전락시키는 구조적 갈등이 심화되어 엔터프라이즈 Oracle 탈출 수요 증가 예상
- OCI 계약 갱신 시 9~10% 가격 인상과 Java 감사 강화는 Oracle 생태계에 깊이 묶인 기업들의 협상력을 약화시키며 멀티클라우드·오픈소스 전환 압박을 높임
- OpenAI와의 $3,000억 규모 계약은 수익성은 높지만 막대한 선투자와 부채 부담을 수반해, Oracle의 재무 리스크가 기존 고객의 지원 품질과 연동되는 역설적 상황 연출
- Moody's 부정적 자유현금흐름 경고는 Oracle의 AI 데이터센터 도박이 투자등급 리스크로 확대될 수 있음을 시사하며 기업 IT 구매팀의 벤더 리스크 평가에 경보 발령
Amazon CEO Andy Jassy는 2026년 주주 서한에서 AWS 자체 반도체 사업의 규모를 공개했다. 독립 기업이라 가정했을 때 연간 환산 매출이 약 $500억에 달하며, 이미 두 대형 고객사가 2026년 Graviton 인스턴스 전 용량을 독점 구매하겠다는 의사를 타진했다. Trainium3 서비스는 거의 완전 예약된 상태고, Trainium4는 18개월 후 출시 예정임에도 상당 물량이 이미 예약됐다. Trainium 도입으로 추론 분야에서 타사 칩 대비 수백 베이시스포인트의 운영 마진 우위와 연간 수십억 달러의 설비투자 절감이 가능하다고 밝혔다. AWS AI 매출은 3년 만에 연율 기준 $150억에 달했다.
핵심 인사이트
- AWS 자체 칩(Graviton·Trainium) 사업의 연율 환산 매출 $500억은 Nvidia 2025 회계연도 데이터센터 매출에 필적하는 수준으로 반도체 경쟁 구도에 파장
- Trainium을 통한 연간 '수십억 달러' Capex 절감과 '수백 베이시스포인트' 마진 우위는 AWS가 Nvidia 의존도를 줄이는 구체적 경제적 근거를 제시
- Trainium3 완전 예약·Trainium4 사전 예약 완료는 AWS AI 컴퓨팅 수요가 공급 증설 속도를 크게 초과하고 있음을 나타내며 향후 GPU 외부 판매 가능성을 높임
- 글로벌 IT 지출의 85%가 여전히 온프레미스에 있다는 Jassy의 언급은 AWS 클라우드 마이그레이션 장기 성장 여력을 강조하며 AI 인프라 투자 지속 의지를 시사
Google이 Intel과의 SmartNIC(인프라 처리 장치, IPU) 협력을 확장한다고 발표했다. 2022년 C3 인스턴스와 함께 출시된 Mount Evans IPU(200Gbps)를 기반으로 차세대 IPU를 공동 개발하기로 했다. AWS는 Annapurna Labs의 자체 ASIC Nitro NIC을, Microsoft는 FPGA 기반 커스텀 로직을 사용하는 반면, Google은 Intel ASIC 기반 외부 협력 경로를 선택했다. Intel CFO는 2025년 커스텀 ASIC 사업이 50% 이상 성장하고 Q4 연율 매출이 $10억을 초과했다고 공개했다. Xeon 프로세서도 AI GPU 워크로드 오케스트레이션과 범용 인스턴스에 계속 채택된다. Google의 Axion(자체 Arm CPU)이 확대되고 있지만 Xeon은 x86 호환성과 가격 경쟁력 유지를 위해 AMD Epyc과 함께 병존한다.
핵심 인사이트
- Google의 Intel IPU 파트너십 확장은 하이퍼스케일러들이 네트워크 오프로드 칩에서도 자체 개발(AWS·Microsoft) vs 외부 협력(Google) 구도로 분화되고 있음을 보여주며 Intel의 ASIC 커스터마이징 역량이 생존 전략의 핵심으로 부상
- Intel 커스텀 ASIC 사업의 연율 $10억 돌파와 50% 성장은 AI 가속기 시장의 Nvidia 집중에서 벗어나 네트워크·스토리지 오프로드 칩 수요가 독립 성장 동력이 될 수 있음을 입증
- AI 컴퓨팅 클러스터의 고속 네트워킹 수요 증가로 차세대 Google IPU는 200Gbps 이상의 대역폭이 예상되며, AI 인프라 내 SmartNIC이 GPU 못지않은 전략 부품으로 격상
- Xeon이 Google GPU 인스턴스(Nvidia DGX)의 오케스트레이션 CPU로 사실상 표준 유지되는 구조는 Intel의 데이터센터 CPU 지위가 ARM·RISC-V 위협에도 단기 교체 불가임을 확인
Anthropic이 클라우드 호스팅 기반의 AI 에이전트 자동화 서비스 'Managed Agents'를 출시했다. 기업이 에이전트의 태스크·툴·가드레일만 정의하면, 샌드박스 코드 실행·체크포인팅·자격증명 관리·범위 제한 권한·엔드투엔드 추적 등 인프라 복잡성을 Anthropic 측이 처리한다. 동시에 Claude Cowork의 일반 공개(GA)도 발표했으며, Notion은 Managed Agents를 통해 코드 배포·웹사이트 제작·슬랙 채널 생성·경쟁사 조사·이메일 발송 등 사무 자동화에 활용 중이다. 요금은 표준 플랫폼 사용료에 더해 활성 런타임 시간당 $0.08이 추가된다.
핵심 인사이트
- Anthropic이 API 모델 판매에서 관리형 에이전트 인프라 서비스로 사업 영역을 확장하며 AWS/Azure의 AI 인프라 시장과 직접 경쟁 구도 형성
- Claude Managed Agents는 장시간 무감독 자율 작업(코딩·리서치·커뮤니케이션)을 표적으로 해 기업 지식 노동 자동화 시장을 공략
- 런타임 시간당 $0.08의 종량 과금 모델은 소규모 파일럿부터 대규모 배포까지 유연한 진입을 가능하게 해 엔터프라이즈 고객 확보 전략으로 유효
- 에이전트 오케스트레이션 복잡도를 클라우드 플랫폼이 흡수하는 추세가 강화되며 자체 에이전트 인프라 구축 수요는 감소 전망
Microsoft가 5월 1일부터 Windows 365 클라우드 PC 요금을 20% 인하한다고 채널 파트너에게 통보했다. 중소기업 대상 비용 효율 개선이 명분이나, 가격 인하의 대가로 "온디맨드 시작 경험"이라는 새로운 절전 메커니즘이 적용된다. 로그아웃/연결 해제 후 1시간 동안은 전원이 유지되지만 그 이후는 최대 절전 상태로 전환되어 재접속 시 다소 느려질 수 있다. 미국의 관세 분쟁으로 물리 PC 가격이 오르고, Gartner가 클라우드 PC의 총소유비용(TCO)이 노트북보다 낮다는 분석을 내놓은 타이밍에 맞춰 시장 점유율 공략에 나선 행보다. Gartner는 2027년까지 전체 근무자의 20%가 클라우드 PC를 주 업무 환경으로 사용할 것으로 전망했다.
핵심 인사이트
- 20% 가격 인하와 절전 모드 도입의 교환은 Microsoft가 유휴 클라우드 PC 인프라 비용을 사용자 경험 트레이드오프로 전가하는 구조로, 온디맨드 클라우드 PC의 실질 사용성 검증이 향후 채택률의 관건
- 물리 PC 가격 상승(메모리 부족·관세)과 클라우드 PC 가격 인하의 동시 진행은 VDI 시장 확대의 외부 촉매가 되어 Microsoft의 클라우드 PC 전략이 예상보다 빠른 모멘텀을 확보할 가능성
- Gartner 2027년 클라우드 PC 20% 전망(2019년 10%에서 2배)은 의료·금융 등 규제 산업 외 일반 기업으로의 VDI 저변 확대를 시사하며 Microsoft·Citrix·VMware 간 경쟁 지형 재편 예고
- Azure Virtual Desktop(AVD)과 Windows 365의 이원 포트폴리오 전략에서 Windows 365 가격 경쟁력 강화는 SMB 시장에서 경쟁사 VDI 솔루션을 압박하는 동시에 Azure 인프라 활용률 극대화 목적
스탠퍼드대 HAI센터가 발표한 2026년 AI Index 보고서(400페이지 이상)에 따르면, 2025년 전 세계 AI 투자액은 5,810억 달러로 전년 대비 두 배 이상 증가했으며 미국이 3,440억 달러로 선도한다. 미국 기업들이 AI 모델 출시를 주도하나 중국이 빠르게 격차를 좁히고 있다. 산업용 로봇 설치에서는 중국이 29만5,000대로 압도적 선두다. 전 세계 AI 컴퓨팅 용량은 2022년 이후 연 3.3배 성장했으며 Nvidia GPU가 60% 이상을 점유한다. 최신 LLM 훈련 시 탄소 배출량은 Grok 4 기준 7만2,000톤으로 GPT-4 대비 14배 증가했다. AI에 대한 공중 신뢰는 소폭 개선됐으나 52%는 여전히 AI 탑재 제품에 불안감을 표했다.
핵심 인사이트
- AI 모델 성능 성숙화: Humanity's Last Exam에서 최고 모델들이 50%를 상회하며 벤치마크 정복 속도가 가파르게 상승 중
- 상용화 가속: OpenAI·Anthropic 모두 올해 IPO를 앞두고 있어 AI 산업의 공개시장 진입 원년이 될 전망
- 산업 이중성: AI 노출도가 높은 근로자보다 낮은 근로자의 실업률이 더 높아져 AI 영향의 복잡성 확인
- 경쟁·투자 관점: 중국의 로봇·AI 모델 추격과 미국의 데이터센터 규제 확산이 지정학적 AI 패권 경쟁의 핵심 변수로 부상
텍사스 A&M대 Nitesh Saxena 교수 팀이 개발한 HIPPO(Hidden-Password Online Password)는 비밀번호를 서버나 로컬에 일절 저장하지 않는 혁신적 브라우저 확장 프로그램 방식의 패스워드 매니저다. 사용자는 단 하나의 마스터 비밀번호만 기억하면 되고, HIPPO는 사이트 방문 시 oblivious pseudorandom function 암호화 기법으로 마스터 비밀번호를 사이트별 고유 비밀번호로 즉석에서 변환한다. IEEE Internet Computing(2026년 2월 27일)에 게재된 사용자 연구(25명)에서 HIPPO의 보안 체감 점수는 4.04/5로 전통 방식의 3.09/5보다 높았으며, 추가 입력 단계가 필요함에도 사용 편의성도 더 우수하게 평가됐다.
핵심 인사이트
- 기술 성숙도: oblivious pseudorandom function 기반 무저장 인증 기술이 실제 브라우저 확장으로 구현되어 실용화 단계에 진입
- 상용화 시기: 소규모 단기 연구 단계로 대규모 장기 추적 연구와 마스터 비밀번호 변경 시나리오 검증이 상용화 전 과제
- 산업 적용 가능성: 엔터프라이즈 환경에서 중앙 서버 해킹 취약점 없이 다수 계정을 관리하는 Zero-Knowledge 인증 솔루션으로 활용 가능
- 경쟁·투자 관점: LastPass·1Password 등 기존 패스워드 매니저의 서버 해킹 사고가 반복되는 시장에서 무저장 방식은 차별화된 보안 가치 제안
슬로베니아 류블랴나대 Igor Muševič 교수 팀이 STED(Stimulated Emission Depletion) 현미경 원리를 응용하여 액정(liquid crystal) 기반 광자 스위치를 개발했다. 이 소자는 폴리머 도파관 4개 사이에 형광 염료가 주입된 구형 액정 비드를 배치해 whispering gallery mode 공명을 활용, 빛으로 빛을 제어한다. 기존 소프트 물질 광자 기술 대비 에너지 소비를 100분의 1 이하로 절감했으며, 액정 삽입이 1초 미만으로 제조 공정이 획기적으로 단순하다. 실리콘 포토닉스보다 저온 제조가 가능하고 공동 구조 설계 자유도가 높아, 광 컴퓨팅과 광 신경망 분야 미래 응용 가능성이 열렸다.
핵심 인사이트
- 기술 성숙도: 소프트 물질 기반 광-광 제어를 실험실 수준에서 구현했으나 광 논리 회로 완성까지는 추가 연구가 필요한 초기 단계
- 상용화 시기: 현재 신경망 구현과의 경쟁은 불가능하다고 연구진 스스로 인정, 실용화까지 수년 이상의 장기 연구 필요
- 산업 적용 가능성: 광 컴퓨팅, 광 신경망, 유연 포토닉 논리 회로에 적용 가능하며 실리콘 포토닉스보다 환경 친화적 제조 프로세스 구현
- 경쟁·투자 관점: 에너지 효율 100배 개선은 데이터센터 전력 소비 문제 해결 방향과 맞닿아 있어 소프트 포토닉스 투자 관심 확대 가능
호주 애들레이드대 연구팀이 패키징을 분리하지 않고 작동 중인 칩 내부 트랜지스터의 전기적 활동을 원격으로 감지하는 테라헤르츠파 기반 비침습 검사 시스템을 개발했다. 벡터 네트워크 분석기(VNA)가 생성한 마이크로파 신호를 테라헤르츠파로 변환해 1 mm² 영역에 집속하면 트랜지스터 스위칭에 따른 반사 신호의 진폭·위상 변화를 검출한다. X선과 달리 비이온화 방사선이며 대부분의 플라스틱·세라믹 패키징을 투과한다. IEEE Journal of Microwaves(2026년 3월 17일 게재)에 소개된 이 기술은 현재 BJT·FET 등 소수 트랜지스터로 제한되지만, 작동 중 칩 내부를 패키징 유지 상태로 실시간 진단하는 최초의 기술로 평가받는다.
핵심 인사이트
- 기술 성숙도: BJT·FET 수준의 이산 소자와 소규모 IC까지 검증 완료, 고밀도 현대 칩 적용을 위한 감도 향상 연구 진행 중
- 상용화 시기: 현재 감도 한계로 대규모 IC 적용이 불가능하며 시중 검사 장비화까지는 추가 소형화·집적화 연구 필요
- 산업 적용 가능성: 전력 반도체, 안전 필수 전자기기 등 오프라인 불가 소자의 인사이투(in-situ) 불량 진단 및 패키지 불량 분석 자동화에 활용 가능
- 경쟁·투자 관점: 기존 X선·전자 프로빙 대비 비파괴·비이온화·실시간 특성으로 반도체 품질 검사 시장의 새로운 세그먼트 창출 가능
MITRE·MIT·콜로라도대·샌디아국립연구소 공동 연구팀이 양자 컴퓨터용 레이저 빔 제어 프로젝트(MITRE Quantum Moonshot)의 일환으로 개발한 1 mm² 크기 광자 칩이 초당 6,860만 화소의 스캔 영상을 인간 난자 두 개 크기(약 125 μm) 영역에 투사하는 데 성공했다. 알루미늄 나이트라이드(AlN) 압전 소재 기반 MEMS 캔틸레버 어레이가 빛을 2D 공간으로 스캔하며, 이는 기존 MEMS 마이크로미러 어레이 대비 50배 이상의 성능이다. 모나리자 정지 영상과 애니메이션 동영상 투사에도 성공했으며, 양자 컴퓨팅 외에도 3D 프린팅·AR·바이오메디컬 이미징·랩온어칩 분야로의 응용이 기대된다.
핵심 인사이트
- 기술 성숙도: 회절 한계에 근접한 화소 밀도를 달성하여 MEMS 광자 기술의 성능 한계점 돌파, 동영상 투사 시연까지 완료
- 상용화 시기: 양자 컴퓨팅용 프로토타입 단계이나 3D 프린팅·AR 등 다분야 응용 검토 중으로 수년 내 산업화 가능성 존재
- 산업 적용 가능성: 3D 프린팅 속도 대폭 향상(시간→분), AR용 초소형 프로젝터, 세포 생물학·신약 개발용 랩온어칩 스캐닝 등 폭넓은 응용
- 경쟁·투자 관점: 단일 칩에 수백만 큐비트 제어를 가능케 하는 핵심 기술로 QuEra·IBM 등 양자 컴퓨팅 경쟁에서 레이저 제어 병목 해소에 기여
대형 언어 모델(LLM)이 소프트웨어 엔지니어링을 변혁한 것처럼, 물리 시뮬레이션 데이터로 훈련된 '대형 물리 모델(Large Physics Model, LPM)'이 자동차·항공우주·반도체 설계 분야의 수치 시뮬레이션을 대체하기 시작했다. GM은 LPM을 도입해 공기역학 항력 계수 산출 시간을 2주에서 수분으로 단축했다. PhysicsX CEO에 따르면 물리 시뮬레이션 대비 최대 100만 배 빠른 추론이 가능하다. Transformer·기하학적 딥러닝·신경 연산자 등 다양한 아키텍처가 활용되며, LPM에서도 LLM과 동일한 스케일링 법칙이 확인됐다. Nvidia GTC 2026에서 PhysicsX가 Nvidia physicsNeMo 플랫폼 협력을 발표하며 산업 생태계가 빠르게 형성되고 있다.
핵심 인사이트
- 기술 성숙도: GM 등 주요 제조사가 실제 설계 프로세스에 도입 완료, LPM 스케일링 법칙 확인으로 모델 고도화의 기술적 근거 마련
- 상용화 시기: GM·항공우주 업계 이미 도입 단계이며 PhysicsX·Neural Concept 등 전문 스타트업이 다양한 산업으로 상용화 확산 중
- 산업 적용 가능성: 자동차 공기역학·충돌 시험, 항공우주 설계, 반도체 열 분석 등 기존에 수치 시뮬레이션이 필요했던 모든 설계 공정에 적용 가능
- 경쟁·투자 관점: Nvidia의 physicsNeMo 오픈소스 플랫폼 공개는 LPM 생태계 주도권 경쟁의 신호탄으로, 전통 시뮬레이션 소프트웨어 기업(ANSYS 등)의 사업 모델 위협
AI 가속기의 폭증하는 메모리 수요가 HBM(High Bandwidth Memory) 공급 부족을 심화시키며 LLM 추론 속도의 핵심 병목이 되고 있다. Nvidia·AMD 등 AI 프로세서 제조사들이 구글·마이크로소프트·OpenAI·Anthropic 등 하이퍼스케일러의 데이터센터 확장을 뒷받침하기 위해 HBM 수요를 지속 확대 중이며, HBM 3사(Micron·Samsung·SK Hynix)의 증설 일정이 시장 공급의 핵심 변수다. 생성 AI 전력 소비는 2025년 15 TWh에서 2030년 347 TWh로 급증이 예상되며, 냉각수 소비도 2028년까지 2~4배 증가할 전망이다. Meta의 루이지애나 5 GW 규모 Hyperion 데이터센터는 이 같은 수요의 극단적 사례로 제시됐다.
핵심 인사이트
- 기술 성숙도: HBM 기술은 상용 단계이나 AI 수요 증가 속도가 공급 증설 속도를 초과하는 구조적 공급 부족 상태 지속
- 상용화 시기: HBM4 등 차세대 사양 개발이 진행 중이나 Micron·Samsung·SK Hynix의 증설 일정 지연이 공급 회복 시기 결정
- 산업 적용 가능성: 메모리 절약형 하드웨어 설계와 메모리 효율 AI 아키텍처(MoE, 양자화 등)가 HBM 부족에 대응하는 산업 전반의 적응 방향으로 부상
- 경쟁·투자 관점: HBM 공급 3사의 증설 일정이 AI 데이터센터 시장 전체의 성장 속도를 좌우하는 핵심 변수로, 관련 투자와 공급망 다변화 경쟁이 격화 중
Anthropic의 최신 AI 모델 Mythos(개발 코드명 "Capybara")가 공개됐으나, 강력한 사이버보안 취약점 탐지 능력으로 인해 일반 공개 없이 Project Glasswing 보안 이니셔티브를 통해 선별된 파트너에게만 제한 제공된다. Mythos는 Claude Opus 4.6보다 현저히 높은 성능을 보이며, 파라미터 수는 약 10조 개로 추정된다. 컨텍스트 윈도우는 1백만 토큰이며, SWE-bench, USAMO, Charxiv, HLE 등 벤치마크에서 GPT-5.4, Gemini 3.1 Pro를 앞서는 결과를 나타냈다. AWS, Apple, Broadcom, Cisco, Google, Microsoft, Nvidia 등 주요 기술 파트너들이 자사 코드베이스의 보안 취약점 발굴에 Mythos를 활용 중이다. 한편 Meta Platforms는 Scale AI CEO Alexandr Wang 영입 이후 첫 결과물로 비공개 멀티모달 추론 모델 Muse Spark를 발표했으며, Llama 4 Maverick 대비 1/10의 학습 컴퓨팅만으로 경쟁력 있는 성능을 달성했다.
핵심 인사이트
- Anthropic의 Mythos는 추론·코드 취약점 탐지 능력이 탁월해 일반 출시 대신 보안 파트너십 전용으로만 배포되는 이례적 전략을 채택했다.
- Mythos가 GPT-5.4·Gemini 3.1 Pro를 일부 벤치마크에서 능가하며, 프런티어 AI 경쟁에서 Anthropic의 기술 우위가 부각된다.
- Meta의 Muse Spark는 Llama 4 Maverick 대비 훈련 컴퓨팅 비용을 90% 절감해, 효율적 대규모 모델 훈련의 새 기준을 제시한다.
- 대형 AI 모델의 사이버보안 리스크가 현실화되면서, 주요 빅테크들이 자사 인프라 취약점 점검에 외부 AI를 도입하는 추세가 가속화될 전망이다.
기업 환경에서 GPU 가상화의 필요성이 CPU 가상화 시대만큼 커졌다는 분석이 제기됐다. AI·HPC 워크로드가 급증하면서 단일 GPU를 여러 테넌트가 공유하거나, 반대로 다수의 GPU를 단일 워크로드에 집약하는 유연한 GPU 자원 관리가 핵심 과제로 부상하고 있다. CPU 가상화가 데이터센터 효율성을 획기적으로 높인 것처럼, GPU 가상화 기술이 AI 인프라 비용 절감과 자원 활용률 향상의 핵심 레버가 될 것으로 전망된다. Nvidia의 MIG(Multi-Instance GPU), vGPU 기술을 비롯해 AMD, Intel 등도 GPU 파티셔닝·가상화 솔루션을 확대 중이며, 기업들의 AI 워크로드 다양화에 따라 GPU 가상화 생태계가 빠르게 성숙하고 있다.
핵심 인사이트
- GPU 가상화는 CPU 가상화가 서버 시장을 재편한 것처럼 AI 시대 데이터센터 효율화의 핵심 기술로 자리잡을 전망이다.
- Nvidia MIG·vGPU 등 멀티테넌트 GPU 기술이 기업 AI 인프라의 표준으로 빠르게 채택되고 있다.
- GPU 가상화를 통한 자원 활용률 향상은 고가의 GPU 투자 비용 절감과 직결되어 기업 AI 도입 가속화에 기여한다.
- AMD·Intel의 GPU 파티셔닝 솔루션 확대로 GPU 가상화 시장 경쟁이 심화되고 생태계 표준화가 촉진될 전망이다.
AI 클라우드 스타트업 CoreWeave의 성장 배경에는 데이터센터 설계 기술만큼이나 정교한 금융 엔지니어링이 자리하고 있다는 분석이 나왔다. CoreWeave는 Nvidia GPU를 담보로 한 레버리지 파이낸싱, 장기 선불 계약(prepaid contracts) 구조를 활용해 막대한 설비 투자를 지속할 수 있었다. 이 전략은 단기적으로 고속 성장을 가능하게 하지만, 고금리 환경과 GPU 가격 변동성, AI 수요의 불확실성이 맞물릴 경우 재무 리스크가 상당하다. IPO를 앞두고 투자자들은 CoreWeave의 수익성 경로와 부채 구조를 면밀히 검토하고 있으며, AI 클라우드 인프라 사업의 지속 가능성에 대한 시장의 시선이 집중되고 있다.
핵심 인사이트
- CoreWeave의 GPU 담보 레버리지 파이낸싱 모델은 AI 인프라 스타트업의 새로운 자금 조달 패러다임을 보여주지만 고위험 구조다.
- 장기 선불 계약 기반 수익 구조는 안정적 현금흐름을 제공하지만, AI 수요 둔화 시 심각한 유동성 리스크로 전환될 수 있다.
- IPO를 앞두고 CoreWeave의 재무 투명성과 부채 비율이 AI 클라우드 시장 투자 심리를 가늠하는 바로미터로 작용한다.
- 데이터센터 설계와 금융 구조화 역량의 결합이 AI 인프라 경쟁의 새로운 진입 장벽으로 부상하고 있다.
Meta Platforms가 자체 개발 AI 가속칩 MTIA(Meta Training and Inference Accelerator)의 로드맵을 공개하며 Nvidia 의존도 축소에 본격 나섰다. MTIA는 추천 시스템, 광고 랭킹 등 Meta 내부 AI 추론 워크로드에 최적화된 설계로, 범용 GPU 대비 전력 효율과 총소유비용(TCO) 면에서 우위를 노린다. Meta는 MTIA v1에 이어 차세대 MTIA v2 개발을 진행 중이며, 데이터센터 규모 배포를 통해 연간 수십억 달러의 GPU 비용 절감을 목표로 한다. 이는 Google(TPU), Amazon(Trainium/Inferentia), Microsoft(Maia)에 이어 하이퍼스케일러들이 자체 AI 칩으로 클라우드·AI 인프라를 내재화하는 산업 트렌드를 반영한다.
핵심 인사이트
- Meta의 MTIA 로드맵은 하이퍼스케일러의 AI 칩 내재화 전략이 추천·광고 시스템 등 내부 워크로드 최적화에서 시작됨을 보여준다.
- 범용 GPU 대비 TCO 절감이 자체 AI 가속칩 개발의 핵심 경제적 동인으로, 규모가 클수록 투자 회수 속도가 빨라진다.
- Google TPU, Amazon Trainium, Microsoft Maia 등 빅테크 자체 칩 생태계 확산으로 Nvidia의 데이터센터 GPU 시장 점유율에 장기적 압력이 가중된다.
- MTIA v2 등 차세대 칩 개발 가속화는 Meta가 AI 인프라 전반에서 하드웨어 자립도를 높여 공급망 리스크를 줄이려는 전략적 의도를 반영한다.