#infrastructure

- 2페이지

Δ-Mem, LLM 장기기억을 작은 상태로 압축하다

Δ-Mem 논문은 8×8 온라인 메모리 상태만으로 LLM의 장기 대화와 에이전트 기억 성능을 높이는 경량 접근을 제안한다.

2026-05-17원본

Zerostack, 코딩 에이전트를 유닉스 도구로 줄이다

Rust로 만든 Zerostack은 거대한 IDE형 코딩 에이전트와 달리 작은 CLI, MCP, worktree 중심의 조합 가능한 개발 자동화를 제안한다.

2026-05-17원본

OCaml이 우주에서 증명한 안전한 시스템 언어

Borealis의 순수 OCaml 우주 프로토콜 스택은 안전한 언어와 검증 가능한 프로토콜이 위성 소프트웨어 경쟁력이 될 수 있음을 보여준다.

2026-05-16원본

Pixel 10 제로클릭 체인이 말하는 드라이버 보안

Google Project Zero의 Pixel 10 제로클릭 체인 분석은 모바일 보안의 약한 고리가 여전히 커널 드라이버와 패치 체계임을 보여준다.

2026-05-16원본

AI 에이전트도 클라우드 비용을 알아야 한다

Infracost의 채용 공고는 AI 에이전트가 코드를 쓰는 시대에 비용 검토가 CI와 IDE 안으로 이동하고 있음을 보여준다.

2026-05-15원본

RTX 5090을 맥북 에어에 붙인 실험의 의미

RTX 5090 eGPU를 M4 맥북 에어에 연결한 실험은 게임보다 로컬 AI 추론과 플랫폼 경계의 비용을 더 선명하게 보여준다.

2026-05-15원본

미국 AI 우위의 핵심은 상용화 스택이다

AI 경쟁의 점수판은 논문 수가 아니라 클라우드, 데이터, 제품 배포력이다. 미국이 상용화 스택에서 앞서는 이유와 한국의 전략을 짚는다.

2026-05-14원본

xAI 가스터빈 논란, AI 인프라의 비용을 드러내다

xAI가 미시시피 데이터센터에서 46기 가스터빈을 운용한다는 보도와 소송은 AI 컴퓨트 경쟁이 지역 환경·규제 문제로 번지는 장면이다.

2026-05-14원본

26M Needle, 온디바이스 도구호출의 실험

Needle은 Gemini 도구호출을 2,600만 파라미터 소형 모델로 증류한 실험이다. 개인 기기 AI, 에이전트 라우팅, 비용 절감 전략이 어디로 움직이는지 살피고 한국 개발팀이 검증해야 할 데이터와 보안 과제를 분석한다.

2026-05-13원본

Swift로 LLM을 훈련한다는 것, Apple Silicon의 빈틈을 본다

Cocoa with Love가 Swift와 Metal로 행렬곱 성능을 Gflop/s에서 Tflop/s 수준으로 끌어올리는 실험을 공개했다. 로컬 AI 시대에는 모델보다 커널, 메모리, 프레임워크 선택이 개발자 경험을 좌우한다.

2026-05-12원본

Gemini File Search, 멀티모달 RAG를 기본 기능으로 끌어올렸다

Google이 Gemini API File Search에 이미지·텍스트 통합 검색, 메타데이터 필터, 페이지 단위 인용을 추가했다. 기업 RAG 제품은 이제 답변 생성보다 근거 검증과 권한 제어가 경쟁 포인트가 됐다.

2026-05-11원본

AMD GAIA Gmail 연동, 로컬 AI 에이전트가 메일함에 들어왔다

AMD GAIA 0.17.6은 Gmail 이메일 분류 에이전트와 OAuth PKCE 기반 연결을 추가했다. 로컬 AI의 생산성 활용과 권한 통제가 시험대에 올랐다.

2026-05-10원본

엔비디아의 AI 지분 투자 400억 달러, 칩 공급망이 자본망이 됐다

엔비디아가 2026년 들어 AI 기업 지분 투자에 400억 달러 이상을 약정했다. OpenAI, Corning, IREN 투자는 공급망과 자본의 경계를 흐린다.

2026-05-10원본

OpenAI WebRTC 논쟁, 음성 AI 인프라의 선택지가 갈린다

WebRTC가 음성 AI에 적합한지에 대한 기술 논쟁이 커지고 있다. 낮은 지연보다 프롬프트 보존과 버퍼링이 더 중요할 수 있다.

2026-05-10원본

Cloudflare 감원, AI 생산성의 가격표가 붙었다

Cloudflare가 AI 활용 증가와 조직 재설계를 이유로 1,100명 이상을 감원했다. 매출 성장과 인력 축소가 동시에 나타난 첫 대형 신호다.

2026-05-09원본

AI 데이터센터, 전력망을 제품 로드맵으로 끌어들였다

미국 최대 전력망 PJM이 데이터센터와 AI 수요로 구조 개편 압박을 받고 있다. 컴퓨트 경쟁은 이제 모델이 아니라 전력 접속 경쟁이다.

2026-05-09원본

AlphaEvolve, 알고리즘 에이전트가 산업으로 확장된다

Google DeepMind가 AlphaEvolve의 실제 적용 성과를 공개했다. 과학, 전력망, TPU, 데이터베이스, 물류까지 알고리즘 자동 최적화가 확장되고 있다.

2026-05-08원본

Anthropic, SpaceX 컴퓨트로 Claude 한도를 키운다

Anthropic이 SpaceX Colossus 1 용량을 쓰고 Claude Code와 Opus API 한도를 확대했다. AI 경쟁의 병목이 전력과 GPU로 이동했다.

2026-05-07원본

Braintrust 침해 사고, AI 평가 스택의 키 관리 경고

AI 평가 스타트업 Braintrust가 AWS 계정 무단 접근 이후 고객에게 API 키 교체를 요청했다. LLMOps의 비밀 관리 리스크를 분석한다.

2026-05-07원본

Cloudflare와 Stripe, 에이전트 배포를 끝까지 자동화하다

Cloudflare가 Stripe Projects와 함께 에이전트가 계정 생성, 결제, 도메인 구매, 배포까지 수행하는 흐름을 공개했다.

2026-05-07원본

이전2 / 6다음