Δ-Mem, LLM 장기기억을 작은 상태로 압축하다
Δ-Mem 논문은 8×8 온라인 메모리 상태만으로 LLM의 장기 대화와 에이전트 기억 성능을 높이는 경량 접근을 제안한다.
Δ-Mem 논문은 8×8 온라인 메모리 상태만으로 LLM의 장기 대화와 에이전트 기억 성능을 높이는 경량 접근을 제안한다.
Rust로 만든 Zerostack은 거대한 IDE형 코딩 에이전트와 달리 작은 CLI, MCP, worktree 중심의 조합 가능한 개발 자동화를 제안한다.
Borealis의 순수 OCaml 우주 프로토콜 스택은 안전한 언어와 검증 가능한 프로토콜이 위성 소프트웨어 경쟁력이 될 수 있음을 보여준다.
Google Project Zero의 Pixel 10 제로클릭 체인 분석은 모바일 보안의 약한 고리가 여전히 커널 드라이버와 패치 체계임을 보여준다.
Infracost의 채용 공고는 AI 에이전트가 코드를 쓰는 시대에 비용 검토가 CI와 IDE 안으로 이동하고 있음을 보여준다.
RTX 5090 eGPU를 M4 맥북 에어에 연결한 실험은 게임보다 로컬 AI 추론과 플랫폼 경계의 비용을 더 선명하게 보여준다.
AI 경쟁의 점수판은 논문 수가 아니라 클라우드, 데이터, 제품 배포력이다. 미국이 상용화 스택에서 앞서는 이유와 한국의 전략을 짚는다.
xAI가 미시시피 데이터센터에서 46기 가스터빈을 운용한다는 보도와 소송은 AI 컴퓨트 경쟁이 지역 환경·규제 문제로 번지는 장면이다.
Needle은 Gemini 도구호출을 2,600만 파라미터 소형 모델로 증류한 실험이다. 개인 기기 AI, 에이전트 라우팅, 비용 절감 전략이 어디로 움직이는지 살피고 한국 개발팀이 검증해야 할 데이터와 보안 과제를 분석한다.
Cocoa with Love가 Swift와 Metal로 행렬곱 성능을 Gflop/s에서 Tflop/s 수준으로 끌어올리는 실험을 공개했다. 로컬 AI 시대에는 모델보다 커널, 메모리, 프레임워크 선택이 개발자 경험을 좌우한다.
Google이 Gemini API File Search에 이미지·텍스트 통합 검색, 메타데이터 필터, 페이지 단위 인용을 추가했다. 기업 RAG 제품은 이제 답변 생성보다 근거 검증과 권한 제어가 경쟁 포인트가 됐다.
AMD GAIA 0.17.6은 Gmail 이메일 분류 에이전트와 OAuth PKCE 기반 연결을 추가했다. 로컬 AI의 생산성 활용과 권한 통제가 시험대에 올랐다.
엔비디아가 2026년 들어 AI 기업 지분 투자에 400억 달러 이상을 약정했다. OpenAI, Corning, IREN 투자는 공급망과 자본의 경계를 흐린다.
WebRTC가 음성 AI에 적합한지에 대한 기술 논쟁이 커지고 있다. 낮은 지연보다 프롬프트 보존과 버퍼링이 더 중요할 수 있다.
Cloudflare가 AI 활용 증가와 조직 재설계를 이유로 1,100명 이상을 감원했다. 매출 성장과 인력 축소가 동시에 나타난 첫 대형 신호다.
미국 최대 전력망 PJM이 데이터센터와 AI 수요로 구조 개편 압박을 받고 있다. 컴퓨트 경쟁은 이제 모델이 아니라 전력 접속 경쟁이다.
Google DeepMind가 AlphaEvolve의 실제 적용 성과를 공개했다. 과학, 전력망, TPU, 데이터베이스, 물류까지 알고리즘 자동 최적화가 확장되고 있다.
Anthropic이 SpaceX Colossus 1 용량을 쓰고 Claude Code와 Opus API 한도를 확대했다. AI 경쟁의 병목이 전력과 GPU로 이동했다.
AI 평가 스타트업 Braintrust가 AWS 계정 무단 접근 이후 고객에게 API 키 교체를 요청했다. LLMOps의 비밀 관리 리스크를 분석한다.
Cloudflare가 Stripe Projects와 함께 에이전트가 계정 생성, 결제, 도메인 구매, 배포까지 수행하는 흐름을 공개했다.