#ai-agent

- 3페이지

프런티어 AI가 공개 CTF의 사다리를 흔든다

프런티어 모델이 중간 난도 CTF를 자동화하면서 공개 보안 대회의 점수판이 인간 실력보다 모델 접근성과 오케스트레이션을 더 반영하기 시작했다.

2026-05-17원본

Tailwind를 떠나는 글이 AI 코딩에 중요한 이유

Julia Evans의 Tailwind 이탈기는 AI가 UI 코드를 대량 생성하는 시대에 CSS 구조, 의미 있는 클래스, 작은 규칙의 가치가 커진다는 신호다.

2026-05-17원본

Zerostack, 코딩 에이전트를 유닉스 도구로 줄이다

Rust로 만든 Zerostack은 거대한 IDE형 코딩 에이전트와 달리 작은 CLI, MCP, worktree 중심의 조합 가능한 개발 자동화를 제안한다.

2026-05-17원본

AI 열광이 회사를 리스크 공장으로 만들 때

Mitchell Hashimoto의 AI psychosis 경고는 빠른 복구만 믿는 개발 조직이 왜 더 큰 시스템 리스크를 만들 수 있는지 보여준다.

2026-05-16원본

AI 사용률 KPI가 만들 수 있는 가짜 생산성

Amazon 직원들이 AI 토큰 사용량 압박 때문에 불필요한 작업을 만든다는 보도는 AI 도입 지표가 어떻게 역효과를 낼 수 있는지 보여준다.

2026-05-16원본

브라우저에서 뱀이 학습한다는 것의 교육적 힘

tinyppo-snake는 브라우저 안에서 PPO 강화학습을 시각화하며, AI 교육이 거대 모델 설명보다 작은 실험 환경으로 이동하고 있음을 보여준다.

2026-05-16원본

AI 정렬은 설정이 아니라 관계의 문제다

‘AI를 정렬한다’는 표현 뒤에는 사용자를 설계 대상이 아니라 공동 조정자로 봐야 한다는 더 어려운 과제가 숨어 있다.

2026-05-15원본

Claude for Legal, 법무 AI의 제품 형태를 보여주다

Anthropic의 Claude for Legal 저장소는 법무 AI가 챗봇을 넘어 플러그인, 에이전트, 커넥터, 검토 게이트로 제품화되는 방식을 보여준다.

2026-05-15원본

AI 에이전트도 클라우드 비용을 알아야 한다

Infracost의 채용 공고는 AI 에이전트가 코드를 쓰는 시대에 비용 검토가 CI와 IDE 안으로 이동하고 있음을 보여준다.

2026-05-15원본

Anthropic이 말한 다음 AI 전장: 선제성

Anthropic Cat Wu는 Claude의 다음 단계가 사용자가 요청하기 전 필요한 자동화를 제안하는 선제성이라고 말했다. 에이전트 제품의 UX 변화를 분석한다.

2026-05-14원본

메디케어 ACCESS, 의료 AI의 결제 구조를 바꾸다

CMS ACCESS는 만성질환 관리 비용을 시간 투입이 아니라 결과로 보상한다. 의료 AI가 실제 수가와 연결되는 순간의 기회와 개인정보 리스크를 분석한다.

2026-05-14원본

Notion, 워크스페이스를 에이전트 허브로 바꾸다

Notion Developer Platform은 Workers, DB 동기화, 외부 에이전트 API로 협업 툴을 에이전트 실행 허브로 바꾼다. 기업 생산성 경쟁을 분석한다.

2026-05-14원본

미국 AI 우위의 핵심은 상용화 스택이다

AI 경쟁의 점수판은 논문 수가 아니라 클라우드, 데이터, 제품 배포력이다. 미국이 상용화 스택에서 앞서는 이유와 한국의 전략을 짚는다.

2026-05-14원본

xAI 가스터빈 논란, AI 인프라의 비용을 드러내다

xAI가 미시시피 데이터센터에서 46기 가스터빈을 운용한다는 보도와 소송은 AI 컴퓨트 경쟁이 지역 환경·규제 문제로 번지는 장면이다.

2026-05-14원본

26M Needle, 온디바이스 도구호출의 실험

Needle은 Gemini 도구호출을 2,600만 파라미터 소형 모델로 증류한 실험이다. 개인 기기 AI, 에이전트 라우팅, 비용 절감 전략이 어디로 움직이는지 살피고 한국 개발팀이 검증해야 할 데이터와 보안 과제를 분석한다.

2026-05-13원본

Statewright, 에이전트 신뢰성을 상태기계로 묶다

Statewright는 코딩 에이전트의 도구 사용을 상태기계로 제한해 신뢰성을 높이려 한다. MCP, 권한 가드레일, 로컬 모델 성능 개선 의미를 짚고 한국 개발 조직의 안전한 도입 전략, 보안 통제, 한계를 분석한다.

2026-05-13원본

Voker, 에이전트 분석을 제품 지표로 끌어올리다

Voker는 AI 에이전트 대화를 의도, 수정, 해결률과 ROI 지표로 바꾸려 한다. 에이전트 제품의 다음 경쟁축인 관측성과 분석 시장을 살피고 한국 기업의 데이터 소유권, self-hosting, KPI 설계를 분석한다.

2026-05-13원본

Digg의 AI 뉴스 재도전, 큐레이션은 다시 제품이 된다

Digg가 Reddit형 커뮤니티 재부팅을 접고 AI 분야 신호를 걸러내는 뉴스 애그리게이터로 방향을 바꿨다. 정보 과잉 시대에는 생성보다 선별, 요약보다 신뢰 그래프가 더 중요한 제품 경쟁력이 된다.

2026-05-12원본

Google의 AI 제로데이 경고, 보안의 속도전이 바뀐다

Google Threat Intelligence Group은 AI로 개발된 것으로 보이는 제로데이 악용 정황을 공개했다. 공격 자동화가 취약점 발견과 초기 침투를 앞당기면서 방어팀의 패치·탐지 운영도 재설계가 필요해졌다.

2026-05-12원본

Sony의 AI 게임 개발론, 더 많은 게임보다 발견성이 문제다

2026-05-12원본

이전3 / 9다음