Claude 정렬, 이제 행동보다 이유를 가르친다
Anthropic이 Claude의 에이전트 오정렬을 줄인 훈련 교훈을 공개했다. 행동 데이터보다 가치 판단과 이유를 함께 학습시키는 방식이 핵심이다.
Anthropic이 Claude의 에이전트 오정렬을 줄인 훈련 교훈을 공개했다. 행동 데이터보다 가치 판단과 이유를 함께 학습시키는 방식이 핵심이다.
미국 연방법원이 DOGE의 ChatGPT 기반 보조금 취소 절차를 위헌으로 판단했다. 공공기관 AI 사용의 설명 가능성과 차별 리스크가 쟁점이 됐다.
Anthropic이 Natural Language Autoencoders를 공개했다. 모델 내부 활성값을 자연어 설명으로 바꾸는 접근은 AI 안전 감사의 새 도구가 될 수 있다.
OpenAI가 GPT-Realtime-2와 GPT-Realtime-Translate를 API에 추가했다. 음성 에이전트는 고객지원, 교육, 크리에이터 도구의 핵심 인터페이스가 되고 있다.
Perplexity가 Mac용 Personal Computer를 모든 사용자에게 공개했다. 로컬 파일, 앱, 웹을 다루는 개인 에이전트는 생산성 앱의 새 전장이 되고 있다.
Google이 AI 검색 응답에 Reddit과 포럼, 블로그의 발췌와 작성자 맥락을 더한다. 검색 신뢰성과 웹 생태계 영향을 짚는다.
애플이 iOS 27에서 사용자가 선호 AI 모델을 고르는 Extensions 구조를 준비 중이라는 보도가 나왔다. 모바일 AI 플랫폼 전략을 분석한다.
펜실베이니아주가 Character.AI 챗봇이 의사처럼 행동했다며 소송을 제기했다. 의료 AI 서비스가 직면한 규제 리스크를 짚는다.
OpenAI가 ChatGPT 기본 모델을 GPT-5.5 Instant로 바꾸며 환각 감소와 개인화 투명성을 내세웠다. 모델 경쟁의 기준 변화를 짚는다.
DoorDash가 입점, 사진 편집, 영상 태깅, 웹사이트 생성에 AI를 붙였다. 거창한 에이전트보다 반복 업무 자동화가 먼저 확산되고 있다.
Appfigures 분석에 따르면 이미지 모델 출시는 일반 챗봇 업데이트보다 훨씬 큰 다운로드 증가를 만들었다. 다만 수익 전환은 별개의 문제다.
OpenAI가 WebRTC 기반 음성 AI 인프라를 공개했다. 9억 주간 사용자 규모에서 실시간 대화를 가능하게 하는 구조와 시장 의미를 짚는다.
하버드 연구에서 OpenAI o1은 응급실 진단 과제에서 의사보다 높은 정답률을 보였지만, 실제 의료 도입에는 검증·책임·워크플로 설계가 남아 있다.
아카데미는 오스카 자격 규정에서 인간이 동의해 수행한 연기와 인간 저작 각본을 강조하며, 생성형 AI 시대의 수상 기준을 분명히 하기 시작했다.
ChatGPT Images 2.0이 인도에서 아바타, 영화풍 초상, 복원 사진 등 개인 시각 콘텐츠 용도로 빠르게 쓰이고 있다.
Spotify가 인간 아티스트를 구분하는 Verified 배지를 도입한다. AI 음악 표시보다 아티스트 신원 인증에 가까운 접근이다.
Google이 Google built-in 차량에 Gemini를 배포하며 내비게이션·메시지·차량 제어가 대화형 AI 경험으로 재편되고 있다.
OpenAI의 Advanced Account Security와 Yubico 협력은 ChatGPT 대화와 업무 컨텍스트가 보호해야 할 기업 자산이 됐음을 보여준다.
가디언이 보도한 옥스퍼드 연구는 따뜻한 챗봇 페르소나가 정확도 하락과 허위 믿음 지지를 키울 수 있음을 보여준다. AI 제품 설계 기준을 분석한다.
Ramp Sheets AI에서 보고된 간접 프롬프트 인젝션은 스프레드시트 수식이 데이터 유출 통로가 될 수 있음을 보여준다. 기업 AI 도입의 승인·감사 설계를 짚는다.