Kepler의 Claude 금융 AI, 검증 가능한 답변이 경쟁력이다

“그럴듯한 답”보다 “검증 가능한 답”

Anthropic은 Kepler 사례를 통해 금융 서비스용 Claude 도입 방식을 소개했다. 블로그에 따르면 Kepler의 플랫폼은 2,600만 건 이상의 SEC 공시, 실적 발표 콜, IR 자료, 컨센서스 추정치, 사내 데이터를 색인하고, 1만4,000개 이상 기업과 27개 글로벌 시장을 다룬다. 핵심은 Claude가 답변한 숫자를 원문 공시, 페이지, 라인 아이템까지 검증하도록 설계했다는 점이다.

금융 분석에서 LLM의 문제는 문장을 못 쓰는 것이 아니다. 오히려 너무 자연스럽게 틀린 숫자를 말할 수 있다는 점이 문제다. 매출, EBITDA, 가이던스, 주당순이익, 순부채 같은 수치는 소수점 하나와 기준 기간이 중요하다. 따라서 금융 AI는 RAG를 붙였다는 말만으로 부족하고, 답변의 출처와 계산 경로를 사용자가 다시 확인할 수 있어야 한다.

금융 문서는 AI에게 좋은 데이터이자 위험한 데이터다

SEC의 EDGAR 공시 시스템은 기업 분석의 핵심 원천이다. 형식이 비교적 표준화되어 있고, 날짜와 수치가 많으며, 시장 참여자들이 반복적으로 찾는 질문도 많다. 동시에 위험도 크다. 회계 기준, 조정 항목, 비GAAP 수치, 일회성 비용, 연결·별도 기준을 잘못 섞으면 투자 판단이 달라진다.

Kepler 사례의 중요한 메시지는 검색량보다 검증 구조다. 문서를 많이 넣는 것만으로는 기업용 AI가 되지 않는다. 사용자가 “2025년 3분기 북미 매출 성장률은?”이라고 물었을 때, 모델은 답뿐 아니라 어떤 10-Q, 어떤 표, 어떤 라인에서 가져왔는지 보여줘야 한다. Ramp Sheets의 프롬프트 인젝션 이슈가 보여주듯 스프레드시트와 금융 데이터는 공격 표면도 넓다.

일반 RAG	금융 검증형 AI
관련 문서 몇 개를 찾아 요약	숫자와 문장의 출처 위치를 함께 제시
답변 품질을 사용자가 감으로 판단	원문 공시·페이지·라인 아이템으로 재검증
문서 단위 검색 중심	표, 기간, 계정과목, 통화 단위까지 추적
편리성이 핵심 가치	감사 가능성과 책임성이 핵심 가치

Claude가 들어간 자리는 “분석가 보조”다

이런 시스템에서 Claude의 역할은 애널리스트를 대체하는 전면 자동 투자 판단보다, 검색·요약·대조·초안 작성 보조에 가깝다. 예를 들어 특정 기업의 최근 4개 분기 마진 추이를 찾고, 실적 콜에서 경영진이 언급한 원인을 요약하며, 경쟁사와 비교할 수 있다. 하지만 최종 투자 의견, 리스크 해석, 가정 변경은 여전히 전문가의 책임 영역이다.

Structured Output Benchmark가 강조한 것처럼 기업 AI는 자유로운 문장보다 구조화된 출력과 검증을 요구한다. 금융에서는 여기에 감사 로그, 권한 관리, 사내 리서치와 공개 공시의 구분, 데이터 라이선스까지 붙는다. Stripe Link의 에이전트 결제처럼 AI가 실제 경제 활동에 가까워질수록 권한과 책임 설계가 중요해진다.

한국 금융사와 리서치 조직의 기회

국내 증권사, 자산운용사, 회계법인도 비슷한 요구를 갖고 있다. 전자공시, 사업보고서, 컨퍼런스콜, 애널리스트 리포트, 산업 통계, 내부 메모가 흩어져 있고, 반복 질문이 많다. 한국어 문서와 영어 공시를 함께 다루는 조직이라면 번역과 요약만으로도 생산성이 오른다.

다만 한국 시장에서는 데이터 권리와 내부통제 이슈가 더 세게 작동할 수 있다. 유료 리포트, 고객 포트폴리오, 미공개 정보가 모델 입력에 섞이면 큰 문제가 된다. 따라서 금융 AI 프로젝트는 처음부터 공개 데이터와 내부 데이터를 분리하고, 질문자 권한에 따라 검색 범위를 제한해야 한다. 답변에는 근거 링크, 생성 시각, 사용 데이터셋 버전을 남기는 것이 좋다.

엔터프라이즈 AI의 다음 KPI

Kepler 사례는 엔터프라이즈 AI의 KPI가 “응답 속도”에서 “재현성과 검증성”으로 이동하고 있음을 보여준다. 사용자가 같은 질문을 다시 했을 때 같은 근거를 찾을 수 있는가, 숫자가 바뀌면 어떤 공시가 업데이트됐는가, 모델이 모르는 것을 모른다고 말하는가가 더 중요해진다.

OpenAI의 YubiKey 보안 강화처럼 기업 AI는 모델 성능만으로 팔리지 않는다. 인증, 권한, 감사, 데이터 경계, 근거 추적이 제품의 일부가 되어야 한다. 금융 AI에서 “출처 없는 요약”은 데모는 될 수 있어도 업무 시스템은 되기 어렵다.

FAQ

Q1. Kepler 사례의 핵심은 무엇인가?
Claude를 이용해 방대한 금융 문서를 검색하되, 답변의 숫자를 원문 공시와 위치까지 검증하도록 만든 점이다.

Q2. 왜 금융 AI에서 출처가 중요한가?
숫자와 기간, 회계 기준이 조금만 틀려도 투자 판단이 달라진다. 사용자는 원문 근거를 확인할 수 있어야 한다.

Q3. RAG만 붙이면 충분한가?
아니다. 문서 검색 외에 표 구조 인식, 단위와 기간 매칭, 권한 관리, 감사 로그, 오류 처리까지 필요하다.

Q4. 한국 금융사도 비슷하게 쓸 수 있나?
가능하다. 전자공시와 리포트 검색, 실적 요약, 비교표 생성에 유용하지만 내부 정보와 유료 데이터의 접근권한을 엄격히 나눠야 한다.

Q5. 가장 중요한 도입 원칙은?
모델이 답을 내는 것보다 사용자가 그 답을 검증할 수 있게 만드는 것이다. 금융 AI의 신뢰는 근거 추적에서 나온다.

Kepler의 Claude 금융 AI, 검증 가능한 답변이 경쟁력이다

AI 뉴스를 놓치지 마세요

“그럴듯한 답”보다 “검증 가능한 답”

금융 문서는 AI에게 좋은 데이터이자 위험한 데이터다

Claude가 들어간 자리는 “분석가 보조”다

한국 금융사와 리서치 조직의 기회

엔터프라이즈 AI의 다음 KPI

FAQ

관련 토픽 더 보기

관련 기사

HumanX 컨퍼런스에서 드러난 Claude의 엔터프라이즈 에이전트 전략

Claude 유료 구독자 폭증: Anthropic, ChatGPT 추격 본격화

Claude 사고의 공간, Anthropic AI 모델의 새로운 철학과 접근법

Karpathy의 LLM Wiki: RAG를 넘어선 영구 지식베이스 설계법

Claude Design, 비디자이너용 AI 비주얼 툴 전면전