Gemini 3.5 Flash, 에이전트 속도전의 신호탄

Google은 2026년 5월 19일 Gemini 3.5 제품군을 공개하며 첫 모델로 Gemini 3.5 Flash를 내놨다. 발표의 표현은 명확하다. 이번 모델은 ‘frontier intelligence with action’, 즉 단순 답변보다 복잡한 에이전트 워크플로 실행을 겨냥한다. Google은 3.5 Flash가 Gemini 앱, Google Search의 AI Mode, Google Antigravity, Gemini API, Android Studio, Gemini Enterprise 계열에 바로 제공된다고 설명했다. 3.5 Pro는 내부 사용 중이며 다음 달 출시를 예고했다.

이번 발표가 중요한 이유는 이름의 ‘Flash’ 때문이다. 보통 Flash 계열은 빠르고 저렴한 모델, Pro 계열은 무거운 고성능 모델로 이해됐다. Google은 이 경계를 좁히고 있다. 3.5 Flash를 코딩과 장기 에이전트 작업에 강한 모델로 배치하면서, 매일 호출되는 기본 모델이 더 많은 실제 작업을 맡을 수 있다는 메시지를 냈다. 이는 Gemini API 문서, Google AI Studio, Android Studio의 Gemini 기능, Google DeepMind의 Frontier Safety Framework와 함께 봐야 한다. 모델 발표가 아니라 배포면 전체가 움직이고 있다.

Flash가 중요해진 이유

AI 에이전트는 한 번의 정답보다 반복 호출 비용과 지연시간에 민감하다. 파일을 읽고, 코드를 고치고, 테스트를 돌리고, 검색을 반복하는 워크플로에서는 1회 응답 품질만큼 호출당 비용·속도·실패 복구가 중요하다. Google이 3.5 Flash를 Gemini 앱과 Search AI Mode의 기본 모델로 올렸다는 점은 그래서 크다. 소비자 제품의 기본 경로에서 충분한 추론과 행동 능력을 제공하면, 사용자는 별도 ‘고급 모드’를 고르지 않아도 에이전트 경험을 접한다.

발표문은 Shopify가 장기 데이터 분석을 위해 병렬 서브에이전트를 활용하고, Databricks가 대규모 데이터셋에서 진단과 해결책 제안을 자동화하는 사례를 언급한다. 구체 수치는 제한적으로 공개됐지만 방향은 뚜렷하다. 기업 업무에서 AI의 단위가 ‘대화’에서 ‘작업 묶음’으로 커지고 있다. Anthropic이 말한 선제적 AI 에이전트와 마찬가지로, 제품 경쟁은 모델 벤치마크보다 작업을 끝까지 붙잡는 실행 환경으로 옮겨간다.

관점	이전 Flash 모델의 기대치	Gemini 3.5 Flash의 포지션	기업 도입 시 의미
성능	빠른 보조 모델	에이전트·코딩 중심 모델	기본 워크플로에 투입 가능
비용	Pro 대비 저렴한 선택지	장기 작업 비용 최적화	자동화 범위 확대
배포	API와 앱 일부 기능	앱, 검색, IDE, 엔터프라이즈	사용자 접점 전체 확산
경쟁축	모델 점수	실행 하네스와 제품 통합	벤더 락인 평가 필요

검색과 IDE가 같은 모델을 쓰는 순간

Google의 장점은 모델을 노출할 표면이 많다는 데 있다. 검색의 AI Mode, Gemini 앱, Android Studio, Google Antigravity, Gemini Enterprise는 서로 다른 제품처럼 보이지만 같은 모델 계열이 들어가면 학습 곡선과 생태계 효과가 생긴다. 개발자는 Gemini File Search와 멀티모달 RAG처럼 API에서 문서·코드·이미지를 함께 다루고, 일반 사용자는 Search에서 동적 UI와 정보 에이전트를 경험한다.

이는 OpenAI, Anthropic, Perplexity와 다른 싸움이다. OpenAI는 ChatGPT와 API, Microsoft 생태계의 결합이 강하고, Anthropic은 Claude Code와 기업 지식 작업에서 존재감을 키운다. Google은 검색과 Android, Workspace, Cloud, 개발도구를 동시에 움직일 수 있다. DeepMind의 AI 포인터 인터페이스가 보여준 것처럼, 다음 인터페이스는 텍스트창 하나가 아니라 화면·문서·코드·검색 결과 위에서 움직이는 조작층이다.

한국 개발팀에는 선택지가 생긴다. Gemini를 단순 챗봇 API로만 볼 것이 아니라, Android 앱 개발, 검색 유입, 내부 지식 검색, 데이터 분석 워크플로가 같은 모델 계열로 이어질 때 운영 복잡도가 줄어드는지 봐야 한다. 반대로 특정 생태계에 지나치게 묶이면 가격·권한·로그 정책 변화의 영향을 크게 받는다.

안전 프레임워크는 제품 기능이 됐다

Google은 Gemini 3.5가 Frontier Safety Framework에 따라 개발됐고, 사이버와 CBRN 관련 보호장치를 강화했다고 밝혔다. 흥미로운 대목은 안전이 더 이상 별도 문서가 아니라 제품 성능의 일부로 제시된다는 점이다. 에이전트가 파일을 수정하고 코드를 실행하고 업무 시스템에 접근할수록, ‘거절을 잘한다’보다 ‘위험한 행동을 알아차리고 안전한 행동은 불필요하게 막지 않는다’가 중요하다.

이 지점은 Google의 AI 제로데이 경고와 연결된다. AI가 공격과 방어 모두의 속도를 높이면, 모델 제공자는 안전 기준을 고객에게 설명할 수 있어야 한다. 한국 기업이 도입할 때는 모델 카드보다 감사 로그, 도구 권한 분리, 데이터 보존, 관리자 승인 흐름을 확인해야 한다. Flash가 빨라질수록 잘못된 자동화도 빨라진다.

결론

Gemini 3.5 Flash는 ‘작은 모델이 좋아졌다’는 소식이 아니다. 빠른 모델을 에이전트 실행의 중심에 놓고, 검색·앱·IDE·기업 플랫폼 전체에 동시에 배치하겠다는 선언이다. 한국 기업은 벤치마크 한 줄보다 세 가지를 봐야 한다. 첫째, 반복 호출 비용과 지연시간이 실제 업무 자동화에 맞는가. 둘째, IDE와 업무 시스템에서 권한 통제가 가능한가. 셋째, Google 생태계 통합이 생산성을 높이는 만큼 이탈 비용도 커지는가.

FAQ

Gemini 3.5 Flash는 무엇인가?

Google이 공개한 Gemini 3.5 제품군의 첫 모델로, 에이전트 작업과 코딩, 빠른 응답을 동시에 겨냥한 Flash 계열 모델이다.

Gemini 3.5 Pro도 출시됐나?

Google 발표에 따르면 3.5 Pro는 내부 사용 중이며 다음 달 출시를 예고했다. 현재 전면 배포의 중심은 3.5 Flash다.

왜 에이전트 작업에 Flash가 유리한가?

에이전트는 여러 번 모델을 호출하므로 속도와 비용이 누적된다. 충분한 성능의 빠른 모델은 장기 워크플로 운영에 유리하다.

개발자는 어디서 쓸 수 있나?

Google은 Gemini API, Google AI Studio, Android Studio, Google Antigravity, Gemini Enterprise 계열에서 제공한다고 밝혔다.

한국 기업의 체크포인트는 무엇인가?

가격, 지연시간, 로그 보존, 권한 통제, 데이터 거버넌스, Google 생태계 의존도를 함께 평가해야 한다.

Gemini 3.5 Flash, 에이전트 속도전의 신호탄

AI 뉴스를 놓치지 마세요

Flash가 중요해진 이유

검색과 IDE가 같은 모델을 쓰는 순간

안전 프레임워크는 제품 기능이 됐다

결론

FAQ

Gemini 3.5 Flash는 무엇인가?

Gemini 3.5 Pro도 출시됐나?

왜 에이전트 작업에 Flash가 유리한가?

개발자는 어디서 쓸 수 있나?

한국 기업의 체크포인트는 무엇인가?

관련 토픽 더 보기

관련 기사

Google AI Mode, 오프라인 재고 검색까지 들어왔다

Google Colab MCP Server, AI 에이전트의 클라우드 손이 된다

Gemini File Search, 멀티모달 RAG를 기본 기능으로 끌어올렸다

Google AI 검색, Reddit 인용으로 신뢰를 얻을까

DAC, 대시보드를 AI 에이전트가 리뷰 가능한 코드로 만든다