[경제] 껍질 깐 ‘나노 바나나’ 주인 구글…“일관성 있는 이미지 AI” [팩플]

본문

바나나의 주인은 구글이었다. 구글이 고품질 결과물로 소셜미디어(SNS) 등 온라인에서 화제가 됐던 인공지능(AI) 이미지 생성 모델 ‘나노 바나나’의 정식 출시를 알렸다.

17562780835427.jpg

'나노바나나'라는 코드명으로 먼저 알려진 구글의 이미지 생성 AI 모델 제미나이 2.5 플래시로 생성한 이미지. 계단, 여성, 휴대전화 등 세 개의 사진을 합성해 오른쪽 이미지로 만들어낸 것.사진 구글

무슨 일이야

구글은 26일 자사 블로그에 최신 이미지 생성 및 편집 모델인 ‘제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)’를 소개했다. 모델 이름 뒤에는 괄호를 붙여 ‘일명 나노 바나나(aka nano-banana)’라고 부연했다.

나노 바나나는 최근 엑스(X)·스레드·레딧 등 온라인 커뮤니티와 SNS에서 입소문을 타며 업계의 큰 관심을 모았다. 서로 다른 두 이미지를 넣고 원하는 프롬프트(명령어)를 입력하면 실제 사진처럼 자연스럽게 합성해 내, 온라인에는 사용 후기 이미지들이 쏟아졌다. 그간 개발 주체는 베일에 가려져 있었다. 업계에선 구글 제품이라고 추정하고 있었는데, 명확히 밝히지 않다가 이번에 공식적으로 발표했다.

이게 왜 중요해

기존 이미지 생성 AI 모델은 프롬프트에 맞춰 새 이미지를 그럴 듯 하게 생성해 내긴 했지만, 같은 인물을 여러 장면에 반복 등장시키다 보면 얼굴이나 체형이 바뀌는 등의 문제가 발생했다. 그래서 광고 제작이나 브랜드 마케팅 등 실질적 비즈니스에 활용하는 데 제약이 존재하기도 했다. 스토리텔링이나 브랜드 제작에 중요한 일관된 콘셉트를 유지하기 어려워서였다.

17562780838164.jpg

'나노바나나'라는 코드명으로 먼저 알려진 구글의 이미지 생성 AI 모델 제미나이 2.5 플래시로 생성한 이미지. 배경이 바뀌지만 사람의 얼굴은 일관되게 생성하고 있다.사진 구글

제미나이 2.5 플래시 이미지는 기존 모델의 약점인 ‘일관성’에 강점을 두고 있다. 구글은 “같은 캐릭터나 제품을 다양한 환경에 배치하거나, 새로운 배경과 여러 각도에 둬도 이미지를 일관되게 생성할 수 있다”고 강조했다. 여러 장의 사진을 업로드해 완전히 새로운 장면을 만드는 멀티 이미지 합성 기능과 이미 생성한 이미지의 세부 항목들을 계속 수정·편집하는 기능도 갖췄다.

국내 한 IT업계 관계자는 “기존에 사람이 3D·포토샵 등을 활용해 긴 시간 들여서 하던 일을 거의 몇 초 만에 해내는 수준까지 갔다”고 말했다. 구글은 이날 블로그를 통해 자사 모델이 오픈AI의 ‘GPT Image 1’, 알리바바의 ‘Qwen Image Edit’ 등 타사 모델 대비 각종 벤치마크(성능)에서도 높은 점수를 기록했다고 전했다. 구글은 새 모델을 개발자 플랫폼 제미나이 API와 버텍스 AI, 구글 AI 스튜디오에 공개했다. 개발자라면 누구나 쉽게 모델 API를 연결해 다양한 서비스를 만들어 낼 수 있게 된 것.

구글은 나노 바나나를 통해 타사 모델 대비 높은 기술력을 과시함과 동시에, 구글 생태계에 또 하나의 무기를 탑재하게 됐다. 구글이 해당 모델을 공개한 날 포토샵 개발사 어도비는 자체 생성 AI 플랫폼 파이어플라이와 디자인 툴인 어도비 익스프레스에서 구글의 새 이미지 생성 모델을 지원한다고 발표했다.

앞으로는

고도화된 이미지 생성 AI 기술의 해자가 열리면서 이를 활용한 기업들 서비스 경쟁은 더 치열해질 전망이다. 기술력 그 자체보다는 누가 더 실용적이고 창의적인 서비스를 만들어 비즈니스 수익을 창출하느냐가 중요해졌다는 의미다. 다만 육안으로는 티가 나지 않을 정도로 정교해진 이미지 합성 기술이 딥페이크나 저작권 침해 등 문제로 악용될 소지 또한 크다. 구글 측은 “제미나이 2.5 플래시 이미지(나노 바나나)로 생성된 이미지에는 모두 워터마크(SynthID)가 삽입돼 감지 도구를 통해 AI 생성·편집 여부를 판별할 수 있다”고 설명했다.

더중앙플러스 : 팩플

더 자세한 기사 내용이 궁금하다면, 기사 링크를 복사해 주소창에 붙여 넣으시면 됩니다.

10달러짜리 나만의 일타강사…‘AI 팟캐스트’ 3대장 대해부
어려운 논문이나 자료를 읽다 보면 이런 생각이 들곤 한다. ‘누가 대신 읽고 이해해서 나한테 설명해주면 좋겠다…’ 그럴 때 딱 좋은 게 인공지능(AI) 팟캐스트다. 어려운 논문을 봐야 하는데 도저히 이해가 안 된다면, 긴 분량의 자료를 읽을 시간이 도저히 생기지 않는다면. AI 팟캐스트의 시작을 알린 구글의 노트북LM부터 음성 스타트업 일레븐랩스의 일레븐리더, AI 에이전트 플랫폼 젠스파크 등을 활용해 내가 원하는 주제를 속속 골라 설명해주는 팟캐스트를 직접 만들어보자.
https://www.joongang.co.kr/article/25357460

대충 명령해도 영화 나온다? 모든 고수들이 극찬한 AI
AI가 알아서 영상을 만들어준다고? 놀랐던 것도 이제 옛말이 됐다. 지금은 콘텐트 제작 전반에 AI를 적극 활용하는 실전 비즈니스 레벨로 시장이 진화하고 있다. 연출·VFX(시각특수효과) 등 각자 분야에서 잔뼈가 굵은 제작자들은 이제 실사 영화뿐 아니라 애니메이션·뮤직비디오 등 다양한 영상 콘텐트를 AI로 직접 만들고 있다. 이들을 직접 만나 프롬프트란 무엇인지, 고화질 영상을 뽑아내는 방법은 뭔지, 모션이나 특수효과에 활용하는 어플리케이션은 뭔지 등을 물었다. 초급자와 중급자를 위한 활용 방법 및 주의점도 담았다.
https://www.joongang.co.kr/article/25355897

겨우 지브리에 놀랐는가…챗GPT 찐 필살기 보여주마
모두가 한 번씩 해봤다는 지브리 스타일 프사(프로필 사진) 열풍, 올라타고 싶은 마음만 굴뚝 같았던 이들을 위해 챗GPT 이미지 AI 사용법을 A부터 Z까지 싹 정리했다. 지브리 프사만 있나. 몇마디 프롬프트(명령문)로 카드뉴스·웹툰 그리고 복잡한 인포그래픽도 모두 가능. 초보부터 고수까지 실전에서 똑똑하게 쓸 수 있는 프롬프트도 대방출. 가만 내 얼굴 사진, 우리 가족 사진… 무심코 챗GPT에 올린 사진 안전한 건가? 개인정보 유출 걱정 없이 쓸 수 있는 방법까지 세세히 담아왔으니, 차근차근 시작해 보자. 렛츠 고!
https://www.joongang.co.kr/article/25327695

0
로그인 후 추천을 하실 수 있습니다.
SNS
댓글목록 0
등록된 댓글이 없습니다.
전체 53,883 건 - 1 페이지