Google이 최근 AI 이미지 생성 도구인 ImageFX를 선보였다. 이는 AI 기술 진화의 좋은 예시라고 할 수 있겠다. 텍스트만 입력하면 다양한 스타일의 이미지를 만들어내는데, 이것이 바로 Google의 언어 모델과 이미지 기술이 집약된 결과물이다.
Google AI Test Kitchen을 통해 한국을 포함한 여러 국가에서 이용할 수 있다. DALL-E, Midjourney, Stable Diffusion 등과 비슷한 기능을 제공하지만, Google의 기술력을 감안하면 앞으로가 더욱 기대된다.
나도 ImageFX로 여러 이미지를 만들어봤다. AI가 사람 이미지를 만드는 데 어려움을 겪는다는 점을 고려해 사람이 포함된 이미지를 주로 만들어봤다.
아래 화면은 ImageFX 서비스에 가입한 후 볼 수 있는 인터페이스다. 왼쪽에는 프롬프트를, 오른쪽에는 그에 따라 생성된 이미지를 확인할 수 있다.
사무실에 있는 남자 2명, 여자 2명 총 4명의 아시아인을 그려달라고 했다.
그랬더니 하나의 이미지가 우측에 생성된다. 프롬프트 하단에는 35mm film, minimal, sketchy 등의 추천 키워드가 나와서 필요 시 클릭하여 프롬프트로 삽입할 수 있다.
Google의 ImageFX로 만든 실사 이미지의 퀄리티가 생각보다 괜찮다. 마이크로소프트의 코파일럿보다 나은 것 같고, 블로그 글이나 배경 이미지로 쓰기에 충분해 보인다.
이미지를 자세히 보면 재미있는 점이 있다. 내가 4명을 그려달라고 했는데 3명만 그려줬다. 그리고 모두가 안경을 끼고 있다는 점이다. 이게 Google이 아시아인에 대해 가진 편견일까, 아니면 그냥 우연일까? 보통 AI가 인물이 들어간 실사 이미지를 만들 때 눈이나 손, 포즈 등이 이상한 경우가 많은데, 안경 때문인지 이런 문제는 보이지 않는다.
다음으로는 한 명의 인물이 부각된 이미지를 만들어봤다. 요즘 날씨가 많이 더워서 엄청 더운 여름날 힘들어하는 20대 여성을 그려달라고 요청했다.
이번에는 2가지 이미지를 만들어줬다. 만들어주는 이미지 갯수는 구글에서 랜덤으로 정하는 것으로 보인다. 한 명의 인물을 정해서 그려달라고 해서 그런지 인물 퀄리티가 더 높다. 첫 번째 이미지는 정말 실제 사람 같이 느껴진다. 알아서 이미지에 보케까지 넣다니 성능이 끝내준다.
미드저니를 직접 활용해보지 않아서 모르겠는데 인물 이미지는 imageFX가 가장 성능이 탁월한 것으로 보인다. 설마 구글이 가진 실사 이미지를 그냥 가져와서 띄워준 건 아니겠지? 😂
ImageFX가 이번엔 2가지 이미지를 만들어줬다. 생성되는 이미지 개수는 Google이 랜덤으로 정하는 듯하다. 한 명의 인물로 특정해 요청했더니 인물 퀄리티가 더 높아졌다. 특히 첫 번째 이미지는 정말 실제 사람 같은 느낌이 든다. 심지어 알아서 보케 효과까지 넣었으니, 성능이 정말 뛰어나다고 할 수 있겠다.
미드저니(Midjourney)를 직접 써보지 않아서 정확한 비교는 어렵지만, 인물 이미지 생성에서는 ImageFX가 가장 뛰어난 것 같다. 농담이지만, 혹시 Google이 가진 실제 사진을 그대로 가져다 쓴 건 아닐까? 😂
그만큼 퀄리티가 높다는 뜻이다.
최근 글(Recent Post / 最近的帖子)