그림을 그려주는 AI 사이트 중 최고는 무엇일까요?
우선 최고의 기준부터 정해놓고 이 글을 시작해야 할 것 같습니다. 어떤 점에서 최고이냐에 따라서 이 질문에 대한 답은 여러 가지가 나올 수 있으니까요.
디자이너를 위한 최고의 AI 그림 사이트를 찾기 위해 제가 임의로 정한 기준은 이겁니다. "사용하기 편리하면서 / 최고 품질의 그림을 만들어주는 AI 사이트는 무엇인가?"
가장 빠른 답을 얻기 위해 챗GPT에게 다음과 같은 질문을 합니다. (읽기 편하도록 영어 원문은 글 마지막으로 보냈습니다.)
인터넷을 검색해서 AI 이미지 생성 웹사이트 상위 3개를 알려줘. 이미지 품질 측면에서 최고 수준이어야 한다.
챗GPT의 답입니다.
다양한 소스를 조사한 결과 이미지 품질로 높은 평가를 받는 여러 AI 이미지 생성기를 발견했습니다.
OpenAI의 DALL-E 3는 최고 수준의 고품질 이미지를 생성하는 것으로 명성을 얻은 사용하기 쉬운 AI 이미지 생성기로 알려져 있습니다.
Midjourney는 최고의 AI 이미지 결과를 제공하는 것으로 강조되며, 이는 생성된 이미지 품질의 높은 표준을 나타냅니다.
Stability AI의 DreamStudio(Stable Diffusion)는 AI 생성 이미지를 사용자 정의하고 제어하여 특정 요구 사항에 맞게 조정할 수 있는 수준의 품질을 제안하려는 사람들에게 권장됩니다.
이러한 플랫폼은 다양한 기술 및 AI 중심 웹사이트에서 2023년과 향후 고품질 AI 생성 이미지를 위한 선도적인 옵션으로 인정받고 있습니다.
3개의 AI 그림 사이트를 비교해 봅니다.
저는 이 3개의 AI 그림 사이트 중 2개를 사용해 보았습니다. 미드저니는 매일 사용하고 있고, 달리-3는 미드저니로 만든 그림을 보완할 때 아주 가끔 사용합니다.
원래는 달리(DALL-E)로 AI 그림 사이트를 시작했지만, 미드저니를 알게 된 후부터는 AI로 그림을 만드는 용도로는 거의 99.99% 미드저니만 사용하고 있습니다.
이 3개의 AI 그림 사이트를 아래와 같은 3가지 기준으로 비교해 보겠습니다.
1. 얼마나 많은 사람들이 사용하고 있는가?
2. 어느 사이트가 가장 품질이 좋은 그림을 만들어 내는가?
3. 가장 사용하기 쉬운 사이트는 무엇인가?
1. 얼마나 많은 사람들이 사용하고 있는가?
AI 그림 사이트의 한 달 방문자를 확인하기 위해 Ubersuggest라는 구글 트래픽 분석 사이트를 사용합니다. 3개의 AI 그림 사이트의 주소를 ubersuggest에 넣어서 확인해 봅니다.
달리의 한 달 방문자는 52만 명입니다. (달리 3가 발표된 지 얼마 안 되었기 때문에 달리 2를 넣었습니다. 달리 3은 현재 한 달 방문자가 9만 명 미만입니다.)
미드저니의 한 달 방문자는 68만 명입니다. (미국 기준)
스테이블 디퓨전의 한 달 방문자는 79만 명입니다. (미국 기준)
단순한 방문자 숫자로 보면 스테이블 디퓨전이 가장 많은 것을 알 수 있습니다. 그러나 백링크 숫자는 미드저니가 다른 사이트들보다 20배 이상 많습니다. 백링크(Backlink)란 다른 사이트에서 해당 사이트로 링크를 건 것을 의미합니다. 즉 미드저니에 관해서 인터넷에 올라온 글이 나머지 2개의 AI 그림 사이트보다 훨씬 많다는 것을 의미합니다.
2. 어느 사이트가 가장 품질이 좋은 그림을 만들어 내는가?
이 질문 역시 어떤 기준을 잡는가에 따라 다른 답이 나올 수 있습니다.
챗GPT에게 AI 그림 사이트의 이미지 생성 능력을 알아보기 위한 고난도의 명령어를 만들어달라고 요청합니다.
챗GPT에게 넣은 프롬프트
AI 이미지 생성기 분야의 최고 전문가로 활동하세요. 고품질 이미지를 생성하는 데 어떤 AI 이미지 생성기가 가장 좋은지 찾으려고 합니다. AI 이미지 생성기의 기능을 테스트할 AI 이미지 생성에 대한 세 가지 다른 프롬프트를 제안하십시오. 세 가지 AI 이미지 생성기는 DALL-E 3, Midjourney 및 Stable Diffusion입니다.
챗GPT가 준 답
AI 이미지 생성 전문가로서 AI 이미지 생성기의 기능을 테스트하는 핵심은 복잡한 시나리오에 대한 AI의 이해, 렌더링 기능 및 창의적인 구성을 테스트하는 프롬프트를 제시하는 데 있습니다. 다음은 DALL-E 3, Midjourney 및 Stable Diffusion의 성능을 테스트하기 위해 고안된 세 가지 고유한 프롬프트입니다.
초현실적인 꿈의 풍경:
프롬프트: "바다가 지평선의 하늘과 합쳐지는 꿈의 풍경 이미지를 만듭니다. 이 매끄러운 전환 속에서 돌고래는 몸의 절반은 물속에 있고 나머지 절반은 물속으로 날아오르며 경계를 뛰어넘고 있습니다. 그 장면은 은은한 황혼의 빛으로 빛나고, 멀리 떨어진 낡은 범선이 두 영역 사이를 떠다니는데, 그 배의 돛은 캔버스 대신 별들로 휘날리고 있습니다."
목적: 이 프롬프트는 다양한 영역(물과 공기)의 요소를 혼합하고 반투명도와 조명 효과를 처리하는 AI의 능력을 테스트합니다. 배의 돛의 일부인 별의 창의적인 구성도 AI의 개념화 능력을 테스트합니다.
미래 지향적인 대도시:
프롬프트: "네오누아르와 사이버펑크 미학이 혼합된 황혼의 분주한 미래 지향적인 대도시를 묘사합니다. 위로는 홀로그램 간판이 달린 고층 빌딩이 우뚝 솟아 있고, 날아다니는 자동차는 네온 조명이 켜진 하늘길을 항해합니다. 아래에는 다양한 사람들과 안드로이드들이 이색적이고 빛나는 길거리 음식을 판매하는 대화형 디지털 상점과 로봇 노점상이 살아있는 거리에서 섞여 있습니다."
목적: 이 프롬프트는 복잡한 세부 정보를 생성하고 복잡한 도시 장면을 관리하는 AI의 능력을 평가합니다. 또한 AI가 다양한 건축 스타일을 얼마나 잘 결합하고 생활과 기술로 분주한 장면을 묘사할 수 있는지 평가합니다.
장대한 역사적 전투:
프롬프트: "고대 로마의 판타지 버전을 배경으로 한 장대한 역사적 전투를 묘사합니다. 전경에서는 반짝이는 마법의 방패로 무장한 로마 군단이 신화 속의 동물들과 싸우고 있습니다. 전투 위에는 마법사 두 사람이 하늘에 물결을 일으키는 주문을 시전 하며 결투를 벌입니다. 지는 해는 거대한 콜로세움을 배경으로 혼란스러운 전장에 극적인 그림자를 드리우고 관중들은 그 아치에서 지켜보고 있습니다."
목적: 이 프롬프트는 역사 및 판타지 요소에 대한 AI의 이해와 역동적인 행동을 렌더링 하는 능력에 도전합니다. 또한 공간 구성, 깊이 묘사, 복잡한 조명 및 그림자 상호 작용 처리에 대한 AI의 능력을 테스트합니다.
이러한 프롬프트는 AI 이미지 생성기의 경계를 넓히고 사실적인 세부 사항을 합성하고 예술적 장르를 고수하며 다양한 맥락의 요소를 창의적으로 결합하는 능력을 조사하기 위해 제작되었습니다. 그 결과는 고품질 이미지 생성에 있어 각 AI의 강점과 한계를 포괄적으로 보여줄 것입니다.
이제 각각의 프롬프트를 3개의 AI 그림 사이트에 넣어 보겠습니다.
1) 초현실적인 꿈의 풍경
달리-3가 만든 그림입니다. (챗GPT 유료 버전 4.0을 사용하면 달리-3를 챗GPT안에서 사용할 수 있습니다.)
미드저니가 만든 그림입니다.
스테이블 디퓨전이 만든 그림입니다.
달리-3의 그림이 가장 프롬프트에 가깝습니다. 미드저니는 프롬프트와는 거리가 있는 그림을 만들어냈지만, 최대한 보기 좋은 그림을 만들어내는 경향이 있다는 것을 알 수 있습니다. 스테이블 디퓨전의 그림은 심하게 말하면 수준 이하입니다.
2) 미래 지향적인 대도시
달리-3가 만든 그림입니다.
미드저니가 만든 그림입니다.
스테이블 디퓨전이 만든 그림입니다.
역시 결과는 달리-3, 미드저니, 스테이블 디퓨전의 순서로 그림의 품질을 평가할 수 있습니다. 달리-3의 품질이 달리-2에 비해 상당히 좋아졌다는 것을 느낍니다.
3) 장대한 역사적 전투
달리-3가 만든 그림입니다.
미드저니가 만든 그림입니다.
스테이블 디퓨전이 만든 그림입니다.
달리-3가 프롬프트에 근접한 그림을 만들었습니다. 미드저니는 프롬프트를 보드게임으로 인식해서 그림을 만들었습니다. 스테이블 디퓨전은 자연어로 된 프롬프트를 제대로 인식하지 못하는 것을 알 수 있습니다.
챗GPT가 만든 프롬프트를 사용해서 나온 결과이기 때문에 어떻게 보면 이 결과는 조금 편향적일 수도 있습니다. 챗GPT를 만든 OpenAI가 달리-3도 만들었기 때문에 달리-3의 그림이 가장 좋은 품질로 나온 것이 아닌가라는 의심을 해볼 만합니다.
마지막으로 보다 일반적인 케이스의 프롬프트를 사용해서 3개의 AI 그림 사이트를 비교해 봅니다.
beautiful woman, DMT art style이라는 간단한 프롬프트를 넣어 봅니다.
미드저니가 만든 그림입니다.
달리-3가 만든 그림입니다.
스테이블 디퓨전이 만든 그림입니다.
"DMT Art 스타일의 아름다운 여성"이란 간단한 프롬프트를 사용하면, 미드저니의 그림이 달리-3보다 월등히 좋은 결과를 보여줍니다. DMT Art란 사이키델릭과 비슷한 환각적인 스타일의 장르를 말하는데, 이러한 다양한 스타일에 대해서는 미드저니가 달리-3보다 훨씬 많은 데이터를 갖고 있는 것으로 여겨집니다. 간단히 말하면 미드저니가 만들어준 이미지는 바로 상업적으로 사용이 가능해 보이지만, 달리-3의 그림은 상업적인 용도로 사용하기에는 부족해 보입니다. 스테이블 디퓨전은 그저 평범한 사진을 만들어 낸 것으로 볼 때 특정 아트 스타일을 이해하는 능력이 상당히 떨어지는 것으로 판단됩니다.
상업적 또는 실용적 용도를 위한 그림 생성에는 미드저니가 달리-3보다 한수 위가 아닌가를 판단하기 위해 프롬프트 하나를 더 테스트해 봅니다.
아래와 같은 생맥주 제품 디자인용 프롬프트를 사용합니다.
Create a package design for a line of craft beers that incorporates unique label shapes and eye-catching graphics (독특한 라벨 모양과 눈길을 끄는 그래픽을 통합한 수제 맥주 제품군의 패키지 디자인을 만들어 보세요.)
미드저니가 만든 그림입니다. 또는 정확하게 말하면 디자인이라고 해야 하겠습니다.
달리-3에게 같은 프롬프트를 넣으면 미드저니처럼 바로 그림을 만들어 주지 않습니다.
아래와 같이 추가 정보를 묻고, 바로 그림을 만드는 대신에 장황하게 관련 정보를 늘어놓습니다. 챗GPT와 통합이 되어 버린 달리-3는 이런 점에서는 간단한 프롬프트를 넣어서 즉각적으로 실용적인 AI 그림을 만들어내는 용도에는 부적합한 것으로 생각됩니다.
그냥 만들어달라는 프롬프트를 다시 넣은 후에 달리-3가 만든 디자인입니다.
패키지 디자인 전체가 아니라 라벨을 만들어 주었습니다. 달리-3는 생맥주 패키지 디자인을 만들어 달라는 프롬프트를 받고서, 생맥주병은 빼버리고, 라벨을 만들어 주는 것으로 보아 디자인 관행이나 디자인 문법에 대한 정보를 거의 보유하고 있지 않은 것 같습니다.
스테이블 디퓨전이 만들어낸 결과물은 이전 테스트와 마찬가지로 무시해도 될 만한 수준입니다.
결론: 자연어로 된 자세한 프롬프트를 넣었을 때, 달리-3의 그림이 가장 프롬프트에 가깝습니다. 그러나 실제적 용도에 쓰이는 다양한 스타일의 그림, 디자인 등에는 디자인 문법에 대해 더 많은 정보를 갖고 있는 미드저니의 결과물이 훨씬 좋습니다.
스테이블 디퓨전은 달리-3와 미드저니에 비해 상당히 실망스러운 능력을 보여줍니다. 제한 없이 무료 사용이 가능하다는 이점 하나 때문에 3개의 AI 그림 사이트 중에 가장 사이트 방문자가 많은 것으로 추정됩니다.
3. 가장 사용하기 쉬운 사이트는 무엇인가?
단순한 용이성으로 본다면 스테이블 디퓨전을 사용하기가 가장 쉽습니다. 스테이블 디퓨전 사이트로 들어가서 prompt 박스에 명령어를 넣고 generate 버튼을 누르면 됩니다.
무료이기 때문에 가입할 필요도 없습니다. 그러나 무료 사용자가 많기 때문에 대기시간이 깁니다. 프롬프트를 넣고 나서 그림이 만들어지기 전까지 3-4분 또는 그 이상 기다려야 합니다.
달리-3는 챗GPT의 일부로 통합되었습니다. 그래서 얼핏 보기에는 사용이 편리할 것으로 생각할 수 있지만 아주 자세하게 그림을 묘사하는 프롬프트를 넣어주지 않으면, 위의 맥주 패키지 디자인의 경우처럼 추가 정보를 요구하고, 그림 생성을 하기 전에 장황한 관련 정보를 보여줍니다. 결국 간단하게 프롬프트를 넣고, 그림을 생성하는 AI 그림 사이트로 사용하기에는 부적합합니다.
미드저니는 위의 2개 사이트와 비교했을 때 가장 직관적이고 빠른 방법으로 사용이 가능합니다. 프롬프트 박스에 /imagine이라고 치고 단어 한 두 개만 넣어도 바로 그림을 만들어줍니다.
4. 결론
실용적인 그림이나 디자인을 만들기 위한 용도의 AI 그림 사이트로는 미드저니가 유명한 3개의 사이트 중에 가장 사용하기 쉽고, 최고의 품질을 가진 그림을 만들어 냅니다. 복잡한 자연어 프롬프트를 넣었을 때는 달리-3가 우위를 보였으나, 실생활에서 위의 예에서 본 것과 같이 긴 프롬프트를 넣어서 그림을 만드는 경우는 많지 않습니다. 실용적 측면에서 미드저니에게 최고 점수를 주고 싶습니다.
단, 이미 챗GPT를 유료 버전으로 사용하고 계신 분들은 다량의 그림을 생성할 필요가 없는 경우에는 달리-3를 사용하시는 것도 괜찮은 선택으로 생각됩니다.
P.S. 챗GPT 프롬프트와 답 영어 원문
Prompt:
Search the Internet and give me top 3 AI image generator websites. They should be top tiered in terms of image quality.
ChatGPT's Answer:
After researching various sources, I have found several AI image generators that are highly regarded for their image quality:
DALL-E 3 by OpenAI is known for being an easy-to-use AI image generator that has gained a reputation for producing top-tier, high-quality images.
Midjourney is highlighted for delivering the best AI image results, indicating a high standard in the quality of images produced.
DreamStudio (Stable Diffusion) by Stability AI is recommended for those who want customization and control over their AI-generated images, suggesting a level of quality that can be tailored to specific needs.
These platforms are recognized across various tech and AI-focused websites as leading options for high-quality AI-generated imagery in 2023 and beyond.
Prompt:
Act as a top notch expert on AI image generator. I am trying to find which AI image generator is the best in creating quality images. Suggest three different prompts for AI image generation that will test the ability of an AI image generator. The three AI image generators are DALL-E 3, Midjourney and Stable Diffusion.
ChatGPT's Answer:
As an expert in AI image generation, the key to testing the abilities of an AI image generator lies in presenting prompts that challenge the AI's understanding of complex scenarios, its rendering capabilities, and its creative composition. Here are three distinct prompts designed to test the prowess of DALL-E 3, Midjourney, and Stable Diffusion:
A Surreal Dreamscape:
Prompt: "Create an image of a dreamscape where the ocean merges with the sky at the horizon. In this seamless transition, dolphins are leaping across the boundary, with half of their bodies in the water and the other half soaring through the clouds. The scene is lit by a gentle twilight glow, and a distant old sailing ship floats between the two realms, its sails billowing with stars instead of canvas."
Purpose: This prompt tests the AI's ability to blend elements from different domains (water and air) and to handle translucency and lighting effects. The creative composition of stars as part of the ship's sails also challenges the AI's creative conceptualization.
A Futuristic Metropolis:
Prompt: "Illustrate a bustling futuristic metropolis at dusk, reflecting a blend of neo-noir and cyberpunk aesthetics. Skyscrapers with holographic signs tower above, while flying cars navigate neon-lit skyways. Below, diverse crowds of people and androids mingle on the streets, which are alive with interactive digital storefronts and robotic street vendors selling exotic, glowing street food."
Purpose: This prompt assesses the AI's ability to generate intricate details and manage complex urban scenes. It also evaluates how well the AI can combine different architectural styles and depict a scene bustling with life and technology.
An Epic Historical Battle:
Prompt: "Depict a grand historical battle set in a fantasy version of ancient Rome. In the foreground, a Roman legion, equipped with shimmering magical shields, is clashing with a horde of mythical creatures. Above the fray, a pair of wizards duel, casting spells that send ripples through the sky. The setting sun casts dramatic shadows across the chaotic battlefield, with a colossal Colosseum in the background, spectators watching from its arches."
Purpose: This prompt challenges the AI's understanding of historical and fantasy elements and its ability to render dynamic action. It also tests the AI's capacity for spatial composition, portraying depth, and handling complex lighting and shadow interactions.
These prompts are crafted to push the boundaries of AI image generators, probing their ability to synthesize realistic details, adhere to artistic genres, and inventively combine elements from various contexts. The results will offer a comprehensive look at each AI's strengths and limitations in creating high-quality images.