-
OpenAI 달리2(Dall-E2) 사용하여, 간단히 블로그 이미지 만들기.코딩/AI, 통계 2023. 6. 7. 21:23반응형
요즘 ChatGPT, Dall-E , Stable-Diffusion 등 다양한 AI 도구들이 쏟아지고 있습니다. 이런 도구들을 잘 활용하는 것이 생산성 향상에 직결되는 시대가 되었습니다. 이번 글에서는 Open AI의 이미지 생성 도구인 Dall-e2의 사용방법에 대해서 알아 보도록 하겠습니다.
달리(Dall-E 2)를 이용해 이미지 생성하기
Dall-E2는 OpenAI에서 만든 이미지 생성엔진입니다. 이미지를 묘사하는 Text를 입력하면 여러 가지 이미지를 생성합니다. 이번 포스팅의 주요 주제는 아래와 같습니다.
1. AI 이미지 생성엔진, Dall-E2란?
2. Dall-e 2 가입 및 사용 방법은?
3. Dall-e 는 어떻게 이미지를 생성하는가?
4. Dall-e 이미지 생성 prompt 예제
5. Dall-e에서 생성된 이미지 저작권은?
6. 그 밖에 이미지 생성 AI 엔진은 어떤 것이 있는가?
AI 이미지 생성엔진, Dall-E2란?
DALL-E는 OpenAI의 GPT-3 언어 모델을 기반으로 한 이미지 생성 AI입니다. 이는 GPT-3를 변형하여 이미지를 생성할 수 있도록 만든 것입니다.
GPT-3는 텍스트 데이터로부터 패턴을 학습하는 자연어 처리 모델입니다. 이러한 패턴 학습 능력을 이용하여 GPT-3는 입력된 텍스트를 기반으로 문장을 생성할 수 있습니다. 그런데 이러한 아이디어를 한 단계 더 발전시켜, 이미지 데이터에 적용한 것이 바로 DALL-E입니다.
DALL-E는 텍스트 프롬프트를 입력받아 이에 대응하는 이미지를 생성하는 능력을 가지고 있습니다. 예를 들어, "하늘색 펭귄이 초록색 신발을 신고 있습니다"라는 프롬프트를 입력하면, DALL-E는 이에 대응하는 이미지를 생성할 수 있습니다.
DALL-E의 중요한 특징 중 하나는 이 AI가 상당히 창의적인 이미지를 만들어 낼 수 있다는 점입니다. 실제로, 이는 종종 현실에서는 존재하지 않는, 또는 매우 비현실적인 이미지를 만들어낼 수 있습니다. 이는 DALL-E가 텍스트 프롬프트에서 일어날 수 있는 다양한 시나리오와 개념을 이해하고 이를 이미지로 표현할 수 있다는 것을 보여줍니다.
또 다른 중요한 특징은 DALL-E가 이미지의 스타일, 구조, 컬러 등을 변경하는 데도 뛰어나다는 것입니다. 예를 들어, "바나나 형태의 의자"라는 프롬프트에 대응하는 이미지를 만들어 낼 수 있으며, 이런 종류의 창의적인 요청에 대응할 수 있습니다.
DALL-E는 이미지 생성에 대한 새로운 가능성을 보여주는 동시에, 그것이 이용될 수 있는 다양한 방법에 대해 생각해 볼 기회를 제공합니다. 예를 들어, 이를 이용하면 아이디어를 시각화하거나, 또는 새로운 디자인을 탐색하는 데 활용될 수 있습니다. 또한, 교육, 연구, 엔터테인먼트 등 다양한 분야에서의 응용이 가능할 것으로 예상됩니다.OpenAI Dall-E2 가입 및 사용 방법은?
Dall-E2는 아래 링크에 들어가면, 쉽게 이용할 수 있습니다.
간단한 가입 절차를 거치면, 아래 Dall-E 페이지로 접근할 수 있습니다.
ChatGPT와 비슷한 심플 UI가 눈에 들어옵니다.위에 붉은색으로 표시된 영역에 text를 입력하고, generate 버튼을 클릭하면 4장의 이미지를 생성합니다.
하나의 프롬프트에 1크레딧이 필요하지만,
최초 가입자에게 기본 크레딧을 제공하여, 공짜로 이미지를 생성해 볼 수 있습니다.다만, chatGPT 같이 계속 사용할 수는 없고, 일정 갯수를 초과하면 추가 크레딧을 구매해야 합니다.
$15에 115 크레딧을 살 수 있고, 1크레딧 당 하나의 프롬프트를 요청할 수 있습니다.
하나의 프롬프트에 4장의 이미지를 생성할 수 있으니..$15에 총 460장 정도 생성할 수 있군요. 대량으로 쓰기에는 그리 저렴한 가격은 아닙니다.
Dall-E2 에서 어떻게 이미지를 생성하는가?
DALL-E 2는 사용자로부터 입력받은 문장을 이해하고, 해당 문장을 시각적으로 표현하는 이미지를 생성합니다. 이 과정은 다음과 같이 진행됩니다.
- DALL-E 2 웹사이트에 접속합니다.
- 상단 우측의 "Log In" 버튼을 클릭합니다.
- OpenAI 계정 정보로 로그인합니다.
- 이미지를 생성하고자 하는 문구나 문장을 입력하고, "Generate" 버튼을 클릭합니다.
- DALL-E 2가 입력된 문구를 바탕으로 이미지를 생성합니다.
"generate" 창에 프롬프트를 입력하면, DALL-E 2 엔진이 해당 문구와 매칭되는 이미지를 생성합니다.
안타까운 점은 이미지 생성 명령 prompt를 영어로 입력해야 한다는 점입니다. 하지만, 간단한 구글링을 통해서 많은 예제를 찾을 수 있으니, 이미지 prompt 만드는 것이 어렵지는 않을 것입니다.예를 들어, "a chair shaped like an avocado"라는 문구를 입력해 보겠습니다.
그러면 아래와 같이 이미지를 생성하는 창으로 넘어갑니다. 한 장의 이미지를 만드는데, 제법 시간이 소요됩니다.자, 1~20초를 기다리면 "아보카도를 닯은 의자 모양"을 만들어 줍니다.
어떻게 이미지가 그럴 듯 한가요? ^^
Dall-E2로 특정 이미지와 유사한 이미지 생성하는 방법
Text 뿐만 아니라, 특정 이미지와 유사한 이미지 생성도 가능합니다. 아래는 전기 비행기 이미지인데요. 이 비행기와 유사한 형태의 이미지를 Dall-E2를 이용해 생성해 보겠습니다.
Dall-E 입력창에 보이는 upload를 클릭하여, 이미지를 등록합니다.
이미지 업로드한 이후에 Generate variations을 클릭합니다.
짠,, 이런 이미지를 생성해주는데, 사실 별로 비슷한 그림은 아니군요 ^^;;
인공물은 좀 괜찮은데, 음식 같은 것은 조금 이상한 이미지도 만들어 낸답니다.
Dall-E2 프롬프트 예시
Dall-E2를 비롯한 이미지 생성엔진의 최대 단점은, 영어로 prompt를 생성해야 한다는 점입니다.. 하지만 구글 번역과 몇 가지 예시를 공부하면, 누구나 쉽게 프롬프트 작성이 가능합니다. 여기서 몇 가지 예시를 들어 보겠습니다.
1. "Victorian-style mansion at sunset with a lush garden in the foreground."
이 명령어는 AI에게 명확한 스타일(Victorian-style), 구체적인 시간(해질녘), 장소(정원이 있는 저택)에 대한 정보를 제공합니다. 이로써 AI는 해당 디테일을 바탕으로 이미지를 생성합니다.
2. "A futuristic cityscape at night under a purple sky with neon lights reflecting on wet streets."
이 명령어는 AI에게 특정한 시간(밤), 색상(보라색 하늘, 네온 빛), 그리고 추가적인 요소(빗길에 반사되는 네온 빛) 등을 통해 미래적인 도시 풍경을 그려달라는 지시를 제공합니다.3. "A tranquil beach scene with turquoise water, white sandy beach, and a family of dolphins playing in the distance."
이 명령어는 AI에게 특정 장소(해변), 색상(청록색 물, 하얀 모래), 그리고 원하는 요소(놀고 있는 돌고래 가족) 등을 통해 아름다운 해변 풍경을 그려달라는 지시를 제공합니다.이러한 구체적인 디테일은 DALL-E 2가 원하는 이미지를 더 정확하게 생성하는데 도움이 됩니다. 하지만, DALL-E 2의 생성 능력은 이론적으로 무한하므로, 더욱 복잡하고 독특한 요청도 가능합니다. 이는 DALL-E 2가 사용자의 창의력을 제한하는 대신 확장하는 역할을 한다는 점을 보여줍니다.
좀 더 자세한 프롬프트를 사용한다면,
DALL-E의 능력을 극대화하기 위해, 굉장히 상세하고 특정한 요구사항을 포함하는 이미지 프롬프트를 생성하는 것이 가능합니다. 아래는 그러한 예시입니다:
"A tranquil, serene beach scene on a sunny afternoon. The crystal clear turquoise water gently laps against the fine white sandy beach. The beach is lined with palm trees, their leaves rustling in the gentle breeze. A family of dolphins is playfully leaping from the water in the distance, their bodies gleaming in the sunlight. A few beachgoers are leisurely strolling along the water's edge, leaving footprints behind in the sand. Offshore, a sailboat lazily drifts by, its sail billowing in the wind.""화창한 오후의 고요하고 평온한 해변 풍경. 수정처럼 맑은 청록색 바닷물이 고운 백사장을 부드럽게 감싸고 있습니다. 해변에는 야자수가 늘어서 있고 잎사귀가 산들바람에 바스락거립니다. 멀리서 돌고래 한 가족이 햇빛을 받아 반짝이는 몸으로 물속에서 장난스럽게 뛰어오르고 있습니다. 몇몇 해변가 사람들이 모래에 발자국을 남기며 물가를 따라 여유롭게 산책하고 있습니다. 앞바다에는 요트 한 척이 바람에 돛을 휘날리며 유유히 지나갑니다."
Dall-E에서 생성된 이미지 저작권은?
DALL-E 2가 생성한 이미지의 저작권에 대한 문제는 아직 정리가 되지 않은 복잡한 문제입니다. AI가 만든 작품의 저작권이 누구에게 속하는지, 그리고 보호된 저작물에서 파생된 이미지가 저작권 침해에 해당하는지 등이 논란의 여지가 있습니다. 따라서, DALL-E 2를 사용하여 생성된 이미지를 상업적 목적으로 사용하려면 주의가 필요합니다.
생성 이미지가 기존 저작권 이미지를 기반으로 학습했고, 저작권이 존재하는 캐릭터등을 의미하는 프롬프트를 사용했다면 이미지 사용에 상당히 주의를 기울여야 합니다.
아래는 관련 이슈를 다룬 기사인데요. 한 번 읽어보시기를 권장합니다.
https://www.aitimes.com/news/articleView.html?idxno=145944
그 밖에 이미지 생성 엔진은?
생성형 AI 전성 시대입니다. Dall-E 외에 다양한 이미지 생성 AI가 출시되고 있습니다. 아래는 대표적인 이미지 생성 AI입니다.
https://stability.ai/stablediffusion
마무리
이상 그림그려주는 AI, Dall-E에 대한 포스팅이었습니다.
반응형'코딩 > AI, 통계' 카테고리의 다른 글
최고의 번역툴, Deepl 서비스 이용 방법 및 국내 출시 일정 (0) 2023.08.18 ChatGPT 대체할 AI 플랫폼 Top 5 (0) 2023.07.25 생산성 향상을 위한 chatGPT 업무용 프롬프트 Best 5 (0) 2023.07.24 Chat GPT로 미국 스타트업 재무재표 분석해보기 (0) 2023.06.04 Andrej Karpathy의 State of GPT 강연 후기 (0) 2023.06.03