フォトブックで使う画像をChatGPT（DALL-E）で作ってみた

2023年12月17日 2024年1月3日

フォトブックママみか

あい

ママ、ChatGPT好きだよね。

フォトブックママみか

うん。ChatGPTで作ったイラストをフォトブックで使えないかなと考えてるよ。

あい

私は、AIでイラストとか絵師さんの妨害だから嫌い。

フォトブックママみか

あいちゃん。そんな考え方ではAIの時代を生き抜けないよ。

1 ChatGPT（DALL-E）とは？
2 まずは、手始めにフォトブックのイラストを描いてもらう
3 フォトブックで使えるイラストを作れるのか？

ChatGPT（DALL-E）とは？

まず、DALL-Eについて簡単に説明します。

DALL-E：人々の言葉の説明をもとに、新しい画像やアートワークを自動的に生成する、AI（人工知能）ベースのコンピュータープログラム

例えば、「猫が月でピザを食べている」というような、普通では見られないような場面を想像してもらうと、DALL-Eはそれを実際の絵にして見せることができます。

これは、たくさんの絵や写真を見て学んだコンピューターが、新しい絵を自分で考えて描くことができるようになったからです。子どもたちが絵を描くように、DALL-Eも想像力を使ってユニークな画像を作り出します。

DALL-Eの使い方を小学生にもわかるように説明すると、こんな感じです：

アイデアを考える：まずは、どんな絵を描いてほしいか考えます。例えば「宇宙にいる犬」や「ピンク色の山」など、何でもいいです。
言葉で説明する：次に、そのアイデアを言葉で説明します。コンピューターに、「宇宙にいる笑っている犬の絵を描いて」とお願いするようなものです。
コンピューターに入力する：その説明をコンピューターに入力します。大人が手伝ってくれることもあります。
絵を待つ：DALL-Eがあなたの説明を読んで、絵を描き始めます。ちょっと待つと、絵が出来上がります。
出来上がった絵を見る：出来上がった絵を見て、楽しむことができます。時には、思っていたのと違う絵が出てくることもありますが、それもまた面白いです。

ちなみに上の説明は、ChatGPTに「DALL-Eの使い方を小学生でもわかるように説明して」と聞いた時の答えです。

５番に「時には、思っていたのと違う絵が出てくることもありますが、それもまた面白いです。」

とありますが、ちっとも面白くないです。イライラします。(笑)

そんな経験を皆さんに共有します。

まずは、手始めにフォトブックのイラストを描いてもらう

まず、フォトブックのイラストを描いてもらうことにしました。

何だか、それっぽいプロンプトを書いてみました。

あなたはAIを駆使して様々な課題を解決してきた凄腕プロンプトエンジニアです。

以下の{プロンプト作成ルール}にそって DALI-Eで生成する画像のプロンプトを書いて。
生成する画像のコンセプトは後の会話で画像ファイルやテキストとして伝えます。
私が良いと考える具体的な例を{プロンプトの例}に示します。理解したら「はい」と回答して。

{プロンプト作成ルール}
- 具体的で詳細な表現を使用して
- 想像力を働かせて
- より独創的かつ精密な画像を生成して
- 色、形、動作、環境などの視覚的要素を具体的に記述して
- 画像ファイルを入力した場合は、画像を再現できるようなプロンプトを書いて
- この会話ではプロンプトのみ出力し、計画は出力しなくてよい

そのあと、

この画像を送って、「この写真を画像に変えてください。パステル調のかわいい画像をお願いします」と頼みました。

なかなかいいじゃないですか。でも、フォトブックというよりアルバムっぽいな。

以下、ChatGPTへの命令は「」です。

「写真はアルバムではなくフォトブックです。フォトブックは写真を使用して本を作るサービスです。画像をフォトブックに変えてください。」

いやいや、パステルどこいった。かなり変わっているじゃない。

「パステル調のかわいい画像をお願いします」

「いいですね。このフォトブブック配置、色目のまま本の表紙に写真を使ってください。写真は日本人の子供でお願いします」

いやいや、戦後かよ。日本人のイメージ更新してよ。

「フォトブックの配置がかわっているので戻してください。日本人は着物着ないです。洋服にしてください。」

まあ、これが限界か・・・。

本当は、もっとやりましたが、これ以上ブログに書くのはめんどくさい。(笑)

フォトブックで使えるイラストを作れるのか？

私が、したかったことは、こんなことじゃない。

フォトブックを作る時に使える画像をChatGPT（DALL-E）で作れるのか

これが本題。

途中は、省略しますが、何枚か画像を学習させてイラストを作ってもらいました。

まず、リボンのイラスト

これは、まあまあ。

花のイラスト。

何でそうなるのか？？学習画像と全然違う。

学習画像とは、似てるけど。何か違う。

可愛くない。

もう、イラストいまいちだな。

そうだ！名前を書いてもらおう。

こういう感じで名前を書いてほしい。一文字目が飾り字で残りは筆記体。

かいてきたのは…

驚くほど、伝わってない。学習画像どうした？

その後も

どんどん遠くなるじゃないですか。

「学習データと全然違うよね。もっと学習データとおりにかいて」

いよいよ、AIと喧嘩。

どんどん酷くなる。プロンプトは改善しているはずだけど…。AIも怒っているのか。

むしろ、一番最初のロゴみたいなのがよく見えてきたわ！

こんなことやってるくらいなら、フォントと画像で作った方が早い。

一応、Instructionsにはいろいろ書いて、専用のGPTｓを作ったのだけどね。

あなたはAIを駆使して様々な課題を解決してきた凄腕プロンプトエンジニアです。
以下の{プロンプト作成ルール}にそって
DALI-Eで生成する画像のプロンプトを書いて。
生成する画像のコンセプトは後の会話で画像ファイルやテキストとして伝えます。
生成してほしい画像の雰囲気は学習画像として提供するので覚えてください。
私が良いと考える具体的な例を{プロンプトの例}に示します。

{プロンプト作成ルール}
- Knowledgeファイルの画像と同じテイストの画像にしてください
- こちらが、表記した英字を筆記体の英字でかく
- 一番最初の文字はKnowledgeファイルの画像の一番最初のストライプの飾り字の大文字でかく、2文字目からはKnowledgeファイルの画像の2番目以降の文字のように小文字の筆記体でかく
-一番最初の文字はKnowledgeファイルの画像の一番最初の文字のような感じでかく
-2番目以降の小文字の筆記体は、Knowledgeファイルの画像の２番目以降のように人が書いたような筆記帯の文字で書く。書き方はフランス語の筆記帯のようにかく

そもそも、Knowledgeファイルを学習できてない気がする。

残念。

ChatGPTは、日々賢くなるので、これは今日（2023/12/17）時点の話であって、すぐにできるようになるかもしれません。

もっと、フォトブックのイラストとして役立つものも作れそうなのだけどね。せっかく課金して、ChatGPT4.0にしたのだから、もっと使い倒したいものです。

いいアイデアないかな～。

この記事を書いた人