今回は、DALL-E3やCreate.xyzについては詳しくは触れません。ある程度わかる方には参考になる話かと思います。

まず、CopilotのDALL-E3で1024×1024でしか生成出来ないため、Create.xyzでDALL-E3が使えるようになってたよな?ってことでCreate.xyzでDALL-E3を使ったアプリ・Webサイトを作ることに。ですが、かなり苦戦をしいられました。

Create.xyzを使ったことがある方は共感してもらえる話だと思いますが、更新するたびに結果が変わってしまうことが難点であります。が、プロンプト指示だけでサイト・Webアプリが作れるのは誰でも比較的に簡単に触ってい貰えるサービスとなってます。

注意点として、プロンプトを削除してもサイトの一部や機能が削除されるとは限りません。が、削除できないことがある「バグ?」的なのを生かして生成をすると言う高度なテクニックもあったりします。

Create.xyzの特徴してGPT-4だけでなくGeminiなど様々なモデルで制作出来るため結果の違いを楽しむことも出来ます。GPT-4でダメでも他のモデルなら実行できたってこともあるでしょう。

トークン数の関係っで実行しきれなかったり、更新するたびに結果が変わるために、今まで実行できたのに実行できなくなったということも良くあることです。プロンプト指示で作業出来るだけあって答えがあってないようなサービスなのだから

今回は、DALL-E3の拡張にあたり かなり苦戦ししました。上手く行かなくなったりプロンプトを作り変えてやり直すなどで似たようなコンポーネントをいくつも作って試した格闘劇を御覧ください。まだまだ始めたばかりので納得行く完成は出来てません。が、何かの参考とアイデアなどいただけたら幸いです。

現状実行出来なかったこと

・生成した画像一覧(繰り返し作業している中で、奇跡に実装出来ましたが再現する自信ありませんw) ・シード値設定(実装は出来たけど機能してない?) ・ネガティブプロンプト(設定はできるものん・・・) ・インペイントで描き替え ・スマホゲーム風ガチャUIでの画像生成 ・対話での描き替え ・生成後の保存を1024✕1024以外で行いたい(全身で生成したい) ・画像サイズの指定(表示のみ成功。)

実行出来たこと(不安定な場合あり)

・スタイの指定(GPT-4oでコード生成からは成功しましたが、数回数十回に1度はスタイルを無視しますw)追加:プロンプト指示でもスタイル設定出来てましたw ・顔の固定(比較的に1つ前の生成を元に生成させてくれることは成功しました。) ・画像読み込みでスタイル固定(意外とイケてると思います。) ・ランダムなプロンプト(ランダムなプロンプトを裏で一覧可は厳しい?)

望みも含めて調査も含めて確認を行いました。

プロンプト指示とGPT-4oでのコード生成の2パターンで作業を行いました。

結果と結論だけを先に言いますと、圧倒的にGPT-4oでのコード生成して反映させて実行した方が良い結果が得れましたが、更新していくという面ではCreate.xyzの特徴も考えると不便だなって感じてます。できれば、プロンプト指示だけで公開出来るものを作り上げたいと考えております。

いくつも試したコンポーネントによって多少実行出来た機能も異なる部分があるため安定した拡張したDALL-E3の公開へ程遠いと感じてます。