Open AIの「Point-e」を用いてテキストより3D描画してみます。テキストだけの情報量で3D描画が作成できてしまうのです。AIの学習量が半端ではないのかもしれません。
資料はこちら → Point-eその2
p.1 昨日同様のGoogleのCoraboratoryを起動後、「#パッケージのインストール」「#パッケージのインポート」「#モデルの準備」「#サンプラーの準備」「#テキストの準備」「#推論の実行」のコードを書き込んでいきます。画像の代わりに今回はテキストを用います。先ずは「a red motorcycle」とします。
p.2 「#3ポイントクラウドの表示」を含めすべてのコードを実行すると、赤いバイクの3D描画が現れました(左図)。テキストに「MARIO」を入れてみました。 マリオ様の3D描画ができました。
p.3 皆さんも、テキストをいろいろ変えてみましょう。左図は「ゴジラ」、右図は「バナナ」です。ゴジラは猫のようにしか見えないですし、バナナも言われてみればバナナかなという感じです。 情報量が多過ぎても少なすぎても上手く描けないのでしょう。本物らしさをどのようにAIの中で検証していくか? そのアルゴリズムが問われるのだと思います。