我的長篇歷史小說《百年陸沈》三部曲中,最重要的場景,是半山堂,我用一段簡短描述加一張平麵示意圖,請Google AI Gemini、X AI Grok、Open AI ChatGPT製作圖片,三家的表現大不相同。
Gemini完全按照我的描述和示意圖,給出一張草圖,經過修改一些細節後,就得到這張,雖然不完全準確,但大意是這樣了,尤其是氛圍感把握得非常好,中國西南川黔邊山區雲遮霧繞的濕潤氣息,熱量充沛土地肥沃生長出來的茂盛林木,烘托出半山堂的氣勢,十分貼合我作品的氣氛。
不到兩天時間,Gemini給我改了六十多張圖,不厭其煩,態度極好,有時候我都想算了,它還不辭辛苦地給我發圖。
雖然改圖有些波折,但是顯然做圖還是Gemini最好,同樣指令給Grok,要麼給出歐洲城堡,要麼給出中國宮殿,環境也與川黔邊無關,失之千裏,完全沒有修改的可能;給ChatGPT,好幾次纔給出圖,不倫不類,形狀不規則的外牆,隻是單薄的牆,不是我描述的那種可以走人巡邏的莊牆,其中密密的大排房,既不是中國式院落,也不是歐洲城堡,環境倒是有點接近;而Gemini第一次就給出合適的草圖,我一看就知道可以改出最接近的圖來。
在Gemini得到滿意的圖片後,一定要點一下圖片-圖片右上角出現下載標識-點標識下載原尺寸,這樣纔能得到一張1024x1024的大圖,如果隻是長按圖片-儲存到照片,隻能得到一張512x512的小圖。