Teknoloji ve Hayata dair günceler

Son Yazılar


Kategoriler


Son Yorumlar..


DALL-E Nasıl Kullanılır?

Kemal İKİZOĞLUKemal İKİZOĞLU

Herkese merhaba,

Bugün sizlerle yapay zekada metinden görsele grafik üretimiyle adını ilk duyuran uygulamalardan biri olan DALL-E uygulamasını sizlerle keşfediyor olacağız. Bu uygulama hakkında kısa bir bilgi sonrası nasıl kullanabileceğinizi deneyimliyor olacağız. Dilerseniz hemen başlayalım.

OpenAI ve DALL-E

DALL-E, OpenAI firması tarafından Ocak 2021 tarihinde tasarlanmış, yazılan bir tarif metnini görsele çevirebilen bir yapay zeka uygulamasıdır. Yayınlandığı tarihten bir yıl sonra Nisan 2022’de DALL-E 2 adında yeni bir sürüme geçiş yapıldı. Bu sürümde üretilen görseller daha fotogerçekçi ve dört kat daha iyi ve doğru görseller üretebilir hale getirildi.

DALL-E, özünde, transformatör sinir ağı olarak bilinen bir tür yapay zekadan, özellikle de GPT-3 mimarisinden yararlanır, ancak yalnızca metin yerine metinsel açıklamalardan görüntüler oluşturmak üzere eğitilmiştir.

Dall-E 1 & Dall-E 2 Örneklerinin Karşılaştırılması

Burada önemli olan şeylerden biri ilk defa metinden tarif ederek görsele çevirilebilen fonksiyonel bir uygulama üretebilmekti. Yapay zeka’ya öğretilen sınırsız sayıda veriden bir görsel tarifi oluşturmak için DALL-E’nin ilk sürümü yayınlandı ve insanların kullandıkça olumlu dönütleri daha iyi grafikler oluşturabilme adına DALL-E 2 çalışmalarını hızlandırdı ve Nisan 2022’de yayınlandı.

Bugün DALL-E 3’ün çalışmaları devam ediyor. DALL·E 3, önceki sistemlerimize göre önemli ölçüde daha fazla nüans ve ayrıntıyı anlayarak fikirlerinizi kolayca olağanüstü doğru görüntülere dönüştürmenize olanak tanır. DALL-E 3’e dair araştırma raporuna göz atmak isterseniz buraya tıklayabilirsiniz.

DALL-E ‘ ye Giriş Nasıl Yapılır?

DALL-E uygulaması bir OpenAI ürünüdür. Midjourney uygulamasını Discord üzerinden kullanırken DALL-E uygulamasını web üzerinden kolayca kullanabilirsiniz. Yapmanız gereken https://labs.openai.com adresine girip oturumunuzu açarak kullanmaya başlamaktır. Hepsi bu kadar!

Prompt Girmek!

DALL-E uygulamasında oturum açtığınızda karşınıza prompt dediğimiz oluşturmak istediğiniz görselin detaylarını yazabilmek için bir metin alanı gelmektedir. Buraya gireceğiniz metinin ingilizce olması daha iyi sonuçlar alabilmenize yardımcı olacaktır.

Oluşturmak istediğiniz görselin detaylarını yazıp Generate dediğinizde yazdığınız metne ait dört farklı görsel oluşturulacaktır. Bu oluşturulan görseller aynı zamanda ekranın sağ bloğunda yer alan “Geçmiş” alanına gelmektedir. Daha sonrasında buradan direk tıklayarak ilgili görseli kullanabilirsiniz.

Oluşturduğunuz görsellerden birini seçtiniz ve indirmek istiyorsunuz. Üzerine tıkladığınızda yukarıda gördüğünüz gibi tek sayfa açılıyor ve buradan görseli indirebilirsiniz. İsterseniz görselinizi paylaşabilirsiniz.

Bunun için önce görseli yayınlamanız gerekiyor ve bunun için yayınlama izni vermeniz gerekiyor. Daha sonrasında kullanabiliyorsunuz.

Variations” – Varyasyonlar butonuna tıkladığınızda orijinal resmin üzerinden alternatif görseller üretmeye başlıyor. Yine sizlere ilişkili dört görsel tavsiyesi veriyor. Eğer hoşunuza giderse varyasyonlardan biri ile devam edebilirsiniz.

Hadi Görseli Tamamla!

Edit butonuna tıkladığınızda seçtiğiniz resim için heyecanlandırıcı araçlarla karşılaşıyorsunuz. Bu heyecanlardan biri de görsel tamamlama aracıdır. Sayfanız açıldığında ekranın alt kısmındaki araçlarda soldan dördüncü olan kare seçim aracını aldığınızda resmin devamını üreteceği alanı belirlemenizi istiyor. Ben görselin üst kısmını üretmek istedim. Karemi oraya sürükledim ve üstte yer alan “Generate” butonuna tıkladım.

Üst kısım sadece siyah alandan ibaret olduğu için orasını sadece siyah olarak yüksekliğini arttırdı. Görselin başka bir alanı üzerinden ilerlemek istedim. Yeni bir kare ile kuyruk ve ayak kısmını uzatmak istedim. Alanımı belirledikten sonra yeniden “Generate” butonuna tıklıyorum. Atın kuyruk ve ayak kısımlarını benim için üretiyor ve yine sağ-sol oklarla siz ürettiği tercihler içerisinden beğendiğinizi “Accept” diyerek ana görselinize dahil edebilirsiniz.

Görselinizin düzenlemesini tamamladıktan sonra sağ üstten indirme butonuna tıklayarak bilgisayarınıza indirebilirsiniz.

Görsel Hatalı Mı?

Fotoğraflara dikkatli baktığınızda bazı hatalı noktaların olduğunu fark edeceksiniz. Yukarıdaki atın üzerindeki astronot fotoğrafında atın gözlerinin olmadığını fark ettiniz mi? Detaylara biraz daha yakından bakalım:

DALL-E’den bir bilgisayar sınıfı görseli oluşturmasını istedim. Bu görseli oluşturduktan sonra kişinin burun yapısı, gömleğin yaka kısmı, klavye, el ve parmak yapısı, klavye kısmındaki detaylar biraz karmaşık ve anlamsız göründüğünü fark ettim. Tabi bu eğlenceli olabilir fakat metinden görsel üreten bir uygulama için oldukça iyi ilerleme!

Aynı şekilde üretilen bir başka resimde ise parmaların farklılığı ve işaret parmağının ekranın içerisine girmesi, yüz şekillerinde olan farklılıklar görseli ilk gördüğünüzde dikkatinizi çeken noktalar olmuştur.

DALL-E 3

DALL·E 3’ü ücretsiz kullanıcılar maalesef şu an kullanamıyorlar. Bu sürümü tüm ChatGPT Plus ve Enterprise kullanıcıları kullanabiliyor ve bu sonbaharın sonlarına doğru da API aracılığıyla ve Labs’da kullanıma açılacak.

DALL-E Ücretsiz Mi?

DALL-E uygulaması ilk kayıt olduğunuzda 50 kullanımlık ücretsiz resim üretme hakkınız bulunuyor. Kullandıkça bu sayı azalıyor. Bittiğinde ne olacak peki? Hakkınız bittiğinde bu uygulamayı ücretsiz olarak kullanmaya devam etmek isterseniz bir sonraki ayı beklemeniz gerekecek ve yeni ayda 15 bakiye hesabınıza yükleniyor olacak.

Ücreti Nedir?

Eğer uygulamayı sevip kullanmaya devam etmek isterseniz yeni kredi almanız gerekecektir. 115 kredi için 15$, 230 kredi için 30$ ücreti bulunmaktadır. Tabi bu sayıyı biraz arttırdım ve maksimum olarak 11,500 kredi satın alabiliyorsunuz. Bu da 1500$’a tekabul ediyor. 🙂

Özetle

DALL-E uygulamasını kullanarak aylık 15 tane ücretsiz yapay zeka ile oluşturulmuş görseller oluşturabilir, varyasyonlar isteyebilir, görsel üzerinde tamamlama işlemleri gerçekleştirebilirsiniz. Üstteki görseli oluşturabilmek için ciddi bir zaman alacağını gördüğünüz bu noktada ifade ederek bir görsel oluşturmak gelen güncelleştirmemer ile daha mümkün hale geliyor. Yapay zeka ile ilgili yazdığım diğer yazılara ulaşmak için buraya tıklayabilirsiniz. ChatGPT ile Nasıl Ödev Yapılır?” yazıma ulaşmak için buraya tıklayabilirsiniz.

Bir sonraki yazımda görüşmek dileğiyle..

Kaynaklar:
https://www.datacamp.com/blog/what-is-dall-e
https://openai.com/dall-e-2
https://openai.com/dall-e-3
https://cdn.openai.com/papers/dall-e-3.pdf

Eğitim ve teknoloji haberlerini, ilginç ve önemli bilgileri, kendimi geliştirdiğim alanlardaki öğrendiğim tecrübelerimi blogumda paylaşıyorum. Öğrenmekten ve paylaşmaktan zevk alıyorum.İnandığım bir şey var ki istisnalar hariç, hiçbir şey imkansız değildir. Mucizeler için zaman gerekir! Bu benim yaşam felsefem.

Yorumlar 0
İlk yorumu yazmak ister misin?