DALL·E 2 - Nowa technologia, która tworzy cyfrowe obrazy z tekstu

Widziałeś już na Twitterze śmieszne obrazki z dziwnymi słowami napisanymi obok nich? Te obrazy zostały stworzone przez oprogramowanie DALL-E 2. Jest to program sztucznej inteligencji, który zamienia Twoje słowa w specjalny nowy język, a następnie tworzy z niego realistyczne obrazy. Całkiem ekscytujące, prawda? Oto wszystko, co musisz o tym wiedzieć.

Co to jest DALL-E?

DALL-E to nowa sztuczna inteligencja. To oprogramowanie, które zamienia Twoje słowa w obrazy i dzieła sztuki. Użytkownicy mogą po prostu wkleić tekst w języku angielskim, a sieć neuronowa wygeneruje z niego obraz. Narzędzie zostało opracowane przez wspierany przez Microsoft startup OpenAI i jest zasilane technologią Google Imagen. Na razie opis DALL-E na stronie OpenAI stwierdza, że ​​jest to „nowy system sztucznej inteligencji, który może tworzyć realistyczne obrazy i rysunki na podstawie opisu w języku”.

DALL-E może tworzyć nawet najbardziej niesamowite zdjęcia: na przykład "Misie kupują artykuły spożywcze w starożytnym Egipcie”. W styczniu 2021 OpenAI wprowadził DALL-E, który był pierwszą wersją tego oprogramowania. Teraz powstała mądrzejsza i nowsza wersja - DALL-E 2.

Twórcy programu mówią: "DALL-E 2 da ludziom możliwość kreatywnego wyrażania siebie. DALL-E 2 pomaga nam również zrozumieć, w jaki sposób zaawansowane systemy sztucznej inteligencji widzą i rozumieją nasz świat, co ma kluczowe znaczenie dla naszej misji tworzenia sztucznej inteligencji, która przynosi korzyści ludzkości”.

Jak działa DALL-E?

DALL-E to sieć neuronowa wyszkolona przez OpenAI do generowania obrazów z tekstu. Potrafi łączyć niezwiązane ze sobą pojęcia i tworzyć antropomorficzne wersje zwierząt i przedmiotów. DALL-E współpracuje z komputerowym systemem wizyjnym CLIP, który OpenAI wprowadził w zeszłym roku. Sieć neuronowa tłumaczy ludzki język na jego własny język i dopiero potem zamienia go w obrazy.

Doktor informatyki Yannis Daras zamieścił na Twitterze przykłady tego, co nazwał "własnym językiem sztucznej inteligencji”: "Apoploe vesrreaitais oznacza ptaki” – napisał na Twitterze Daras. "Contarra ccetnxniams luryca tanniounons” oznacza "robaki lub szkodniki”.

Interfejs DALL-E jest prosty: znajduje się pole tekstowe, w którym użytkownik może wkleić tekst, oraz przycisk do rozpoczęcia konwersji i obraz tuż pod nim. Twórcy wyjaśniają, jak działa DALL-E 2: "Program wykorzystuje proces zwany 'dyfuzją', który zaczyna się od wzoru losowych kropek i stopniowo zmienia ten wzór w obraz, ponieważ rozpoznaje pewne aspekty tego obrazu”.

W tej chwili nowa wersja DALL-E jest dostępna tylko dla niewielkiej grupy osób w celu nadużywania programu, co może zaszkodzić użytkownikom. Możesz jednak dołączyć do listy oczekujących wyjaśniając, dlaczego i w jakim celu chcesz przetestować program, a być może programiści zapewnią Ci wczesny dostęp.

Oprogramowanie zostanie wkrótce dodane do interfejsu API, aby zewnętrzni programiści mogli z niego korzystać. W międzyczasie możesz wypróbować wersję DALL-E Mini, która również tworzy obrazy z tekstu i jest open source. Chociaż czasami ta wersja zawiesza się z powodu dużej liczby żądań.

Zdjęcie: © Open-AI.

Treści, które ukazują się w serwisie CCM powstają we współpracy z ekspertami IT i pod kierownictwem Jeana-François Pillou, założyciela CCM.net. CCM to serwis o nowych technologiach - jeden z największych na świecie, dostępny w 11 językach.
Ten dokument zatytułowany "DALL-E 2 - Nowa technologia, która tworzy cyfrowe obrazy z tekstu" opublikowany przez CCM (pl.ccm.net) jest udostępniany na licencji Creative Commons. Możesz kopiować i modyfikować kopie tej strony, na warunkach określonych przez licencję i wymienionych w niniejszym tekście.