Zdjęcia generowane przez sztuczną inteligencję – MidJourney

Grafiki generowane przez sztuczną inteligencję to w zasadzie nie są zdjęcia. Zdjęcie – biorąc literalnie to określenie – zdejmuje, a więc rejestruje realny obraz na matrycy lub błonie fotograficznej. Jego zasadniczą cechą jest dokumentalny charakter. Zdjęcie dokumentuje rzeczywistość.

Tej cechy absolutnie nie posiadają ilustracje wygenerowane przez aplikacje sztucznej inteligencji. Ja korzystam z MidJourney, która uchodzi za najlepszą w tej dziedzinie na ten moment.

Jak to działa?

Zapytania do MidJourney przesyła się za pomocą promptów poprzez komunikator Discord. Prompt najsprawniej działa, jeśli jest napisany w j. angielskim (w j. polskim generuje losowe obrazy). Do zapytania można dodać też parametry, takie jak proporcje obrazu. Domyślnie generowany jest kwadrat. Ja najczęściej używam proporcji 2:3 i 3:2, a więc proporcje typowej odbitki fotograficznej.

Świetną cechą generatora SI (AI) jest możliwość określenia stylistyki zdjęcia czy obrazu w odniesieniu do konkretnych klasyków fotografii. U mnie od razu na warsztat poszła Dorothea Lange i Russell Lee. Pisałem o nich niedawno na blogu.

Sztuczna inteligencja świetnie sobie radzi z naśladowaniem stylu popularnych autorów. Ich zdjęcia są dostępne w bogatym wyborze w źródłach, z których korzysta MidJourney. Z mniej popularnymi autorami raczej sobie nie poradzi. Ale Lange i Lee do takich nie należą.

Słynne zdjęcie Dorothei Lange, przedstawiające kobietę z dziećmi, często przewija się w generowanych przez MJ obrazach w formie czasem dalekiej inspiracji. Częściej jednak odniesień do konkretnych zdjęć nie jestem stwierdzić (za mało znam może jej bardzo bogatą twórczość). Zdecydowanie jednak klimat jest nie do podrobienia. No chyba – że narzucimy sztucznej inteligencji inną epokę, inny kraj. Wtedy możemy osiągnąć naprawdę zaskakujące rezultaty.

A więc przejdźmy do zdjęć

Jest coś w tej ilustracji. Jakiś dramat. Napięcie potęguje dym wznoszący się nad zabudową w tle. Młoda dziewczyna rozpacza. To jedna z lepszych grafik, jakie udało się wygenerować. Akurat w tym zdjęciu pobrzmiewa słynna matka ze zdjęć Dorothei Lange. Widać ją w dłoniach przy ustach. A może przesadzam?

Może coś z Polski?

Dalej pozostajemy w klimacie Dorothei Lange, ale tym razem algorytm sztucznej inteligencji miał nam wygenerować coś z lat 90. XX w. i z terenów Polski. W interpretacji Lange jest to jakiś raczej dramatyczny obrazek styranej życiem starszej osoby. Zupełnie jak na jej zdjęciach ze Stanów lat 30.

Teraz może coś bardziej w stylu Russella Lee? Ale w kolorze. Na mnie robi wrażenie da wijąca się w oddali droga. I świetny pastelowy kolor tego samochodu. Mężczyźni ustawieni się w pewien specyficzny sposób, tworząc ciekawą kompozycję grafiki (już miałem napisać „zdjęcia”).

W ten sposób wygląda wynik dla zapytania o ilustrację kobiety w Polski lat 30., ale bez odniesienia do Dorothei Lange (w ogóle bez żadnego odniesienia stylistycznego). Widzimy po prostu kobietę, która rzeczywiście mogła być mieszkanką II RP w czasie, gdy Dorothea Lange wędrowała ze swoim aparatem po polach Kalifornii i Oklahomy.

Portrety

Portret w kolorze w stylu Dorothei Lange – prompt zawierał informację o tym, by portret był wyostrzony na oczach. Realizm fotografii i płytka głębia ostrości robi wrażenie! Nie chce się wierzyć, że to zdjęcie nie jest dokumentem, to znaczy nie odzwierciedla rzeczywistości, osoba, która się na nim znajduje jest wytworem algorytmu SI i nigdy nie istniała.

Jeszcze jeden ciekawy portret – już bez odniesienia do stylistyki D. Lange. Przywidzi na myśl znane zdjęcie Afganki z okładki National Geographic. Ale to nie jest zdjęcie. Ładnie odwzorowano tutaj fakturę skóry i – perfekcyjny fokus na oczy (oko). Nie chcę się wierzyć, że grafika jest efektem kilkudziesięciu sekund pracy silnika MidJourney, w czasie których wygenerował tę unikatową ilustrację.

I jeszcze jedno odniesienie do stylistyki fotografki Dorothei Lange. Zdjęcie ciekawe, ładnie skomponowane, trzymające się w pełni tematyki zdjęć Lange, ale w tym przypadku jednak czuć mocno dotyk cyfrowego artysty.

Jak wyżej. Tutaj poprosiłem dodatkowo o samochody i dzieci. Wszystko się zgadza.

Lange jaką znamy

Po prostu – Dorothea Lange w pełnej krasie!

Odpowiedź sztucznej inteligencji na identyczne zapytanie, jak wyżej. Tym razem wypluła niemal idealne odwzorowanie znanej fotografii. Nie jest to jednak ta fotografia, a niezbyt wyszukana wariacja MidJourney na temat tego zdjęcia. Poniżej oryginał z zasobów Biblioteki Kongresu dla porównania.

Kontynuujmy przegląd nieistniejących zdjęć Dorothei Lange. Również odpowiedź na zapytanie, jak wyżej. Widać MJ nie jest bardzo powtarzalny, co w tym przypadku wydaje się zaletą.

Portret dzieci w stylu Lange. Świetnie odwzorowana ręka, co nie było tak oczywiste we wcześniejszych wersjach algorytmu (grafika została wygenerowana za pomocą wersji 5, wersja 4 jeszcze mocno tutaj kulała).

Podoba mi się głęboka czerń na tej grafice… Świetne! Twarze dzieci jakby wyłaniają się z głębi mroku panującego wewnątrz samochodu.

Portret obiektywem 50mm (ciągle w stylistyce Dorothei Lange).

Obraz wygenerowany na identyczne zapytanie, jak wyżej. 50mm – portret w stylu Lange.

Tym razem prompt zawierał prośbę, by algorytm wygenerował fotografię w stylu Dorothei Lange, ale dodatkowo miał to być Rzeszów. Prawdę mówiąc raczej ten parametr został tutaj zignorowany albo zastosowany w niezauważalny sposób.

Po prostu – grafika w stylu zdjęcia Dorothei Lange. Czy ta kobieta nie ma czegoś ze znanej nam już fotografii matki?

Lubię tę grafikę. Starsza kobieta siedzi wśród namiotów amerykańskich emigrantów za chlebem. Wygląda jak Indianka.

Ta ilustracja ma coś w sobie… Poruszający jest dramatyczny wyraz twarzy dziewczyny.

Tym razem grafika inspirowana fotografiami Russella Lee – dodatkowo przy tworzeniu prompta wspierałem się pomocą ChataGPT, co miało poprawić realizm.

W tym przypadku zapytanie było proste: zdjęcie w stylu Dorothei Lange – Polska, lata 70. XX wieku.

Sztuczna inteligencja i zdjęcia Russella Lee, czyli od Sasa do Lasa

Zapytanie: „foto w stylu Russella Lee”.

Jedno z pierwszych fotografii w stylu Russella Lee, jakie wygenerowałem. Okazało się, że algorytm powędrował w głębokie lata 70. – choć zdecydowanie szukałem raczej klimatu lat 30. Jednak ta grafika ma w sobie coś niezwykłego. Mały przydrożny bar, neony oświetlają klasyczny amerykański krążownik, którego właściciel siedzi może przy stoliku na zewnątrz. Światło i klimat – klasa.

Russell Lee – lata 70. Oto jak sztuczna inteligencja rozumie tego typu proste zapytanie

Russell Lee, 1990s, Poland. No…. chyba dość trafnie oddał temat zapytania.

Chcąc uciec nieco od generowanych przez automat zdjęć z lat 70. na zapytanie o fotografię w stylu Russella Lee, dodałem informację, że ma to być zdjęcie tegoż autora wykonane dla agencji FSA (Farm Security Administration). Była to agencja wsparcia socjalnego dla migrantów ekonomicznych w USA, dla której pracowali zarówno Lee, jak i Lange. Pisałem o tym w artykule o fotografii Dorothei Lange. Nieoczekiwanie algorytm wypluł serię zdjęć z… Aleppo? Może jakiś inny Russell Lee fotografował ten konflikt, ale skąd FSA? Mimo wszystko zdjęcia ciekawe.

Jak wyżej.

I ostatnia fotografia. Tym razem MidJourney nie mógł mieć wątpliwości. Poprosiłem o zdjęcie Russella Lee z lat 30. XX w., jednak w kolorze. Chyba trafnie. Aczkolwiek nie jestem pewien, czy Russell Lee został wzięty jako inspiracja, czy to randomowe zdjęcie z USA lat 30., a imię Russell MidJourney odebrał jako sugestia napisu na szyldach sklepowych.

Myślę, że ta mała galeria pokazuje ogromny potencjał SI. Weźmy pod uwagę, że skupiłem się tutaj jedynie na dwóch nazwiskach, w dodatku zapytania były bardzo powierzchowne, nieskomplikowane.

Jakieś wady?

Mimo wszystko szkoda, że to nie dokument. Charakter generowanych obrazów jest podobny, jak odpowiedzi Chata GPT – w dziedzinie kreatywności najwyższa półka. Wizualnie zdjęcia prezentują się świetnie. Światło zwykle jest najlepsze z możliwych. Niejeden fotograf czy operator filmowy by się go nie powstydził. Jednak faktograficznie efekty nie mają wielkiej wartości. Nie wiemy, czy te obrania, ta architektura, te samochody to rzeczywiste modele, czy nie jakaś losowa wariacja. Zazwyczaj jednak osoby na zdjęciach nie są prawdziwymi ludźmi – poza może przypadkiem, gdy mamy do czynienia z naprawdę powtarzalną twarzą – jak w przypadku słynnej matki z fotografii Lange. W innych przypadkach są to raczej konfiguracje różnych twarzy.

Podobnie sytuacja ma się z Chatem GPT – zapytany o fakty konfabuluje. Ale na kreatywne zapytania daje fenomenalne odpowiedzi. SI zatem obecnie jest rewelacyjnym narzędziem, dającym twórcze rezultaty wysokich lotów. I naprawdę nad wieloma grafikami trudno nie zawiesić się dłużej.

Dodaj komentarz

Witryna wykorzystuje Akismet, aby ograniczyć spam. Dowiedz się więcej jak przetwarzane są dane komentarzy.