Dłoń trzymająca smartfon z logo Facebooka na ekranie, w tle rozmyte logo firmy Meta.

ImageBind od Meta to AI generujące obrazy, które działa bardziej po ludzku

2 minuty czytania
Komentarze

ImageBind to nowe narzędzie od Meta, które pozornie jest kolejnym generatorem obrazów opartym na sztucznej inteligencji. Jednak według opisu przedstawionego przez twórców znacznie się różni od pozostałych rozwiązań tego typu, które są dostępne na rynku, gdyż w swoich działaniach jest bardziej… ludzka. 

ImageBind generuje obrazy prawie jak człowiek

ImageBind

I nie, nie chodzi o to, że używa pędzla i farb do obrazów, albo ołówka do szkiców czy popularnych programów graficznych. Obraz jest generowany przez samo AI, jak do tej pory. Jednak ImageBind ma inne podstawy jego generowania. Tu jednak się zatrzymajmy i wyjaśnijmy sobie, jak w ogóle sztuczna inteligencja generuje obrazy? W dużym skrócie: są jej dostarczane dane wejściowe pod postacią wielu obrazów, które AI przetwarza i na ich podstawie tworzy swoje własne. 

Ktoś złośliwy mógłby stwierdzić, że to zupełnie tak, jak uczniowie szkoły artystycznej i oczywiście miałby w dużej mierze rację. Jednak ludzie, poza przetwarzaniem już znanych obrazów są zdolni do wykorzystywania także innych bodźców, które z kwestiami wizualnymi nie mają nawet nic wspólnego. Coś, co w dużym uproszczeniu możemy nazwać inspiracją, chociaż oczywiście w przypadku AI termin ten wciąż nie ma zastosowania. 

ImageBind tym się różni od konkurencji, jak DALL-E 2, że poza wykorzystywaniem obrazów oraz promptów, które są tekstową instrukcją tego, co AI ma stworzyć, jest w stanie wykorzystać przy generowaniu obrazów także dźwięk, pomiary 3D, informacje o temperaturze, czy wiele innych parametrów. Może więc wykorzystywać liczne parametry, które w świecie realnym również mają wpływ na artystów – chociaż niekoniecznie zdają sobie z tego sprawę. Otóż ludzki mózg analizuje w sposób nieświadomy bodźce z otoczenia, takie jak obrazy, dźwięki i inne doświadczenia sensoryczne i to wpływa na jego działanie. 

To oznacza, że ImageBind generuje obrazy prawie jak człowiek, jednak z zaznaczeniem, że prawie robi tutaj wielką różnicę. Warto dodać, że ImageBind ma nie tylko generować w przyszłości oraz, ale także animacje, dźwięki, czy opisy. A wszystko to może ze sobą współgrać, tworząc jedną, spójną całość. Oczywiście to wciąż tylko deklaracje twórców. Nie pozostaje nam nic innego, jak poczekać na pierwsze efekty. 

Źródło: Engadget, YouTube

Motyw