Janus Pro

DeepSeek skuteczniejszy w generowaniu obrazów niż ChatGPT

Janus Pro od DeepSeek to najnowsze dziecko chińskiego producenta z branży LLM. Model AI wydaje się rywalizować z ChatGPT nie tylko pod względem „zasobożerności” jako ten lżejszy, ale również w tworzeniu grafiki (przynajmniej takie krążą słuchy).

Awatar Bartosz Mądrzyński

Trwająca dekada zdecydowanie powinna zostać okrzyknięta mianem dziesięciolecia AI, które w tym momencie przeżywa swój renesans

Konkurencja obecna na rynku jest ogromna a walka zacięta, potyczki toczą ze sobą giganci tacy jak Google, Microsoft czy OpenAI

Pomimo teoretycznej przewagi gdzieniegdzie słyszy się, ze ten ostatni wydaje się przegrywać (i to znacząco) na rzecz pewnego projektu wprost z Państwa Środka

Gdzie Chińczyk nie może tam bota pośle

„Janusz Pro” został udostępniony na GitHubie oraz Hugging Face, z czego wersja zaimplementowana w drugim ze źródeł sprawia wrażenie mocno niedopracowanego dema. Janus Pro uploadowany w ramach GH dostępny jest w 2 opcjach — z 1 oraz 7 miliardami parametrów. Wyniki kilku dostępnych benchmarków wskazują, że obszerniejszy wariant mógłby śmiało konkurować z popularnymi i uznanymi w swojej klasie modelami o nazwie Stable Diffusion oraz DALL-E 3.

Janus Pro
Źródło: GitHub

Dla zilustrowania poczynionego progresu DeepSeek postanowiło stworzyć zestawienie porównujące efekty pracy Janus Pro 7B, bo tak brzmi jego pełna nazwa oraz wcześniejszego Janus. Grafika przedstawia to co udało się wygenerować w odpowiedzi na dłuższe, bardziej opisowe frazy i trzeba przyznać, różnica pod względem realizmu wydaje się kolosalna.

Janus Pro od DeepSeek w dalszym ciągu wymaga dopracowania

Żeby nie było aż tak kolorowo, najnowsza wersja dostępna w ramach Hugging Face posiada pewne ograniczenia. Dotyczą one maksymalnego rozmiaru piku wejściowego, który może wynosić dokładnie 381 na 381 pikseli, jeśli chodzi o wielkość grafiki wyjściowej maksimum, póki co nie jest znane. Jakkolwiek nie spojrzeć fakt, że to, co udało się wygenerować, ma rozdzielczość do 768 × 768 px nie napawa zbytnim optymizmem. Również jakość samych obrazów jest, co tu dużo mówić, dyskusyjna.

W przypadku wspomnianego wcześniej ChatGPT maksymalne dozwolone wymiary „wejściowe” wydają się być nieograniczone (przynajmniej tak wynika z przeprowadzonego testu). Jeśli chodzi o szczegółowość, wierność odwzorowania oraz liczbę dostępnych opcji to realnie Janus Pro wydaje się być praktycznie bez szans.

Dla porównania poniżej znajdują się przykładowe efekty będące graficzną odpowiedzią AI na frazę “blue lizard on a green rocky desert down a narrow red canyon”, czyli „niebieska jaszczurka na zielonej skalistej pustyni na dnie wąskiego czerwonego kanionu”.

Całość można by podsumować, cytując znane powiedzenie: „zapomniał wół, jak cielęciem był”  tym bardziej, że w sytuacji podobnej do DeepSeek w przeszłości bywało już wielu obecnie doświadczonych graczy. Pozostaje więc mieć nadzieję, że twórcy Janus Pro podejmą intensywne działania mające na celu dynamiczny rozwój modelu, biorąc przy tym do serca feedback ze strony użytkowników. Poza tym ocena jest ostatecznie kwestią indywidualnego gustu, a jak wiadomo, o gustach się nie dyskutuje, prawda?

Logo TechnoSTREFA TechnoStrefa.com

Jaki smartfon kupić? Ranking – Marzec 2025

Odpowiadamy na wiecznie nurtujące Was pytanie. Jaki smartfon kupić? W rankingu telefonów nie zabraknie pozycji budżetowych, średniaków oraz flagowców. Tutaj znajdziecie szereg propozycji dopasowanych do Waszego stylu życia, oczekiwań i budżetu.

Czytaj artykuł

Źródło: Android Authority

Miniatura: YouTube (edycja własna)

Awatar Bartosz Mądrzyński

Komentarze

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Na razie brak komentarzy.
Bądź pierwszą osobą, która wyrazi swoją opinię!
Starsze komentarze Nowsze komentarze


Przeszukaj portal TechnoStrefa.com

Dalsze wyniki

Brak wyników.

Wyszukiwanie obsługiwane przez