Trwająca dekada zdecydowanie powinna zostać okrzyknięta mianem dziesięciolecia AI, które w tym momencie przeżywa swój renesans
Konkurencja obecna na rynku jest ogromna a walka zacięta, potyczki toczą ze sobą giganci tacy jak Google, Microsoft czy OpenAI
Pomimo teoretycznej przewagi gdzieniegdzie słyszy się, ze ten ostatni wydaje się przegrywać (i to znacząco) na rzecz pewnego projektu wprost z Państwa Środka
Gdzie Chińczyk nie może tam bota pośle
„Janusz Pro” został udostępniony na GitHubie oraz Hugging Face, z czego wersja zaimplementowana w drugim ze źródeł sprawia wrażenie mocno niedopracowanego dema. Janus Pro uploadowany w ramach GH dostępny jest w 2 opcjach — z 1 oraz 7 miliardami parametrów. Wyniki kilku dostępnych benchmarków wskazują, że obszerniejszy wariant mógłby śmiało konkurować z popularnymi i uznanymi w swojej klasie modelami o nazwie Stable Diffusion oraz DALL-E 3.

Dla zilustrowania poczynionego progresu DeepSeek postanowiło stworzyć zestawienie porównujące efekty pracy Janus Pro 7B, bo tak brzmi jego pełna nazwa oraz wcześniejszego Janus. Grafika przedstawia to co udało się wygenerować w odpowiedzi na dłuższe, bardziej opisowe frazy i trzeba przyznać, różnica pod względem realizmu wydaje się kolosalna.
Janus Pro od DeepSeek w dalszym ciągu wymaga dopracowania
Żeby nie było aż tak kolorowo, najnowsza wersja dostępna w ramach Hugging Face posiada pewne ograniczenia. Dotyczą one maksymalnego rozmiaru piku wejściowego, który może wynosić dokładnie 381 na 381 pikseli, jeśli chodzi o wielkość grafiki wyjściowej maksimum, póki co nie jest znane. Jakkolwiek nie spojrzeć fakt, że to, co udało się wygenerować, ma rozdzielczość do 768 × 768 px nie napawa zbytnim optymizmem. Również jakość samych obrazów jest, co tu dużo mówić, dyskusyjna.
W przypadku wspomnianego wcześniej ChatGPT maksymalne dozwolone wymiary „wejściowe” wydają się być nieograniczone (przynajmniej tak wynika z przeprowadzonego testu). Jeśli chodzi o szczegółowość, wierność odwzorowania oraz liczbę dostępnych opcji to realnie Janus Pro wydaje się być praktycznie bez szans.
Dla porównania poniżej znajdują się przykładowe efekty będące graficzną odpowiedzią AI na frazę “blue lizard on a green rocky desert down a narrow red canyon”, czyli „niebieska jaszczurka na zielonej skalistej pustyni na dnie wąskiego czerwonego kanionu”.






Całość można by podsumować, cytując znane powiedzenie: „zapomniał wół, jak cielęciem był” tym bardziej, że w sytuacji podobnej do DeepSeek w przeszłości bywało już wielu obecnie doświadczonych graczy. Pozostaje więc mieć nadzieję, że twórcy Janus Pro podejmą intensywne działania mające na celu dynamiczny rozwój modelu, biorąc przy tym do serca feedback ze strony użytkowników. Poza tym ocena jest ostatecznie kwestią indywidualnego gustu, a jak wiadomo, o gustach się nie dyskutuje, prawda?
Źródło: Android Authority
Miniatura: YouTube (edycja własna)
Dodaj komentarz