OVO JE NEVJEROVATNO: Da li je DeepSeek pronašao pametniji i jeftiniji put do vještačke inteligencije?
Kineski DeepSeek je iznenadio globalnu industriju umjetne inteligencije (AI) izgradnjom naprednog modela, DeepSeek V3.2, koji pruža performanse slične nekim od najmoćnijih sistema, a ipak koristi daleko manje računarske snage. Dok velike tehnološke kompanije troše milijarde na masivne klastere za obuku, DeepSeek pokazuje da inteligentni dizajn ponekad može zamijeniti skupi hardver.
Njihov model radi na istom nivou kao OpenAI-jev GPT-5 u zadacima rezonovanja, iako je trenirao s daleko manje ukupnih operacija. Ovo dostignuće dovodi u pitanje vjerovanje da samo ogromni budžeti mogu da proizvedu umjetnu inteligenciju na graničnom nivou, piše Telegraf.rs.
Za preduzeća, ovaj razvoj je važan jer pokazuje da visokokvalitetna AI ne zahtijeva uvijek skupu infrastrukturu. Pošto je DeepSeek V3.2 otvorenog koda, organizacije mogu da testiraju napredne funkcije rezonovanja i automatizacije, a da pritom zadrže potpunu kontrolu nad načinom na koji koriste i primjenjuju sistem.
DeepSeek je objavio dvije verzije: standardnu V3.2 i Speciale verziju. Model "Speciale" je osvojio zlatne medalje na vodećim svjetskim takmičenjima iz matematike i informatike, rezultate koje su ranije postizali samo tajni interni sistemi iz velikih američkih laboratorija za AI.
Efikasnost pobjeđuje obim
Ono što ovo čini još impresivnijim jeste to što DeepSeek radi pod ograničenjima izvoza hardvera, što ograničava njegov pristup najsavremenijim čipovima. Njihov uspjeh dolazi od efikasnosti, a ne od obima. Tim je razvio metodu pod nazivom DeepSeek Sparse Attention (DSA), koja smanjuje količinu informacija koje model treba da obradi odjednom. Umjesto da svaki dio unosa tretira podjednako, sistem bira samo najrelevantnije dijelove, smanjujući nepotrebno izračunavanje uz održavanje tačnosti.
Kao rezultat toga, DeepSeek V3.2 je postigao najbolje rezultate u nekoliko konkurentnih testova rezonovanja, uključujući AIME 2025 i Codeforces izazove. Model također zadržava interne korake rezonovanja tokom zadataka s višestrukim okretajima, posebno kada se koriste alati, što ga čini efikasnijim za kodiranje, rješavanje problema i radne procese u stilu agenta. U ključnim inženjerskim testovima, kao što je SWE-Verified, model je pokazao snažne rezultate, dokazujući da njegov dizajn koristi razvoju softvera u stvarnom svijetu, a ne samo akademskim testovima.
Da bi trenirao agentsko ponašanje, DeepSeek je kreirao preko 1.800 simuliranih okruženja i desetine hiljada složenih zadataka, pomažući modelu da nauči kako da rasuđuje i djeluje u nepoznatim situacijama. Iako je osnovna verzija javno dostupna na Hugging Face-u, jača Speciale verzija je samo API jer zahtijeva više tokena i resursa. Objavljivanje DeepSeek V3.2 signalizira da inovacije, ne samo sirova računarska snaga, mogu oblikovati budućnost napredne umjetne inteligencije.