Jak čínský Deepseek může být stejně dobrý jako my soupeři AI za zlomek nákladů | Věda, klima a technické zprávy

Na základě omezeného počtu dosud provedených porovnání se modely AI Deepseek zdá být rychlejší, menší a mnohem levnější než nejlepší nabídky z předpokládaných titanů AI jako OpenAI, Antropic a Google.

A tady je kicker, čínská nabídka Zdá se, že je stejně dobrý. Jak to udělali?

Nejprve to vypadá, že inženýři Deepseek přemýšleli o tom, co Ai musí udělat spíše než to, co by to mohlo být schopno.

Nemusí to vypracovat každou možnou odpověď na otázku, jen to nejlepší – na dvě desetinná místa například místo 20.

Jejich modely jsou stále masivní počítačové programy, DeepSeek-V3 má 671 miliard proměnných.

Ale CHATGPT-4 je kolosální 1,76 bilionu.

Zdá se, že více s méně s architekturou modelu, která používá techniku ​​nazvanou „směs odborníků“.

Kde OpenAINejnovější model GPT-4.0 se pokouší být Einstein, Shakespeare a Picasso, který se valí do jednoho, Deepseek je spíše jako univerzita rozdělená na odborných oddělení.

To umožňuje AI rozhodnout, jaký druh dotazu je požadován, a poté jej posílat do konkrétní části digitálního mozku, se kterým bude řešena.

Použijte prohlížeč Chrome pro přístupnější video přehrávač

Čínský hluboký hledání by měl být „volání probuzení“

To umožňuje, aby ostatní části zůstaly vypnuty, šetří čas, energii a co je nejdůležitější potřebu výpočetního výkonu.

A je to ekvivalentní výkon s výrazně menším výpočetním výkonem, který šokoval velké vývojáře AI a finanční trhy.

Nejmodernější modely AI byly vyvinuty pomocí stále výkonnějších grafických zpracovatelských jednotek (GPU), které vytvořili podobné Nvidia v USA.

Přečtěte si více:
AI již nekonkuruje mezi kalifornskými technologickými bros

Deepseek ‚Wakeup Call pro nás, říká Trump

Jediným způsobem, jak je zlepšit, tak šla tržní logika, byl stále více a více výpočtu.

Částečně, aby zůstaly před Čínou v závodech AI, USA omezily prodej nejsilnějších GPU do Číny.

To, co inženýři Deepseek ukázali, je to, co inženýři dělají, když jim představujete problém. Přicházejí s řešením.

Když se učili z toho, co OpenAI a další udělali, přepracovali model od základů, aby mohl fungovat na GPU určených pro počítačové hry, nikoli superintelligence.

Jejich model je navíc, což je open source, což znamená, že pro vývojáře bude snazší začlenit do svých produktů.

Být mnohem efektivnější a open source způsobuje, že Deepseekův přístup vypadá jako mnohem atraktivnější nabídka pro každodenní aplikace AI.

Výsledek, samozřejmě, téměř 600 miliard dolarů přes noc pro Nvidia.

Ale přežije náhlý opak ve bohatství. Modely typu LLM (velký jazykový model) propagované OpenAI a nyní vylepšené Deepseekem nejsou ve vývoji AI BE-ALL a END-ALL.

„Obecná inteligence“ z AI je stále cesta pryč – a mnoho špičkových počítačů bude pravděpodobně zapotřebí, aby nás tam dostalo.

Osud firem, jako je OpenAI, je méně jistý. Jejich údajně měnící model GPT-5, který vyžaduje fungování výpočetního výkonu, vyžaduje, aby se fungovalo.

Nyní se zdá, že se hra kolem nich změnila a mnozí se zjevně přemýšlejí o tom, jaký návrat se dostanou na investici AI.


Source link

O nás Adminer

Zkontrolujte také

Pro-ruský polovojenský vůdce zabit v moskevské bombě Blast | Světové zprávy

Senior proruský polovojenský vůdce z východní Ukrajiny byl zabit při bombovém výbuchu v hale luxusního …

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *