Vad är Deepseek, Kinas AI -start som skickar chockvågor via Global Tech?

Deepseek, en lite känd kinesisk start, har skickat chockvågor genom den globala tekniska sektorn med frisläppandet av en Artificial Intelligence (AI) -modell vars kapacitet konkurrerar med skapelserna för Google och OpenAI.

Deepseek-R1: s skapare säger att dess modell utvecklades med mindre avancerade och färre datorchips än anställda av tekniska jättar i USA.

I ett forskningsdokument som släpptes förra veckan sa modellens utvecklingsteam att de hade spenderat mindre än $ 6 miljoner på datorkraft för att utbilda modellen-en bråkdel av AI-budgetarna på flera miljarder dollar som har åtnjöt av amerikanska tekniska jättar som OpenAI och Google, skaparna av Chatgpt respektive Gemini.

Marc Andreessen, en av de mest inflytelserika tekniska riskkapitalisterna i Silicon Valley, hyllade frisläppandet av modellen som ”AI: s Sputnik -ögonblick”.

Den plötsliga uppkomsten av en liten kinesisk start som kan konkurrera med Silicon Valley toppspelare har utmanat antaganden om USA: s dominans i AI och väckte rädsla för att de skyhöga marknadsvärderingar för företag som NVIDIA och META kan vara fristående från verkligheten.

På måndag förlorade Nvidia, som har ett nästan monopol på att producera halvledarna som kraftgenerativ AI, nästan 600 miljarder dollar i börsvärde efter att dess aktier sjönk 17 procent.

USA: s president Donald Trump, som förra veckan tillkännagav lanseringen av ett AI-initiativ på 500 miljarder dollar under ledning av OpenAI, Texas-baserade Oracle och Japans softbank, sa att Deepseek borde fungera som ett ”väckarklocka” på behovet av att USA: s industri ska vara ” laserfokuserad på att tävla för att vinna ”.

Vad är Deepseek?

Deepseek, som är baserad i Hangzhou, grundades i slutet av 2023 av Liang Wenfeng, en serieentreprenör som också driver hedgefondens högflyer.

Även om det är lite känt utanför Kina, har Liang en omfattande historia av att kombinera växande tekniker och investeringar.

2013 grundade han Hangzhou Jacobi Investment Management, ett värdepappersföretag som anställde AI för att genomföra handelsstrategier, tillsammans med en co-alumnus vid Zhejiang University, enligt kinesiska medieuttag Sina Finance.

Liang fortsatte med att etablera ytterligare två företag som fokuserade på datorinställda investeringar-Hangzhou Huanfang Technology Co och Ningbo Huanfang kvantitativa investeringshanteringspartnerskap-2015 respektive 2016.

I en intervju med kinesiska medieutloppsvågor 2023 avfärdade Liang förslaget att det var för sent för nystartade företag att engagera sig i AI eller att det skulle betraktas som oöverkomligt kostsamt.

”Reproduktion ensam är relativt billig-baserat på offentliga papper och öppen källkod, minimala träningstider eller till och med finjustering. Forskning involverar emellertid omfattande experiment, jämförelser och högre beräknings- och talangkrav, ”sade Liang enligt en översättning av hans kommentarer publicerade av Chinatalk Substack.

Liang sa att hans intresse för AI främst drevs av ”nyfikenhet”.

”Ur ett bredare perspektiv vill vi validera vissa hypoteser. Till exempel antar vi att essensen av mänsklig intelligens kan vara språk, och mänsklig tanke kan i huvudsak vara en språklig process, ”sade han enligt transkriptet.

”Det du tycker om som” tänkande ”kan faktiskt vara ditt hjärnvävande språk. Detta antyder att människoliknande AGI potentiellt skulle kunna komma från stora språkmodeller, ”tillade han och hänvisade till konstgjord allmän intelligens (AGI), en typ av AI som försöker imitera det mänskliga sinnets kognitiva förmågor.

Deepseek svarade inte omedelbart på en begäran om kommentar.

På måndag sa Gregory Zuckerman, en journalist med Wall Street Journal, att han hade fått veta att Liang, som han inte hade hört talas om tidigare, skrev förordet för den kinesiska utgåvan av en bok som han författade om den sena amerikanska hedgefondförvaltaren Jim Simons .

”Simons lämnade en djup inverkan, tydligen,” skrev Zuckerman i en kolumn och beskrev hur Liang berömde sin bok som en tome som ”Unavels många tidigare olösta mysterier och ger oss en mängd upplevelser att lära av”.

”Till och med min mamma fick inte så mycket ut ur boken,” skrev Zuckerman.

Varför har Deepseek tagit den tekniska världen med storm?

Enkelt uttryckt har företagets framgång väckt existensiella frågor om tillvägagångssättet för AI som tas av både Silicon Valley och den amerikanska regeringen.

Amerikanska teknikföretag har antagits allmänt ha en kritisk fördel i AI, inte minst på grund av deras enorma storlek, vilket gör att de kan dra topptalanger från hela världen och investera massiva summor i att bygga datacentra och köpa stora mängder kostsamma hög- slutchips.

Deepseeks ankomst till scenen har ifrågasatt antagandet att det tar miljarder dollar att vara i framkant av AI.

”Openai grundades för tio år sedan, har 4500 anställda och har samlat in 6,6 miljarder dollar i kapital. Deepseek grundades för mindre än 2 år sedan, har 200 anställda och utvecklades för mindre än 10 miljoner dollar, ”sa Adam Kobeissi, grundaren av marknadsanalysnyhetsbrevet Kobeissi -brevet, på X på måndag.

”Hur är dessa två företag nu konkurrenter?”

I sitt forskningsdokument sa Deepseeks ingenjörer att de hade använt cirka 2 000 NVIDIA H800-chips, som är mindre avancerade än de mest avancerade chips, för att träna sin modell.

Teamet sa att det använde flera specialiserade modeller som arbetade tillsammans för att göra det möjligt för långsammare chips att analysera data mer effektivt.

För den amerikanska regeringen väcker Deepseeks ankomst till scenen frågor om sin strategi att försöka innehålla Kinas AI-framsteg genom att begränsa exporten av avancerade chips.

Deepseeks forskningsdokument antyder att antingen de mest avancerade chips inte behövs för att skapa högpresterande AI-modeller eller att kinesiska företag fortfarande kan källa till chips i tillräckliga mängder-eller en kombination av båda.

Kalifornien-baserade Nvidias H800-chips, som var utformade för att följa amerikanska exportkontroller, exporterades fritt till Kina fram till oktober 2023, då administrationen av den dåvarande presidenten Joe Biden lade till dem till sin lista över begränsade föremål.

I sin intervju 2023 med Waves sa Liang att hans företag hade lagrat 10 000 NVIDIA A100 GPU innan de förbjöds för export. GPU: er eller grafikbehandlingsenheter är elektroniska kretsar som används för att påskynda grafik och bildbehandling på datorenheter.

Tanishq Abraham, tidigare forskningsdirektör vid Stabilitet AI, sa att han inte blev förvånad över Kinas framstegsnivå i AI med tanke på utrullning av olika modeller av kinesiska företag som Alibaba och Baichuan.

”Även om det har skett begränsningar för Kinas förmåga att få GPU: er, har Kina fortfarande lyckats förnya och pressa prestanda utifrån vad de har,” sa Abraham till Bladet.

”Jag tror att det är en lektion för oss företag att det fortfarande finns mycket prestanda de kan pressa ut ur.”

Tara Javidi, meddirektör för Center for Machine Intelligence, Computing and Security vid University of California San Diego, sa att Deepseek gjorde henne upphetsad över den ”snabba framsteg” som ägde rum i AI-utvecklingen över hela världen.

”Mitt enda hopp är att den uppmärksamhet som ges på detta tillkännagivande kommer att främja ett större intellektuellt intresse för ämnet, ytterligare utöka talangpoolen och sist men inte minst öka både privata och offentliga investeringar i AI -forskning i USA,” berättade Javidi till Bladet.

Samtidigt har investerarnas förtroende för den amerikanska tekniska scenen tagit en hit – åtminstone på kort sikt.

Bortsett från Nvidias dramatiska bild såg Google Parent Alphabet och Microsoft på måndag att deras aktiekurser sjönk 4,03 procent respektive 2,14 procent, även om Apple och Amazon slutade högre.

”Om Deepseeks kostnadsnummer är verkliga, kan nu nästan alla stora organisationer i alla företag bygga vidare på och vara värd för det,” sa Tim Miller, professor som specialiserat sig på AI vid University of Queensland, till Bladet.

”Så i detta avseende har spelet förändrats helt eftersom det finns en ny” regel ”som vem som helst kan spela.”

Betyder det att Kina vinner AI -loppet?

Inte nödvändigtvis.

Medan tekniska analytiker i stort sett är överens om att Deepseek-R1 presterar på liknande nivå som chatgpt-eller ännu bättre för vissa uppgifter-rör sig fältet snabbt.

OpenAI: s VD Sam Altman sa tidigare denna månad att företaget skulle släppa sin senaste resonemang AI -modell, O3 Mini, inom veckor efter att ha övervägt användaråterkoppling.

På måndag erkände Altman att Deepseek-R1 var ”imponerande” medan han försvarade sitt företags fokus på större datorkraft.

”Vi kommer uppenbarligen att leverera mycket bättre modeller och det är också legitimt att ha en ny konkurrent! Vi kommer att dra upp några utgåvor, ”sa Altman på X.

”Men mest är vi glada över att fortsätta att utföra på vår forskningsväg och tro att mer beräkning är viktigare nu än någonsin tidigare för att lyckas med vårt uppdrag.”

Rui Ma, grundaren av Tech Buzz China, sa att den kinesiska tekniska sektorn själv hade blivit förvånad när OpenAI ursprungligen släppte Chatgpt 2022.

”De flesta företagare hade helt missat den möjlighet som generativ AI representerade och kände sig mycket ödmjuk,” sa Ma till Bladet.

”Det är tydligt att de har varit hårt på jobbet sedan. Jag tror att det som den senaste helgen visar oss är hur allvarligt de självreflekterade och tog utmaningen att ”komma ikapp” till Silicon Valley. Jag tror att för USA ska behålla sin ledning bör Washington fokusera på att öka Silicon Valley istället för att undertrycka Kina. ”

Abraham, den tidigare forskningsdirektören vid Stabilitet AI, sade att uppfattningar också kan vara snedställda av det faktum att företag som OpenAI inte har gjort sina mest avancerade modeller fritt tillgängliga för allmänheten.

”Deepseek gjorde sin bästa modell tillgänglig gratis att använda. Å andra sidan är Openais bästa modell inte gratis, sade han.

”Så de flesta som använder chatgpt för gratis är chockade av Deepseek och tror att det finns ett enormt hopp i kapacitet när OpenAI har haft en liknande utförande modellbetalning i några månader redan. Denna betalningsvägg av Frontier AI-modeller leder till att människor inte riktigt tar tag i AI: s framsteg och kapacitet. ”

Miller, University of Queensland Professor, sa att Deepseeks framsteg och andra senaste utvecklingar tyder på att Kina åtminstone är ”där uppe” med USA i AI.

”Jag gjorde något av en bortkastad förutsägelse i slutet av förra året att nästa vetenskapliga genombrott i AI kunde komma från en liten spelare som en enskild universitetsforskare som inte har tillgång till mycket datorkraft – de skulle behöva vara smartare för att tävla, ”Sa han.

”Deepseeks uppenbara framsteg är nästan ett exempel på detta: genom att inte ha tillräckligt med beräkningskraft för att bygga modeller så stora som chatgpt, måste de vara smarta. Nödvändighet är mamman till uppfinningen. ”