Dossier

DeepSeek, Huawei Ascend en China's AI-stack

China's push naar eigen modellen en chips onder exportdruk.

Nieuwsitems

Gekoppelde artikelen

28 artikelen

Huawei's chipdivisie HiSilicon, onder leiding van president Tingbo He, heeft een nieuwe optimalisatiemethode onthuld genaamd Tau's Scaling Law, die de afnemende Moore's Law moet vervangen. De aanpak richt zich op het versnellen van berekeningen over chips, circuits en systemen heen, in plaats van alleen transistors te verdichten. He belooft dat de techniek binnen enkele maanden zal leiden tot een 'grote sprong voorwaarts' in chipprestaties, wat de Amerikaanse dominantie in de chipindustrie kan ondermijnen.

DeepSeek heeft voor het eerst externe financiering opgehaald, met een waardering van $45-50 miljard. Het staatsfonds ICF leidt de ronde, samen met Tencent en Alibaba. DeepSeek sloot bewust private VC's zoals Sequoia China en Hillhouse buiten. Dit weerspiegelt de trend dat Chinese AI-startups steeds vaker staatskapitaal aantrekken nu private VC in China opdroogt.

Het artikel legt de Manifold-Constrained Hyper-Connections (mHC) in DeepSeek V4 uit met visuele uitleg en korte animaties. mHC vervangt de residu-verbindingen in de transformerblokken door meerdere parallelle residustromen om de training te stabiliseren. Het artikel behandelt de architectuur, intuïtie en toepassing van mHC in de aandachts- en MoE-blokken.

Huawei's halfgeleiderdivisie claimt een doorbraak met het LogicFolding-platform, waarmee het binnen vijf jaar kan concurreren met Samsung en Nvidia. De technologie versnelt elektrische signalen in plaats van transistors te verkleinen. De eerste LogicFolding-chips debuteren dit najaar in Kirin-processoren.

DeepSeek heeft de prijzen van zijn vlaggenschipmodel V4 Pro permanent met 75% verlaagd. De nieuwe prijzen zijn vanaf 22 mei van kracht. Het bedrijf wijst op verbeteringen in de beschikbaarheid van Huawei's Ascend 950 AI-chips als belangrijke factor voor de prijsverlaging. De stap zet concurrentie in de AI-markt verder onder druk.

Huawei claimt binnen vijf jaar 1,4nm-chips te kunnen maken zonder de geavanceerde ASML-machines, met een nieuwe Tau-schaalwet en LogicFolding-technologie. De achterstand op TSMC zou daarmee teruglopen tot circa drie jaar. Het bedrijf zegt al 381 chips op deze basis in productie te hebben.

Chinese telecomaanbieders zoals China Mobile en China Telecom verkopen AI-bundels met tokens voor toegang tot AI-modellen zoals DeepSeek, Qwen, Doubao en GLM. De bundels kosten enkele euro's tot tientjes en worden beheerd met tokenmanagementsystemen. China Mobile biedt toegang tot driehonderd modellen via een modelmanagementsysteem dat per taak het beste model kiest.

Ondanks goedkeuring van de Amerikaanse exportlicenties voor Nvidia H200-chips aan Chinese bedrijven als Alibaba en Tencent, blokkeert Peking de levering omdat het bedrijven verplicht binnenlandse chips zoals die van Huawei te gebruiken. DeepSeek V4 is geoptimaliseerd voor Huawei Ascend-processors, wat duidt op een structurele verschuiving in de Chinese AI-hardwaremarkt. Nvidia's omzet uit China is gedaald naar circa 5% en het bedrijf rekent voor het huidige kwartaal op nul omzet uit China.

Chinese AI-bedrijven zijn beter geworden in videogeneratie dan Amerikaanse alternatieven. Partijen als ByteDance, Kuaishou en MiniMax worden door ontwikkelaars als realistischer en beter bruikbaar gezien. De voorsprong komt door de enorme hoeveelheid videodata van platforms zoals TikTok.

AI-bedrijf Anthropic, maker van chatbot Claude, waarschuwt in een rapport dat China de VS kan inhalen in de AI-race als er geen strengere maatregelen komen. Volgens Anthropic dreigt AI dan autoritaire trekjes te krijgen, omdat China AI inzet voor censuur en surveillance. Het rapport wijst op omzeiling van exportrestricties via smokkel van chips en distillatie-aanvallen op westerse AI-modellen.

Tencent plaatst in de tweede helft van 2026 een aanzienlijke toename van investeringen in AI-infrastructuur, mede door het verbeterde aanbod van Chinese AI-chips. Het bedrijf rapporteerde sterke eerste kwartaalresultaten en onderhandelt over een aandeel in Deepseek. Concurrent Bytedance pland meer dan 30 miljard dollar uit op AI-infrastructuur.

Chinese leveranciers van AI-hardware kunnen de stijgende vraag niet bijbenen vanwege tekorten aan kritieke componenten en beperkte productiecapaciteit, meldt Bloomberg. Onderzoeksinstellingen zoals Zhongji Innolight hebben grote hoeveelheden chips en circuitboards opgeslagen, terwijl fabrieken in Thailand en Vietnam nog niet op de Chinese productienormen zijn afgestemd. De lancering van nieuwe modellen zoals DeepSeek-V4 kan de vraag verder stimuleren.

ByteDance verhoogt zijn geplande AI-investeringen voor 2026 naar meer dan 200 miljard yuan (ongeveer 30 miljard dollar), een stijging van minstens 25 procent ten opzichte van eerdere plannen. Het bedrijf, dat ook bekend staat als de moeder van TikTok, richt zich steeds vaker op Chinese chips om geopolitieke risico's te verminderen en de druk van Beijing op binnenlandse semiconductoren te voldoen. De investeringen zijn echter nog steeds relatief klein vergeleken met de geplande AI-uitgaven van Amerikaanse tech-giganten zoals Google, Microsoft, Meta en Amazon, die samen ongeveer 725 miljard dollar willen uitgeven in 2026.

In deze uitgebreide podcast worden de laatste ontwikkelingen in de AI-wereld besproken, waaronder de lancering van GPT-5.5 door OpenAI, de open-source release van DeepSeek V4, en nieuwe onderzoeken naar AI-safety sabotage. Ook worden belangrijke bedrijfs- en beleidsupdates, zoals Google's investering in Anthropic en de blokkade van Meta's overname van Manus, besproken.

DeepSeek heeft zijn v4-versie van het model gelanceerd, die niet alleen een contextvenster van een miljoen tokens ondersteunt, maar ook een dieper inzicht biedt in de architectuur van langdurig redeneren. Het model is ontworpen met de kernstelling dat miljoen-tokens intelligentie meer vereist dan alleen het schalen van de Transformer-architectuur. DeepSeek-V4 introduceert een nieuwe geheugenstructuur, nieuwe aandachtstechnieken, nieuwe trainingssystemen, nieuwe optimisatoren, nieuwe kwantisatievormen en een dienststack die de economie van inferentie kan overleven. Het artikel benadrukt dat het model een systemenpaper is, die de praktische toepassing van langdurig redeneren mogelijk maakt.

DeepSeek-V4 Pro is nu beschikbaar op Together AI met een contextvenster van 512K tokens, controleerbare redeningsmodi en prijsmodel voor hergebruikte input. Het model maakt gebruik van een 1,6T-parameter MoE-architectuur met 49B actieve parameters. De redeningsmodi Non-Think, Think High en Think Max bieden teams de keuze tussen snelle antwoorden, diepere redeningsprocessen en maximaal redeningswerk. De prijs is gesteld op $2,10 per 1M inputtokens, $0,20 per 1M cached inputtokens en $4,40 per 1M outputtokens. DeepSeek-V4 Pro is bedoeld voor werklasten waar het model moet redeneren over langere contexten, zoals grote repositories, technische documenten en onderzoekscorpus. Het model is beschikbaar op Serverless Inference en kan later worden geïmplementeerd op Dedicated Endpoints voor productie.

DeepSeek, een AI-modellenbedrijf, heeft twee versies van zijn V4-model gelanceerd. Beide versies zijn open, goedkoper en gebruiken Huawei's AI-chips voor inferentie. De release van DeepSeek-V4 wordt gezien als een belangrijke ontwikkeling in de concurrentie tussen AI-modellen wereldwijd. De modellen zijn gericht op het verbeteren van de manier waarop mensen informatie verwerken en gebruiken.

DeepSeek introduceert zijn nieuwste AI-modellen, DeepSeek V4, die met een significante verlaging van de inferentiekosten en ondersteuning voor Huawei's Ascend-accelerators worden gepresenteerd. De modellen gebruiken geavanceerde architectuur en lagere precisie om efficiëntie te verbeteren, en zijn beschikbaar via Hugging Face en de DeepSeek API.

Huawei benadrukt het belang van schaalbare AI-infrastructuur in een tijd van massale dataverwerking. De maatregelen van de maatregelen van Huawei om data te beheren, op te slaan en te verwerken, zijn essentieel voor het opzetten van AI-modellen en toepassingen. De AI Data Lake-oplossing en de AI Data Platform (AIDP) helpen bij het oplossen van uitdagingen zoals data-silo's, lage prestaties bij inferentie en beperkte contextcapaciteit. Huawei benadrukt ook de noodzaak van samenwerking tussen opslag en rekenkracht voor efficiëntie en gebruikerservaring.

Volgens de 2026 AI Index van Stanford HAI is China de Amerikaanse leiding in AI geërfd, waardoor de twee landen nu gelijk staan. De rapportage benadrukt ook dat de AI-industrie sneller groeit dan ooit, terwijl er zorgen zijn over transparantie en het gebruik van supercomputers. De VS leidt in ontwikkeling, maar China heeft een sterke positie in patenten en robotica.

OpenAI begint met het testen van gemarkeerde bannerreclames in ChatGPT voor ingelogde gebruikers van de gratis versie en het $8-per-maand-abonnement ChatGPT Go, met een uitrol in de VS en andere markten in de komende weken. Daarnaast meldt het artikel dat Zhipu AI zijn afhankelijkheid van Amerikaanse chips heeft doorgebroken en dat er drama is bij het bedrijf Thinking Machines.

Alibaba Cloud introduceert Qwen2.5, een nieuw onderdeel van de Qwen-familie, met verbeterde prestaties in taalverwerking, programmeren en wiskunde. De release bevat meerdere modellen, waaronder Qwen2.5, Qwen2.5-Coder en Qwen2.5-Math, en biedt ondersteuning voor tot 128K tokens en meerdere talen. De modellen zijn beschikbaar via Hugging Face en andere platforms.

Alibaba Cloud heeft het Qwen1.5-110B-model vrijgegeven, het eerste model met meer dan 100 miljard parameters in de Qwen1.5-reeks. Het model presteert vergelijkbaar met Meta-Llama3-70B in basis-evaluaties en overtreft het aanzienlijk in chat-evaluaties zoals MT-Bench en AlpacaEval 2.0. Het ondersteunt een contextlengte van 32K tokens en is multilingual, met ondersteuning voor talen zoals Engels, Chinees, Frans en Spaans.