El futur de la IA local serà en servidors llogats

Durant els últims anys, la intel·ligència artificial ha estat dominada per una idea molt simple: fer servir ChatGPT, Claude, Gemini o qualsevol altra API tancada, pagar per token i deixar que una gran empresa s’encarregui de tot. Per a l’usuari normal, aquest model és còmode. Però per a moltes empreses, startups i desenvolupadors té un problema important: no controlen del tot les seves dades, ni els seus costos, ni la seva infraestructura.

Aquí apareix una tendència que pot marcar la pròxima etapa del sector: la IA local executada en infraestructura llogada. I això és important perquè, quan parlem de “models locals”, no sempre parlem d’un portàtil a casa. Moltes vegades parlem de models open-weight desplegats en servidors privats, GPUs llogades, màquines bare metal o clouds especialitzades.

La tesi és clara: si els models open-weight continuen millorant, la demanda d’infraestructura GPU es pot disparar. No perquè tothom hagi de tenir una supermàquina a l’escriptori, sinó perquè milers d’empreses voldran executar els seus propis models sense dependre per complet d’una API tancada.

La tesi: millors models open-weight signifiquen més demanda d’infraestructura GPU

Si un model open-weight s’acosta prou al nivell dels millors models tancats, moltes empreses es plantejaran desplegar-lo elles mateixes. No necessiten que sigui el millor model del món en tots els benchmarks. Necessiten que sigui prou bo per a les seves tasques reals.

Exemples en sobren: suport intern, agents per a empleats, anàlisi de documents, RAG, generació de contingut, classificació, traducció, extracció de dades, copilots de codi, automatitzacions i chatbots especialitzats.

Executar un model propi pot donar diversos avantatges:

Més control sobre les dades, especialment en sectors regulats.
Més privacitat, en reduir la dependència de proveïdors externs.
Personalització, amb models ajustats al negoci.
Costos més previsibles quan hi ha molt volum.
Menys dependència de canvis de preus, límits o condicions d’OpenAI, Anthropic, Google o altres proveïdors.

Això no vol dir que les APIs tancades hagin de desaparèixer. El més probable és que convisquin tots dos mons. Per a tasques molt difícils, moltes empreses continuaran fent servir models frontier tancats. Però per a una part enorme de la feina diària, un model open-weight ben desplegat pot ser suficient.

L’error comú: pensar que IA local només significa “al meu PC”

Quan algú sent “model local”, sol imaginar Ollama en un Mac, un PC amb una GPU potent o una torre gaming. Aquesta part existeix i creixerà, però no és el mercat gran.

El mercat gran és a les empreses que necessiten servir milers o milions de consultes, startups que integren IA al seu producte, bancs que volen privacitat, hospitals que gestionen dades sensibles, despatxos jurídics, e-commerce, call centers, plataformes SaaS i agents autònoms funcionant 24/7.

Tot això no es resol amb un portàtil. Requereix servidors, GPUs, emmagatzematge, xarxes ràpides, refrigeració, energia i operacions.

Per això la tesi completa no és “hi haurà models locals bons”. La tesi completa és: hi haurà models open-weight prou bons i les empreses necessitaran llogar infraestructura per executar-los a escala.

Qui guanya si aquesta tendència es compleix

La cadena de valor d’aquesta nova etapa de la IA es pot dividir en diverses capes. Cadascuna té oportunitats i riscos diferents.

1. Creadors de xips

El nom més evident és NVIDIA. També hi ha AMD, els xips propis de Google, Amazon i Microsoft, a més d’acceleradors especialitzats. Sense GPUs ni acceleradors, no hi ha IA moderna a escala.

Aquesta part ja és molt coneguda pel mercat. NVIDIA va ser el gran guanyador visible de la primera onada. La pregunta ara és quines empreses es poden beneficiar de la capa següent: qui lloga, opera i desplega aquesta capacitat.

2. Clouds especialitzades en IA

Aquí entren empreses com CoreWeave i Nebius. Són plataformes dissenyades per a càrregues d’IA: entrenament, fine-tuning, inferència, clusters de GPUs, xarxes de baixa latència i desplegaments de models.

Són apostes molt directes. Si una startup o empresa vol executar un model propi sense comprar un data center, pot llogar capacitat en una d’aquestes plataformes.

3. Clouds per a desenvolupadors i pimes

DigitalOcean ocupa una posició diferent. No competeix igual que AWS, Azure o Google Cloud en grans contractes enterprise, però té una relació molt forta amb developers, startups petites i pimes que busquen simplicitat.

Si la IA local es democratitza, molts equips no començaran muntant clusters complexos. Buscaran una GPU fàcil de desplegar, models preconfigurats, costos clars i una experiència simple.

4. Hyperscalers tradicionals

Amazon, Microsoft, Google i Oracle també guanyen amb aquesta tendència. Tenen clients, data centers, contractes enterprise i múscul financer. Oracle, en particular, té una posició interessant en infraestructura bare metal i clients corporatius.

La diferència és que aquestes companyies són enormes. La IA cloud pot créixer molt, però dins d’Amazon o Microsoft l’impacte es dilueix més que en una empresa més petita i enfocada.

5. Data centers, energia i capacitat física

Empreses com IREN i Applied Digital apunten a una altra part del problema: el coll d’ampolla físic. La IA no només consumeix programari. Consumeix energia, sòl, refrigeració, permisos, fibra, transformadors i centres de dades preparats per a alta densitat.

Si el món necessita “AI factories”, qui aconsegueixi construir i operar aquesta infraestructura pot tenir un paper molt rellevant.

Empreses que encaixen en aquesta tesi

CoreWeave: el núvol pur d’IA

CoreWeave és un dels noms més clars dins de la infraestructura IA. El seu negoci es basa a llogar capacitat cloud optimitzada per a intel·ligència artificial. Més inferència, més entrenament i més models propis signifiquen més demanda potencial per a aquest tipus de proveïdors.

La part positiva és la seva exposició directa. La part negativa és que el negoci exigeix moltíssim capital: GPUs, data centers, energia, xarxes, contractes i finançament. Pot créixer molt, però també pot patir si el mercat castiga la despesa o si la demanda no avança al ritme esperat.

Nebius: una neocloud amb exposició directa

Nebius també encaixa molt bé en la idea de neocloud d’IA. El seu focus està en infraestructura per entrenar i desplegar models, tant per a startups avançades com per a empreses que necessiten capacitat potent.

El seu atractiu està en la puresa de la tesi. El seu risc està en l’execució: capex elevat, necessitat de finançament i pressió per escalar ràpid sense destruir marges.

DigitalOcean: el pont cap a developers i pimes

DigitalOcean pot ser important si la IA local es torna més accessible per a desenvolupadors i petites empreses. No és necessàriament l’opció per als clusters més grans, però sí que pot ser una porta d’entrada natural per desplegar models open-weight, muntar serveis d’inferència i integrar IA en productes SaaS petits.

El seu paper no és ser l’aposta més explosiva, sinó representar la democratització de la IA al núvol.

Oracle: la pota enterprise

Oracle no és una aposta pura, però sí una pota més estable de la tesi. OCI s’ha posicionat amb infraestructura cloud potent, bare metal i relacions amb grans empreses.

En sectors regulats com la banca, la salut, l’administració pública o les grans corporacions, Oracle es pot beneficiar de la demanda d’IA privada i entorns controlats.

IREN: energia, data centers i GPU cloud agressiva

IREN és una de les apostes més especulatives. Ve d’una història lligada a infraestructura energètica i mineria de bitcoin, però està pivotant cap a IA i data centers.

El seu atractiu és evident: si la IA necessita cada cop més energia i capacitat física, les empreses amb accés a electricitat i sòl es poden convertir en peces clau. Però el risc també és alt: finançament, deute, dilució, execució de projectes i captació de clients.

Applied Digital: infraestructura física per a IA

Applied Digital completa la tesi des del costat físic. Dissenya, construeix i opera data centers per a IA, HPC i cloud. Si falten centres de dades preparats per a GPUs, companyies així es poden beneficiar.

El risc està que construir data centers és car, lent i complex. Cal aconseguir energia, permisos, refrigeració, finançament i clients que ocupin la capacitat contractada.

Per què els models open-weight poden canviar l’equilibri

Durant molt de temps, els millors models eren tancats. Si volies màxima qualitat, feies servir OpenAI, Anthropic o Google. Els models locals eren útils, però quedaven endarrere.

Això està canviant. Famílies com Llama, Mistral, Qwen, DeepSeek o Kimi han demostrat que els models open-weight es poden acostar molt als propietaris en moltes tasques. No sempre guanyen, però cada generació redueix la distància.

I això canvia la decisió empresarial. Una empresa no necessita sempre el model més potent del planeta. Necessita un model que faci bé la seva feina, sigui segur, personalitzable i tingui un cost raonable.

Si un model open-weight és prou bo per al 70%, 80% o 90% de certs fluxos interns, moltes companyies el faran servir en infraestructura pròpia o llogada. Aquest moviment augmenta la demanda de servidors GPU.

Models més eficients poden augmentar la demanda, no reduir-la

Una objecció habitual és que els models seran cada cop més eficients i, per tant, faran falta menys GPUs. A curt termini pot semblar lògic. Si cada consulta consumeix menys, baixa la infraestructura necessària per petició.

Però en tecnologia sol passar el contrari: quan una cosa s’abarateix, es fa servir moltíssim més.

Si la inferència baixa de preu, apareixeran més casos d’ús:

Agents treballant tot el dia.
IA integrada en tots els SaaS.
Atenció al client automatitzada.
Cerca semàntica empresarial.
Generació d’imatge, vídeo, veu i codi.
Robòtica i automatització industrial.
Copilots interns per a empleats.
Anàlisi massiva de documents.
Sistemes multiagent.

Encara que cada consulta costi menys, el nombre total de consultes es pot multiplicar. Per això l’eficiència no destrueix necessàriament la tesi. La pot ampliar.

Riscos d’invertir en infraestructura per a IA local

La tesi és atractiva, però no està garantida. Hi ha riscos importants que convé vigilar.

Excés de capacitat

Si massa empreses construeixen data centers al mateix temps, pot aparèixer sobreoferta. Això pressionaria els preus de lloguer de GPUs i de capacitat cloud.

Deute i dilució

Moltes companyies necessiten grans quantitats de capital. Poden emetre deute, vendre accions o signar acords complexos. Això pot afectar l’accionista si el creixement no ho compensa.

Obsolescència de GPUs

El maquinari envelleix ràpid. Una GPU punter avui pot ser menys competitiva en pocs anys. Renovar capacitat serà una exigència constant.

Dependència de pocs clients

Algunes empreses d’infraestructura tenen contractes enormes amb pocs clients. Això pot ser positiu si tot va bé, però perillós si un client renegocia, ajorna o cancel·la.

Competència dels hyperscalers

AWS, Azure, Google Cloud i Oracle també construeixen capacitat. Si baixen preus o integren millor els seus serveis, poden pressionar les neoclouds.

APIs tancades cada cop més barates

Si OpenAI, Anthropic o Google redueixen molt els preus, algunes empreses preferiran no complicar-se desplegant models propis.

Quines senyals vigilar

Per saber si aquesta tesi avança, no n’hi ha prou amb mirar el preu de les accions. Cal observar senyals operatives.

CoreWeave i Nebius: backlog, contractes, utilització de GPUs, marge brut, deute, capex i diversificació de clients.
DigitalOcean: ingressos vinculats a IA, adopció de GPU Droplets, retenció de clients i facilitat de desplegament.
Oracle: creixement d’OCI, contractes cloud d’IA i adopció enterprise.
IREN i Applied Digital: MW contractats, dates reals de lliurament, finançament, clients investment-grade, cost de construcció, energia disponible i dilució.

Com organitzar una cistella d’empreses

Una manera senzilla d’ordenar aquesta oportunitat seria per capes:

Nucli de cloud IA pura: CoreWeave i Nebius.
Capa developer i pimes: DigitalOcean.
Capa enterprise: Oracle.
Capa física i energètica: IREN i Applied Digital.

No totes tenen el mateix risc. CoreWeave i Nebius són més directes. DigitalOcean es pot beneficiar de la democratització. Oracle aporta estabilitat. IREN i Applied Digital són més agressives i depenen molt de l’execució física.

Conclusió: la IA local també viurà al núvol

La IA local no significa que tot s’hagi d’executar a casa. La versió gran d’aquesta tendència serà que empreses, startups i desenvolupadors executin models propis en infraestructura llogada.

Si els models open-weight continuen millorant, moltes companyies voldran independència, privacitat i control. Per aconseguir-ho necessitaran GPUs, servidors, data centers, energia, refrigeració i programari cloud.

Això dona una tesi clara a empreses com CoreWeave, Nebius, DigitalOcean, Oracle, IREN i Applied Digital. L’oportunitat pot ser enorme, però també el risc. Hi haurà cicles, caigudes fortes, ampliacions de capital, deute i dubtes sobre l’excés de capacitat.

Però la direcció de fons té sentit: si la IA es converteix en una capa bàsica de l’economia, algú l’haurà d’allotjar. I no tota aquesta IA viurà a les APIs tancades dels gegants. Molta viurà en models propis, desplegats en servidors llogats.

El futur no serà només “fer servir ChatGPT”. També serà que milers d’empreses executin els seus propis models en núvols privats, GPUs llogades i data centers especialitzats.

I el teu negoci? Si et planteges fer el salt a la IA amb control real sobre les teves dades, a DominaInternet t’ajudem a muntar la teva pròpia infraestructura d’IA, a connectar-la amb els teus processos mitjançant automatització i a integrar-la al teu programari de gestió. Explica’ns el teu cas i et preparem un pressupost sense compromís, o escriu-nos directament des de contacte.