AI bude na jednotku inteligence zlevňovat.

V poslední době je častým tématem, zda cena AI (inference přes předplatné nebo API) bude zlevňovat, nebo zdražovat. To je podle mě velmi závažné téma, protože do velké míry určí, jak bude vypadat budoucnost nás i budoucnost lidstva. Je tedy myslím velmi praktické mít v tomto jasno, abychom věděli, s čím máme počítat do budoucna. Proto bych zde rád rozebral několik argumentů. 

Podle mě bude AI na jednotku inteligence zlevňovat. 


Argumenty pro zlevňování:

1) Informační technologie obvykle zlevňují.

Různé zákony jako ten na obrázku jasně říkají, že s růstem poptávky po IT klesá cena IT. Poptávka umožňuje investice, které vedou úsporám a novým techologiím. 

2) AI procesory na jednotku výkonu dlouhodobě zlevňují.

GPU, TPU a další - jsou na jednotku výkonu ročně o cca 37 % levnější. 

3) Ceny energie.

Ani ty nemusejí být důvodem pro zdražování AI. U datových center se často preferují obnovitelné zdroje elektřiny (solární, větrné atd), jejichž cena exponenciálně klesá. Opět můžeme čekat, že v případě vysoké spotřeby dojde k investicím na straně energetiky a elektřina bude zlevňovat ještě rychleji. Díky tomu i samotný provoz AI bude velmi levný. 

4) Zlepšují se i AI modely.

Pro jednoduché účely budou stačit stále menší modely. Jsme v době, kdy modely o několika miliardách parametrů konkurují těm největším, zejména v úžších doménách, které nevyžadují spoustu znalostí. 

5) Vysoká konkurence.

Jak mezi laboratořemi, tak i od otevřených modelů, které už mají dostatečnou kvalitu, aby konkurovaly těm běžně používaným. To samozřejmě vytváří velký tlak na snížení ceny blíž k úrovni nákladů. 

6) Rostoucí efektivita reasoningu.

Výše jsme se zabývali klesající cenou na token. Počet spotřebovaných tokenů ale bude další silou, která konečnou cenu bude snižovat. Budoucí chytřejší modely budou potřebovat méně přemýšlet. Budou i chytřejší reasoning techniky.

7) Další možné optimalizace.

Model routing a inteligentní směřování dotazů vždy k nejvhodnějším modelům s ohledem na cenu a inteligenci, více dostupných modelů pro různé požadavky ohledně ceny, inteligence a dalších metrik, takže každý bude používat to, co je pro něj výhodné. Můžou se také objevit specializované malé modely pro užší úkoly. Další optimalizace se můžou týkat efektivity agentů. 


Námitky: nemění hlavní trend

1) Roste poptávka, proto poroste cena.

Tento argument ignoruje skutečnost, že v IT to funguje obráceně: rostoucí poptávka cenu snižuje. Růst poptávky sice může zvýšit cenu v krátkém období, ale pokud AI roste předvídatelným způsobem (vizte masivní investice do infrastruktury u top poskytovatelů), ani to se nejspíš nestane. 

2) AI je poskytovateli dotovaná, proto musí zdražit.

Tento argument se zaměřuje na aktuální náklady. Ty ale, jak jsme si ukázali, klesají. Stačí, když budou klesat rychleji než cena, a AI poskytovatelé budou časem ziskoví. Ve skutečnosti jsou někteří ziskoví už dnes, viz Anthropic (v Q2 očekává první profitabilní čtvrtletí) nebo Google (AI-tažený cloud rostl o 63 % a zvýšil zisk 3x). 

3) AI ušetří spoustu práce, musí tomu odpovídat cena.

Cenu technologií ale neurčuje jimi ušetřená práce a užitečnost. Jinak by už teď počítače stály minimálně miliardy. Mohlo by to tak být v případě monopolu na výrobu technologií. AI je ale velmi konkurenční prostředí mnoha laboratoří a poskytovatelů, navíc máme otevřené modely atd. 

4) RAM a další hardwarové věci zdražují, což ukazuje, že hardware, a tedy i AI inference může zdražit.

Zdražení je zde ale pouze krátkodobé, dlouhodobý trend je samozřejmě zlevňování. Zdražuje kvůli tomu, že se investice přesunuly do AI, díky vyšší poptávce (vizte výše). 

5) Velké náklady na infrastrukturu u velkých poskytovatelů.

Velké investice do infrastruktury samy o sobě nejsou důkazem zdražení. Naopak můžou zabránit nedostatku kapacity a vytvořit tlak na nižší jednotkové ceny.

6) Dnešní snaha o získání podílu na trhu.

Nízké ceny samy o sobě nejsou důkazem, že se v budoucnu budou muset zvýšit. Naopak podle mě jsou ceny, pokud nyní pod úrovní nákladů, nastavené na úroveň očekávaných budoucích nákladů. Strategie napřed nízkých cen a jejich následného zvýšení by nejspíš ani neměla velký smysl, kdyby ji provozovali všichni poskytovatelé inteligence. Navíc v tomto odvětví bývají náklady na změnu poskytovatele velmi nízké - pokud někdo náhle zdraží, může přijít o velkou část zákazníků. 


Dodatek:

1) Co zdraží: 

Výše jsem psal o inteligenci vystavené konkurenci. Bezkonkurenční modely typu Mythos zlevnit nemusejí. Tam můžeme naopak zaznamenat zdražení. Je možné, že o trochu chytřejší AI model vymyslí nesrovnatelně chytřejší věci. Proto může mít cenu nesrovnatelnou s o trochu hloupějšími modely. 

2) Praktické ceny:

Ve skutečnosti cenu AI určuje i úroveň inteligence. Výše jsem psal o ceně při konstantní inteligenci. Záleží ale i samozřejmě na tom, jaká úroveň inteligence bude poptávaná. Například pokud budou zákazníci preferovat chytré modely, praktická cena vzroste. 

3) Další vlivy:

Samozřejmě jsou ve hře i další věci než úroveň inteligence, které můžou ovlivnit cenu, jako například rychlost generování. Rychleji generující model/poskytovatel bude mít před pomalejšími výhodu. Toto platí i u spotřebitelských služeb, kde je ve hře i celková použitelnost aplikací nebo šířka nabídky v rámci předplatného. 

4) Které argumenty pro zdražení mají smysl:

Je pár argumentů, které vyvrátit nemůžu a přiznejme si je. Budoucnost je nejistá, a tak se můžou objevit problémy, které budou zdražování bránit. Jsou to zejména možné vlivy, které můžou omezit rozsah poskytování AI, takže nestačí rychle rostoucí poptávce, jako možné regulace a omezení od států, požadavky na bezpečnost či ochranu osobních údajů nebo potíže s dostupností energie, vody a dalších zdrojů pro datová centra. 

Komentáře