LLM NN

Můj sen je vytvořit AI, která by přesně předpovídala cokoliv a z jakýchkoliv dat. 

Nyní bych tady chtěl navrhnout nový přístup, jak pomocí LLM snadno a zároveň komplexně předpovídat. 


LLM NN

Je běžné, že se pro předpovídání používají neuronové sítě. Jsem však přesvědčený, že stále více se budou využívat jazykové modely (https://drozhovory.blogspot.com/2023/12/jsou-llm-vhodne-pro-predpovidani.html). 

Nyní zde představuji způsob, jak spojit LLM a neuronovou síť (NN), který nazývám LLM NN. 

Tento přístup funguje následovně:

1) Řekněme, že potřebujeme předpovědět, kdo vyhraje fotbalový zápas, ale všimněte si, jak je tento přístup univerzální co do účelu i vstupních dat. 

2) Získáme data: k velkým sportovním událostem existuje spousta dat, jako statistiky, předpovědi, analýzy atd. Uložme je všechny do jednoho dokumentu. Data můžou být různá a může jich být hodně, LLM si s tím poradí. 

3) Prompt: budeme chtít po AI, aby vygenerovala prompty, které povedou k našemu účelu, předpovědi vítěze utkání, a jejich zařazení do vrstev. Můžeme si říct například o čtyři vrstvy. Neuronem zde bude AI odpověď na ten prompt. Vrstvou je pak skupina neuronů na stejné úrovni. 

Součástí tohoto promptu je i náš dokument s daty, aby AI mohla navrhnout prompty podle toho, jaká data jsou dostupná. 

4) První vrstva: ta bude ke každému navrženému promptu obsahovat i náš dokument s daty. Tato vrstva slouží k extrakci relevantních dat. 

5) N-tá vrstva: pokud budeme mít jednoduchou trychtýřovitou strukturu naší „neuronové sítě“, každý prompt v n-té vrstvě bude obsahovat i neurony (tedy AI výstupy) z předchozí vrstvy. Vrstvy povedou k závěrečné předpovědi, neurony budou stále konkrétnější, obecnější, odpovědi kratší a neuronů ve vrstvě bude ubývat. Zde už nemusíme přidávat náš dokument s daty. Samozřejmě lze použít i jinou architekturu „neuronové sítě“. 

6) Poslední vrstva: bude obsahovat závěrečnou predikci. 

Může být vhodné přidat kontrolní vrstvy, které posoudí kvalitu promptů nebo reasoningu a pokud kvalita nebude dostatečná, budou tyto vygenerovány znovu, případně nám bude oznámeno, že pro důvěryhodnou predikci nejsou vhodná data. 


Jaké jsou výhody tohoto přístupu:

1) Dáváme AI „čas k myšlení“ tím, že predikci rozdělujeme na mnoho promptů. AI se tak k závěrečné predikci dostane postupně, což bývá dobrým promptovacím zvykem. 

2) Transparentní reasoning: můžeme vidět neurony a tím vidět do myšlení AI. Můžeme tak například identifikovat, kde AI dělá chybu. 

3) Komplexní, přesto univerzální a snadno adaptovatelné na nový úkol. Není problém napsat jednoduchý kód, který všechny vrstvy provede. Nám pak stačí změnit pár slov v úvodním námi psaném promptu, například pokud budeme chtít předpovědět počet gólů a ne vítěze zápasu. 

4) Eliminace AI omylů tím, že ovlivní jen jeden neuron a ne celou predikci. Další vrstva si může omylu i všimnout.

5) Naše „neuronová síť“ se dívá na problém z různých úhlů pohledu nezávislých na sobě. Ty jsou dále rozvíjeny a slučovány. Je to možná podobné našemu myšlení, když se nad něčím hodně zamyslíme. 


Do budoucna lze očekávat samozřejmě více inteligentní jazykové modely, které taky budou levnější, což se u tohoto multi-prompt přístupu hodí.


Komentáře