LLM NN
Můj sen je vytvořit AI, která by přesně předpovídala cokoliv a z jakýchkoliv dat.
Nyní bych tady chtěl navrhnout nový přístup, jak pomocí LLM snadno a zároveň komplexně předpovídat.
LLM NN
Je běžné, že se pro předpovídání používají neuronové sítě. Jsem však přesvědčený, že stále více se budou využívat jazykové modely (https://drozhovory.blogspot.com/2023/12/jsou-llm-vhodne-pro-predpovidani.html).
Nyní zde představuji způsob, jak spojit LLM a neuronovou síť (NN), který nazývám LLM NN.
Tento přístup funguje následovně:
1) Řekněme, že potřebujeme předpovědět, kdo vyhraje fotbalový zápas, ale všimněte si, jak je tento přístup univerzální co do účelu i vstupních dat.
2) Získáme data: k velkým sportovním událostem existuje spousta dat, jako statistiky, předpovědi, analýzy atd. Uložme je všechny do jednoho dokumentu. Data můžou být různá a může jich být hodně, LLM si s tím poradí.
3) Prompt: budeme chtít po AI, aby vygenerovala prompty, které povedou k našemu účelu, předpovědi vítěze utkání, a jejich zařazení do vrstev. Můžeme si říct například o čtyři vrstvy. Neuronem zde bude AI odpověď na ten prompt. Vrstvou je pak skupina neuronů na stejné úrovni.
Součástí tohoto promptu je i náš dokument s daty, aby AI mohla navrhnout prompty podle toho, jaká data jsou dostupná.
4) První vrstva: ta bude ke každému navrženému promptu obsahovat i náš dokument s daty. Tato vrstva slouží k extrakci relevantních dat.
5) N-tá vrstva: pokud budeme mít jednoduchou trychtýřovitou strukturu naší „neuronové sítě“, každý prompt v n-té vrstvě bude obsahovat i neurony (tedy AI výstupy) z předchozí vrstvy. Vrstvy povedou k závěrečné předpovědi, neurony budou stále konkrétnější, obecnější, odpovědi kratší a neuronů ve vrstvě bude ubývat. Zde už nemusíme přidávat náš dokument s daty. Samozřejmě lze použít i jinou architekturu „neuronové sítě“.
6) Poslední vrstva: bude obsahovat závěrečnou predikci.
Může být vhodné přidat kontrolní vrstvy, které posoudí kvalitu promptů nebo reasoningu a pokud kvalita nebude dostatečná, budou tyto vygenerovány znovu, případně nám bude oznámeno, že pro důvěryhodnou predikci nejsou vhodná data.
Jaké jsou výhody tohoto přístupu:
1) Dáváme AI „čas k myšlení“ tím, že predikci rozdělujeme na mnoho promptů. AI se tak k závěrečné predikci dostane postupně, což bývá dobrým promptovacím zvykem.
2) Transparentní reasoning: můžeme vidět neurony a tím vidět do myšlení AI. Můžeme tak například identifikovat, kde AI dělá chybu.
3) Komplexní, přesto univerzální a snadno adaptovatelné na nový úkol. Není problém napsat jednoduchý kód, který všechny vrstvy provede. Nám pak stačí změnit pár slov v úvodním námi psaném promptu, například pokud budeme chtít předpovědět počet gólů a ne vítěze zápasu.
4) Eliminace AI omylů tím, že ovlivní jen jeden neuron a ne celou predikci. Další vrstva si může omylu i všimnout.
5) Naše „neuronová síť“ se dívá na problém z různých úhlů pohledu nezávislých na sobě. Ty jsou dále rozvíjeny a slučovány. Je to možná podobné našemu myšlení, když se nad něčím hodně zamyslíme.
Do budoucna lze očekávat samozřejmě více inteligentní jazykové modely, které taky budou levnější, což se u tohoto multi-prompt přístupu hodí.
Komentáře
Okomentovat