RAG
Retrieval Augmented Generation
Generazione aumentata del recupero
È un acronimo utilizzato per indicare il processo IR (Information retrieval) ovvero recuperare le informazioni modificando le interazioni con un modello LLM (Large Language Model) in modo che il modello RAG (Retrieval Augmented Generation) possa rispondere alle query (query) degli utenti perché usa come riferimento il set di documenti del modello LLM (Large Language Model) in preferenza alle informazioni tratte dai dati training, validation, and test suoi vasti dati di formazione statici.
Il processo su cui si basa il modello RAG (Retrieval Augmented Generation) si compone delle seguenti quattro fasi chiave:
- tutti i dati devono essere preparati;
- indicizzati: i dati devono prima essere convertiti in incorporamenti LLM (Large Language Model);
- ogni query prevede le seguenti fasi:
- recupero: dopo aver inserito la query si avvia il processo di recuperp dei documenti per selezionare i documenti più rilevanti;
- aumento: i documenti più rilevanti saranno utilizzati per aumentare la query tramite un processo di prompt engineering (ingegneria rapida);
- generazione: il modello LLM (Large Language Model) può generare output basati sia sulla query che sui documenti recuperati.
Il processo RAG (Retrieval Augmented Generation) può essere utilizzato su dati non strutturati (ad esempio testo), semi-strutturati o strutturati (ad esempio “knowledge graph”) e memorizzati in un database vettoriale (elenchi di numeri a lunghezza fissa ed elementi di dati) per consentirne il recupero.
I database vettoriali in genere implementano uno o più algoritmi ANN (Approximate Nearest Neighbor) per la ricerca del vicino più prossimo approssimativo può restituire punti la cui distanza dalla query è al massimo “C” volte la distanza dalla query ai suoi punti più vicini e in molti casi, un vicino più vicino approssimativo è quasi buono quanto quello esatto. Se la misura della distanza cattura accuratamente la nozione di qualità dell’utente, allora le piccole differenze nella distanza non dovrebbero avere importanza.
Nel mondo del WWW (World Wide Web) viene usato per collegare un modello linguistico di IA (Intelligenza Artificiale) a dati indicizzati nel WWW (World Wide Web), l’accesso alle fonti di informazione (autorevoli e affidabili) gli consente di fornire risposte contestualmente rilevanti e aggiornate.