Catena di sollecitazione del pensiero: Guidare l'intelligenza artificiale a pensare passo dopo passo

Catena di sollecitazione del pensiero: Guidare l'intelligenza artificiale a pensare passo dopo passo
Cos'è il Prompting a catena di pensieri?
Il Chain-of-thought (CoT) è una tecnica di prompt engineering che aiuta i grandi Large Language Models (LLMs) a scomporre problemi complessi in passaggi più piccoli e semplici. Invece di dare una risposta diretta, il modello segue una sequenza di pensieri o ragionamenti, come una persona potrebbe risolvere un problema passo dopo passo.
Come funziona il prompt a catena di pensieri?
Il Chain-of-thought prompting funziona guidando i [modelli AI] (https://zilliz.com/glossary/foundation-models) ad affrontare problemi complessi passo dopo passo. Questo metodo si basa sul ragionamento sequenziale: ogni passo si basa sul precedente. Ad esempio, supponiamo che al modello venga chiesto un difficile problema di matematica. Invece di tentare di dare subito la risposta finale, il modello procede prima con calcoli o passaggi logici più piccoli, che portano a un risultato finale più accurato. Questo processo di scomposizione del problema aiuta il modello a ottenere la risposta giusta e a capire come ci è arrivato, migliorando la qualità complessiva della risposta.
Esempio pratico: Prima e dopo il prompt della catena di pensiero
Vediamo come funziona la CoT attraverso un esempio in azione. I due prompt mostrano come la sollecitazione a catena del pensiero influisce sulla risposta del modello AI.
1. Prompt prima della CoT
Categorizza le seguenti recensioni degli utenti come "positive", "negative" o "neutre":
"Il prodotto è arrivato in ritardo ma funziona bene".
"Servizio e qualità assolutamente fantastici!".
"Non mi piaceva il colore, ma l'assistenza clienti è stata utile".
_"Esperienza terribile. Non la consiglierei.
{\an8}"Va bene, fa il suo dovere".
Risposta:
Prompt senza COT.png
Figura: Prompt senza COT
Analisi:
Nel prompt ingenuo, il modello fornisce un output di base in cui ogni recensione viene semplicemente classificata senza spiegare come si è arrivati a ciascuna decisione. Non mostra all'utente il ragionamento che sta alla base della categorizzazione né fornisce indicazioni su quali parole o frasi specifiche sono state considerate positive o negative. L'output è corretto, ma manca di profondità e trasparenza.
2. Prompt dopo la CoT
- Classificare le seguenti recensioni degli utenti come "positive", "negative" o "neutre". Per ogni recensione, seguite i seguenti passaggi:_
Leggere attentamente la recensione.
Individuare le parole o le frasi positive.
Individuare le parole o le frasi negative.
Valutare il sentimento complessivo sulla base degli elementi positivi e negativi.
Assegnare la categoria appropriata.
Presentare tutte le informazioni in una tabella.
Procedere con ogni revisione
"Il prodotto è arrivato in ritardo ma funziona bene".
"Servizio e qualità assolutamente fantastici!".
"Non mi piaceva il colore, ma l'assistenza clienti è stata utile".
_"Esperienza terribile. Non la consiglierei.
{\an8}"Va bene, fa il suo dovere".
Risposta:
Prompt con CoT
Figura: Prompt con CoT
Analisi:
Il modello spiega il suo ragionamento identificando frasi positive e negative in ogni recensione, dando all'utente una chiara comprensione della decisione.
Viene generata una tabella che non solo elenca la categoria finale, ma mostra anche le frasi chiave del sentiment per ogni recensione, rendendo l'output più strutturato e trasparente.
Varianti della catena di pensiero con esempi di promemoria
Ecco diversi tipi di sollecitazione del Pensiero a catena con esempi pratici e puntuali per ciascuno di essi:
1. Prompt a catena di pensiero standard
Questo tipo di catena di pensieri chiede al modello di riflettere su ogni parte del problema passo dopo passo.
Esempio di prompt:
Un treno che si muove a 60 miglia all'ora deve percorrere 180 miglia. Quanto tempo ci vorrà per completare il viaggio? Procediamo passo dopo passo.
Risposta prevista del modello:
"Il treno viaggia a 60 miglia all'ora".
"La distanza da percorrere è di 180 miglia".
"Per trovare il tempo, dobbiamo dividere la distanza per la velocità: 180 ÷ 60 = 3".
"Quindi, ci vorranno 3 ore per raggiungere la destinazione".
2. Prompting a catena di pensieri a pochi colpi di pistola
In una CoT a pochi colpi, al modello vengono forniti alcuni esempi prima che gli venga chiesto di risolvere un nuovo problema.
Esempio di prompt:
Ecco un esempio: Qual è la sua velocità se un'auto percorre 100 miglia in 2 ore? La velocità è 100 ÷ 2 = 50 miglia all'ora. Ecco un altro esempio: Se un aereo percorre 600 miglia in 3 ore, la velocità è 600 ÷ 3 = 200 miglia all'ora. Ora, utilizzando gli stessi passaggi, se un ciclista percorre 90 miglia in 3 ore, qual è la sua velocità?
Risposta modello attesa:
"La distanza è di 90 miglia e il tempo è di 3 ore".
"Per trovare la velocità, dividiamo 90 per 3".
"90 ÷ 3 = 30 miglia all'ora".
3. Catena di pensieri autoconsistenti
Il modello genera più percorsi di ragionamento e sceglie la risposta più coerente.
Esempio di prompt:
Se una persona compra 6 mele per 12 dollari, quanto costa ogni mela? Proviamo a risolvere questo problema in modi diversi e confrontiamo le risposte "**. Risposta prevista del modello:
Percorso 1:
- "Il costo totale è di 12$ e ci sono 6 mele".
- "12$ ÷ 6 = 2$ per mela". Percorso 2:
- "Se 6 mele costano 12$, allora ogni mela costa 2$ perché 12$ diviso 6 è uguale a 2$". Risposta finale: "Entrambi i metodi portano allo stesso risultato, quindi il costo per mela è di 2$".
4. Catena di pensiero interattiva
In questa variante il modello chiede chiarimenti o informazioni aggiuntive quando necessario. Esempio di prompt: _"Avete un totale di 50 dollari e volete comprare dei libri. Ogni libro costa 7 dollari. Quanti libri puoi comprare e quanti soldi ti rimangono? Chiedete se avete bisogno di ulteriori informazioni prima di risolvere il problema". Risposta modello attesa: 1. "Le tasse sono incluse nel prezzo del libro o sono solo 7 dollari a libro?". (Se l'utente conferma che si tratta di 7 dollari per libro senza tasse) 2. "Bene, senza tasse, 50$ diviso 7$ dà circa 7 libri. Poiché 7 × 7 è uguale a 49". 3. "Ti rimane 1$ dopo aver acquistato 7 libri".
5. Catena di pensiero multi-agente
In questo caso, più agenti AI lavorano insieme per risolvere il problema affrontando parti diverse. Esempio: "Ci sono 45 studenti e 9 studenti. Ci sono 45 studenti e 9 insegnanti che vanno in gita. Se ogni autobus può contenere 15 persone, quanti autobus sono necessari? Facciamo in modo che un agente calcoli il numero di persone totali, un altro agente calcoli la divisione e un terzo verifichi la soluzione ". Risposta prevista del modello: Agente 1: "Il numero totale di persone è 45 studenti + 9 insegnanti = 54 persone". Agente 2: "Dividiamo 54 persone per 15 per autobus: 54 ÷ 15 = 3,6, il che significa che abbiamo bisogno di 4 autobus". Agente 3: "Il numero totale di persone e il calcolo sono esatti." Abbiamo bisogno di 4 autobus".
6. Catena di pensiero ricorsiva
Il modello verifica il proprio ragionamento e rivede i passaggi se necessario. Esempio di prompt: "Con 120 dollari in mano, spendi 45 dollari per la spesa, 30 dollari per la benzina e 20 dollari per l'intrattenimento. Quanto denaro ti rimane? Controllate i vostri calcoli man mano che procedete". Risposta prevista del modello:
- "Inizio con 120 dollari".
- "$120 - $45 = $75."
- "$75 - $30 = $45."
- "$45 - $20 = $25."
- "Controllo: \120$ - 45$ = 75$, poi 75$ - 30$ = 45$ e infine 45$ - 20$ = 25$. La risposta è $25".
Quando usare il prompt della catena di pensiero
La sollecitazione a catena di pensieri è adatta a compiti che richiedono un ragionamento in più fasi, un pensiero logico o un'analisi attenta. Di seguito sono riportati alcuni scenari in cui la CoT può essere utile:
**Quando il compito comporta operazioni o calcoli multipli, la CoT guida il modello attraverso ogni fase. Ad esempio, la risoluzione di problemi di parole o di aritmetica complessa richiede la scomposizione delle informazioni in pezzi più piccoli e gestibili prima di eseguire i calcoli.
**La CoT è ideale per i compiti in cui il modello deve analizzare le informazioni passo dopo passo, ad esempio per prendere una decisione basata su diversi fattori o per risolvere un puzzle che richiede passaggi logici.
**Compiti come far quadrare un bilancio, seguire una ricetta o risolvere un problema tecnico richiedono spesso diverse fasi. La CoT aiuta il modello a seguire questi passaggi nel giusto ordine.
**La CoT può guidare il modello attraverso il ragionamento necessario per fornire una risposta più accurata e dettagliata quando gli vengono poste domande complesse in campo scientifico, giuridico o filosofico. Invece di tirare a indovinare, analizza i fatti e la logica necessari per dare una risposta valida.
Migliorare ulteriormente il prompt della catena del pensiero
Per migliorare ulteriormente l'efficacia del prompt, si possono combinare altre tecniche per gestire il ragionamento. Ad esempio:
**La qualità del prompt ha un impatto significativo sul ragionamento. I prompt dovrebbero essere progettati per migliorare la CoT e suddividere i problemi in passaggi logici. Più il prompt è strutturato e dettagliato, meglio il modello seguirà il processo di ragionamento.
**L'apprendimento in pochi momenti, in cui il modello fornisce alcuni esempi di ragionamento attraverso i problemi, può migliorare la CoT. Mostrando al modello diversi casi simili in cui è stato utilizzato un ragionamento passo-passo, il modello può capire meglio come affrontare nuovi compiti.
**Un modo per migliorare la CoT è quello di chiedere al modello di verificare il proprio ragionamento. Dopo aver generato una risposta, si può chiedere al modello di rivedere i suoi passaggi per vedere se hanno senso. Questo aiuta a cogliere eventuali errori logici o lacune prima di dare la risposta finale.
**L'autoconsistenza: ** L'autoconsistenza è un metodo in cui il modello genera più percorsi di ragionamento e poi li confronta per vedere se portano alla stessa conclusione. Se più percorsi concordano, è più probabile che il modello sia arrivato alla risposta corretta. Ad esempio, si può chiedere al modello di risolvere un problema in due modi diversi e selezionare la risposta più coerente tra i diversi approcci.
Limitazioni del prompt della catena di pensiero
Sebbene il prompt a catena di pensieri sia un approccio potente per migliorare il ragionamento dell'intelligenza artificiale, presenta alcune limitazioni che possono influire sulla sua efficacia in determinati scenari.
**1. La CoT dipende dal fatto che il modello segua un processo logico e graduale. Tuttavia, se il modello commette un errore in una fase, tale errore può essere trasmesso alla risposta finale.
**2. La CoT richiede più risorse computazionali perché il modello deve riflettere su ogni fase invece di fornire una risposta diretta. Questo può rendere il processo più lento e più dispendioso in termini di risorse, soprattutto per problemi complessi o in più fasi. In situazioni in cui la velocità è una priorità, la CoT potrebbe non essere l'ideale.
4. Dipendenza da prompt ben progettati: L'efficacia della CoT dipende fortemente dalla qualità dei prompt forniti. Se il prompt non è chiaro o ben strutturato, il modello potrebbe faticare a ragionare sul problema. La creazione di questi prompt richiede impegno e competenza.
5. Generalizzazione limitata a compiti non familiari: la CoT è molto efficace per compiti già visti o che assomigliano molto a compiti precedenti. Tuttavia, quando gli vengono presentati problemi o compiti sconosciuti al di fuori dei dati di addestramento, il modello può faticare ad applicare la CoT in modo efficace, poiché si basa su schemi di ragionamento appresi.
6. Rischio di adattamento eccessivo alla struttura dei prompt: nel corso del tempo, un modello addestrato a utilizzare la CoT potrebbe diventare eccessivamente dipendente da prompt specifici, limitando la flessibilità. (https://zilliz.com/learn/understanding-regularization-in-nueral-networks) potrebbe aspettarsi che i problemi siano sempre presentati in un particolare formato, rendendo più difficile per il modello adattarsi a compiti nuovi o formulati in modo diverso.
Casi d'uso nel mondo reale del prompt a catena di pensiero
Il prompt a catena del pensiero ha un'ampia gamma di applicazioni pratiche in vari campi. Ecco alcuni casi d'uso reali in cui la CoT può essere molto utile:
1. Risoluzione di problemi matematici
La CoT è estremamente utile nella didattica della matematica e nelle piattaforme di tutoraggio. Gli studenti possono comprendere il processo di scomposizione dei problemi matematici in fasi logiche più piccole, invece di ottenere solo la risposta finale. È utile anche per i calcoli avanzati in aree come l'algebra, il calcolo e la statistica.
2. Ragionamento giuridico e analisi dei contratti
Nei sistemi legali, la CoT aiuta i sistemi di intelligenza artificiale a valutare i documenti legali, ad analizzare le clausole e a generare consigli legali esaminando sistematicamente ogni punto di un contratto o di un caso. Può anche spiegare passo per passo il [ragionamento giuridico] (https://zilliz.com/blog/simplifying-legal-research-with-rag-milvus-ollama) che rende l'IA più trasparente e affidabile nei processi legali.
3. Assistenza clienti e risoluzione dei problemi
La CoT aiuta i chatbot o i sistemi di supporto guidati dall'intelligenza artificiale a guidare gli utenti attraverso processi di risoluzione dei problemi passo dopo passo. Questo è utile per i problemi tecnici, quando l'utente deve seguire istruzioni o passaggi diagnostici per risolvere un problema.
4. Diagnosi medica e supporto alle decisioni
La CoT può aiutare i medici o gli operatori sanitari ad analizzare i sintomi, i risultati degli esami e l'anamnesi per suggerire possibili diagnosi o trattamenti, spiegando come si giunge a ciascuna conclusione.
5. Risposta a domande complesse
La CoT è molto efficace nel rispondere a domande complesse che richiedono più del semplice recupero di un fatto. Per domande in campi come la storia, la scienza o la legge, la CoT può aiutare i sistemi di intelligenza artificiale a fornire risposte dettagliate e in più fasi, spiegando il ragionamento della risposta.
6. Strategia di gioco e risoluzione di enigmi
Nei giochi, le strategie vengono generate considerando più fasi di una sequenza. La CoT scompone le strategie complesse in scenari di gioco o di risoluzione di enigmi in mosse più piccole e ponderate che portano a un migliore processo decisionale e a una migliore giocabilità in giochi come gli scacchi, il Go o i giochi basati su enigmi.
Come può Milvus aumentare l'efficienza del prompt della catena del pensiero?
Milvus, un database vettoriale open-source sviluppato da Zilliz, è progettato per archiviare e recuperare in modo efficiente dati non strutturati come immagini, testi e video. Mentre il prompt Chain-of-Thought si concentra sul miglioramento delle capacità di ragionamento dei modelli di intelligenza artificiale, Milvus migliora il modo in cui questi modelli gestiscono ed elaborano dati vettoriali su larga scala.
- **La CoT si basa sul fatto che i modelli di intelligenza artificiale hanno accesso alle informazioni rilevanti per ragionare passo dopo passo. Milvus è un backend efficiente, in grado di memorizzare grandi quantità di dati vettoriali (come le incorporazioni di testo) e di fornire un rapido recupero. Ciò consente ai modelli di intelligenza artificiale di accedere ai dati di cui hanno bisogno in ogni fase del processo di ragionamento senza ritardi.
Supportare applicazioni su larga scala: In molti casi del mondo reale, i prompt delle CoT richiedono la gestione di ampie serie di dati per il ragionamento in più fasi. Milvus, in molti casi reali, consente ai modelli di intelligenza artificiale di lavorare con grandi insiemi di dati senza compromettere la velocità o le prestazioni.
**Milvus è costruito per velocizzare le [ricerche semantiche] (https://zilliz.com/glossary/semantic-search) e le [ricerche di similarità] (https://zilliz.com/learn/vector-similarity-search), il che migliora la CoT consentendo all'IA di accedere rapidamente a dati semanticamente correlati. Ciò accelera il processo di ragionamento, in quanto il modello è in grado di estrarre le informazioni rilevanti in modo più accurato ed efficiente quando risolve problemi a più fasi.
Conclusione
In sintesi, il Chain-of-Thought Prompting aiuta i modelli di intelligenza artificiale ad affrontare problemi complessi suddividendoli in passaggi logici, migliorando l'accuratezza e la chiarezza. Milvus migliora questo processo consentendo l'accesso rapido a grandi quantità di dati non strutturati, in modo che l'IA possa estrarre le informazioni pertinenti durante ogni fase. CoT e Milvus offrono soluzioni pratiche per la gestione di compiti complessi in settori quali la ricerca, l'assistenza clienti e l'analisi finanziaria, rendendo l'IA più efficace e affidabile nelle applicazioni reali.
FAQ sul Prompt a catena di pensiero
**Come fa il Chain-of-Thought Prompting a migliorare il ragionamento dell'intelligenza artificiale?
Il prompt a catena di pensieri migliora il ragionamento dell'intelligenza artificiale guidando il modello attraverso i problemi passo dopo passo. Questo metodo incoraggia il modello a scomporre compiti complessi in parti più piccole e gestibili, riducendo gli errori e migliorando la precisione.
Quando si dovrebbe usare il Chain-of-Thought Prompting?
La CoT è più indicata per i compiti che richiedono un ragionamento in più fasi, un'analisi logica profonda o la risoluzione di problemi complessi. Tra gli esempi si possono citare i problemi matematici, le deduzioni logiche, la risoluzione di problemi tecnici e i processi decisionali multi-sfaccettati.
**Quali sono i principali vantaggi del Prompting a catena di pensiero?
I principali vantaggi della CoT includono una maggiore precisione, una migliore gestione dei problemi complessi, una riduzione degli errori, una maggiore trasparenza del modello e un approccio strutturato che rende il ragionamento dell'intelligenza artificiale più comprensibile e affidabile.
Come Milvus migliora l'efficienza del Chain-of-Thought Prompting?
Milvus migliora la richiesta di CoT memorizzando e recuperando in modo efficiente dati non strutturati su larga scala, come testi e immagini. Consente ai modelli di intelligenza artificiale di accedere rapidamente ai dati rilevanti in ogni fase del ragionamento per ottenere prestazioni fluide e veloci in compiti complessi e in più fasi.
**Come si differenzia il Chain-of-Thought Prompting dalle risposte tradizionali dell'IA?
Le risposte tradizionali dell'intelligenza artificiale spesso tentano di fornire una risposta diretta senza descrivere nel dettaglio il processo di ragionamento. Il Chain-of-Thought Prompting, invece, guida il modello a spiegare il suo ragionamento passo dopo passo, offre trasparenza e segue una progressione logica verso la soluzione.
Risorse correlate
[[2201.11903] Il Prompting a catena del pensiero evoca il ragionamento in modelli linguistici di grandi dimensioni](https://arxiv.org/abs/2201.11903)
Tutto quello che c'è da sapere sull'apprendimento a colpo zero
ChatGPT+ Database vettoriale + prompt-as-code - Lo stack CVP
Esplorare gli agenti guidati da LLM nell'era dell'intelligenza artificiale
- Cos'è il Prompting a catena di pensieri?
- Come funziona il prompt a catena di pensieri?
- Varianti della catena di pensiero con esempi di promemoria
- Quando usare il prompt della catena di pensiero
- Migliorare ulteriormente il prompt della catena del pensiero
- Limitazioni del prompt della catena di pensiero
- Casi d'uso nel mondo reale del prompt a catena di pensiero
- Come può Milvus aumentare l'efficienza del prompt della catena del pensiero?
- Conclusione
- FAQ sul Prompt a catena di pensiero
- Risorse correlate
Contenuto
Inizia gratis, scala facilmente
Prova il database vettoriale completamente gestito progettato per le tue applicazioni GenAI.
Prova Zilliz Cloud gratuitamente