Anthropic pubblica una Costituzione Claude di 80 pagine per aggiornare il quadro di allineamento dell’IA
PANews 23 gennaio: la società di modelli AI Anthropic ha recentemente reso pubblica la nuova versione della "Costituzione Claude" e l'ha aperta con licenza Creative Commons CC0 1.0, utilizzandola come "massima autorità" per l'addestramento, la generazione di dati sintetici e il feedback di ranking; il documento passa dall'elencare principi a spiegare "perché così", per migliorare la generalizzazione in nuovi contesti. Il file è ordinato per ampia sicurezza > ampia etica > rispetto delle linee guida > aiuto sincero, elencando "vincoli rigidi" (come il divieto di fornire assistenza sostanziale nella creazione di armi biologiche), e include capitoli su virtù, sicurezza psicologica e autoconsapevolezza del modello, sottolineando trasparenza e iterazione continua.
Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.

