Applicazioni,  Intelligenza Artificiale,  Internet,  Software,  Storia,  Tecnologia

Anthropic presenta Claude 3.5 Sonnet

Claude 3.5 Sonnet

Anthropic ha presentato Claude 3.5 Sonnet, il suo modello di intelligenza artificiale più avanzato fino ad oggi, stabilendo nuovi benchmark per l’industria in termini di ragionamento, conoscenza e abilità di codifica. Funzionando a una velocità doppia rispetto al suo predecessore, eccelle in compiti complessi e introduce la funzione innovativa Artifacts per una maggiore collaborazione.

Una risposta a Gemini e ChatGPTo: Prestazioni e Capacità

Claude 3.5 Sonnet dimostra miglioramenti significativi in termini di prestazioni e capacità rispetto ai modelli precedenti. Le principali migliorie includono:

  • Supera GPT-4o, Gemini 1.5 Pro e Meta’s Llama 3 (400B) in 7 su 9 benchmark complessivi e 4 su 5 benchmark di visione
  • Stabilisce nuovi benchmark per il ragionamento di livello universitario (GPQA), la conoscenza di livello universitario (MMLU) e l’abilità di codifica (HumanEval)
  • Funziona a una velocità doppia rispetto a Claude 3 Opus
  • Eccelle nella scrittura e nella traduzione del codice, nella gestione di flussi di lavoro multistep e nell’interpretazione di grafici e diagrammi
  • Dimostra una maggiore comprensione della sottigliezza, dell’umorismo e delle istruzioni complesse
  • Genera contenuti di alta qualità con un tono naturale e relazionale
  • Risolve il 64% dei problemi nei test di codifica agente, rispetto al 38% di Claude 3 Opus
  • Supera Claude 3 Opus sui benchmark di visione standard, con un miglioramento della ragione visiva e della trascrizione di testo da immagini imperfette

Questi miglioramenti posizionano Claude 3.5 Sonnet come uno strumento potente per compiti complessi come il supporto clienti sensibile al contesto e l’orchestrazione di flussi di lavoro multistep.

Funzione Artifacts

Insieme al rilascio di Claude 3.5 Sonnet, Anthropic ha introdotto una nuova funzione chiamata Artifacts, progettata per migliorare la collaborazione e la produttività. Questa innovativa aggiunta crea una finestra dedicata per il contenuto generato dall’AI, come snippet di codice e documenti di testo, consentendo agli utenti di visualizzare, modificare e costruire sulle creazioni di Claude in tempo reale.

Artifacts trasforma Claude da un’AI conversazionale in un ambiente di lavoro collaborativo dinamico, consentendo alle squadre di integrare in modo trasparente il contenuto generato dall’AI nei loro progetti e flussi di lavoro. Ad esempio, le squadre di design e UX possono utilizzare Artifacts per creare, iterare e raffinare prototipi di interfaccia utente, sfruttando la comprensione di Claude dei principi di design e la sua capacità di generare asset visivi.

Sicurezza e Privacy

Anthropic sottolinea il suo impegno per la sicurezza e la privacy con Claude 3.5 Sonnet. Il modello ha subito test rigorosi e è stato addestrato per ridurre l’uso improprio, con esperti esterni, tra cui l’Istituto di sicurezza dell’intelligenza artificiale del Regno Unito, che hanno condotto valutazioni di sicurezza pre-distribuzione. Anthropic ha incorporato i feedback degli esperti di sicurezza infantile di Thorn per aggiornare i classificatori e affinare i modelli.

La società ribadisce la sua posizione sulla privacy degli utenti, affermando che non addestra modelli generativi sui dati degli utenti senza permesso esplicito. Queste misure dimostrano gli sforzi di Anthropic per affrontare i rischi potenziali e mantenere la fiducia degli utenti nella sua tecnologia AI.

Sonnet partner per scrivere

Disponibilità e Piani Futuri

Il nuovo modello di intelligenza artificiale è ora disponibile gratuitamente su Claude.ai e l’app iOS di Claude, con limiti di utilizzo più elevati per gli abbonati a Claude Pro e Team. Gli utenti possono anche accedere a Claude 3.5 Sonnet attraverso l’API di Anthropic, Amazon Bedrock e Google Cloud’s Vertex AI.

Guardando al futuro, Anthropic pianifica di completare la famiglia di modelli Claude 3.5 rilasciando Claude 3.5 Haiku e Claude 3.5 Opus più tardi quest’anno. La società sta anche sviluppando nuove funzionalità e integrazioni, tra cui una funzione di Memoria che consentirà a Claude di ricordare le preferenze e la storia delle interazioni degli utenti.