Vi siete mai chiesti come funzionano i modelli linguistici come ChatGPT? Spesso questo rimane un segreto perché le grandi aziende tecnologiche custodiscono rigorosamente i loro dati e algoritmi.
Un nuovo capitolo è stato aperto in Svizzera nel mese di settembre: con Apertus C'è un modello linguistico che è costruito da zero. Aperto e trasparente sviluppato. Questa è una pietra miliare per la scienza e per tutti noi.
Perché Apertus è così speciale?
Il nome Apertus deriva dal latino e significa "aperto". E questo descrive perfettamente la filosofia che c'è dietro. Questo progetto, guidato dal EPFL, il Politecnico federale di Zurigo e il CSCS (Centro svizzero di supercalcolo) è un controprogetto dei modelli «scatola nera». Ecco l'intero processo di sviluppo, dall'architettura ai dati di formazione fino al codice sorgente: liberamente accessibile e ampiamente documentato.
Questa trasparenza non è solo un bel trucco, è un punto di svolta. Permette a ricercatori e sviluppatori di capire con precisione come funziona, adattare il modello per i propri progetti e riprodurre i risultati. Martin Jaggi, professore presso l'EPFL, lo definisce un "campione di un modello di IA affidabile".
Un modello linguistico per la diversità globale
Uno dei maggiori problemi di molti modelli linguistici di grandi dimensioni è la loro forte attenzione alla lingua inglese. Ma Apertus va in un'altra direzione. E 'stato costruito su gigantesco 15 trilioni di parole Addestramento che fuori Più di 1.000 lingue Proviene da. 40 % Questi dati sono Lingua non inglese! Questa è una vera e propria caratteristica speciale.
Di conseguenza, Apertus ha anche accesso a linguaggi che altrimenti sono spesso ignorati nel mondo dell'intelligenza artificiale, come Lingua tedesca svizzera e romancio. Questo rende il modello non solo più versatile, ma anche più culturalmente rilevante, soprattutto nel contesto multilingue svizzero.
Open Source: uno slancio per il futuro
Gli iniziatori non vedono semplicemente Apertus come un prodotto finito. Thomas Schulthess, direttore del CSCS, lo descrive piuttosto come un "iniziatore dell'innovazione". Dovrebbe essere una tecnologia di base che costituisce la base per nuove applicazioni come chatbot, traduttori o strumenti di apprendimento digitale.
Il modello è disponibile in due diverse misure: Una variante con 8 miliardi di parametri per i singoli utenti e uno con 70 miliardi di parametri per progetti più grandi. Entrambe le versioni sono sotto uno Licenza open source permissiva Può anche essere utilizzato per scopi commerciali.
Accesso per tutti: Dai professionisti agli appassionati
Vuoi sperimentare con Apertus da solo? L'accesso è semplice per i professionisti e gli utenti esperti:
- È possibile visualizzare i modelli sulla piattaforma Abbracciare la faccia download. Lì troverete anche tutta la documentazione importante.
- In qualità di partner strategico, abbiamo anche Swisscom Il modello sulla tua Piattaforma svizzera sovrana di IA disponibile per le aziende.
- Per tutti coloro che vogliono partecipare a un movimento globale per l'intelligenza artificiale aperta, il modello è disponibile anche tramite Utilità pubblica di inferenza dell'IA accessibile.
Per tutti coloro che vogliono immergersi direttamente nella materia, il Settimane svizzere dell'IA È stata un'opportunità ideale dall'inizio di settembre. Gli hackathon si svolgono qui, dove gli sviluppatori possono provare il modello e fornire preziosi feedback per ulteriori sviluppi.
Trasparenza ed etica come principi fondamentali
Un altro aspetto importante nello sviluppo di Apertus è stata l'adesione ai più alti standard etici. Gli sviluppatori hanno fatto in modo che il modello è tutto Le leggi svizzere sulla protezione dei dati e sul diritto d'autore e i requisiti di trasparenza del Normativa dell'UE sull'IA adempiuto.
La formazione si basava esclusivamente su dati disponibili al pubblico. Filtri rigorosi sono stati utilizzati per rimuovere dati personali e contenuti indesiderati. Apertus dimostra che è possibile costruire un modello di IA potente senza compromettere valori fondamentali come la trasparenza, la responsabilità e il bene comune.
Un progetto collaborativo
Apertus è un lavoro di comunità . È il risultato della collaborazione tra ricercatori, ingegneri e studenti provenienti da tutta la Svizzera. Il progetto è stato sostenuto da un investimento di oltre 10 milioni di ore GPU sulla supercomputer Alpi il CSCS È inoltre finanziato dal Consiglio dei PF. In qualità di partner strategico, Swisscom ha anche dato un contributo significativo al finanziamento.
Come sottolinea Antoine Bosselut dell’EPFL, la pubblicazione dell’Apertus «non è un punto finale, ma l’inizio di un viaggio». L'obiettivo è creare una base di IA aperta, affidabile e sovrana per il bene comune globale.