¿Alguna vez te has preguntado cómo funcionan realmente los modelos de lenguaje como ChatGPT? A menudo, esto sigue siendo un secreto porque las grandes compañÃas tecnológicas guardan estrictamente sus datos y algoritmos.
En septiembre se abrió un nuevo capÃtulo en Suiza: Con Apertus Hay un modelo de lenguaje que se construye desde cero. Abierto y transparente desarrollado. Este es un hito para la ciencia y para todos nosotros.
¿Por qué Apertus es tan especial?
El nombre Apertus procede del latÃn y significa «abierto». Y eso describe perfectamente la filosofÃa detrás de ello. Este proyecto, liderado por el EPFL, el ETH Zurich y el CSCS (el Centro Suizo de Supercomputación) es un contraproyecto de los modelos de «caja negra». Aquà está todo el proceso de desarrollo, desde la arquitectura hasta los datos de formación y el código fuente. libremente accesible y ampliamente documentado.
Esta transparencia no es solo un buen truco, es un cambio de juego. Permite a los investigadores y desarrolladores comprender con precisión cómo funciona, adaptar el modelo para sus propios proyectos y reproducir los resultados. Martin Jaggi, profesor de la EPFL, lo llama una «muestra de un modelo de IA fiable».
Un modelo lingüÃstico para la diversidad global
Uno de los mayores problemas de muchos modelos de idiomas grandes es su fuerte enfoque en el idioma inglés. Pero Apertus va por otro camino. Fue construido sobre gigantescos 15 trillones de palabras Entrenando que hacia fuera Más de 1.000 idiomas vienen de. 40 % Estos datos son Idioma no inglés! Esta es una caracterÃstica muy especial.
Como resultado, Apertus también tiene acceso a idiomas que de otra manera a menudo se ignoran en el mundo de la IA, como alemán suizo y romanche. Esto hace que el modelo no solo sea más versátil, sino también más relevante culturalmente, especialmente en el contexto multilingüe suizo.
El código abierto: un impulso para el futuro
Los iniciadores no ven simplemente a Apertus como un producto terminado. Thomas Schulthess, Director del CSCS, lo describe más bien como un «iniciador de la innovación». Debe ser una tecnologÃa básica que forme la base de nuevas aplicaciones como chatbots, traductores o herramientas de aprendizaje digital.
El modelo está disponible en dos tamaños diferentes: Una variante con 8 mil millones de parámetros para usuarios individuales y uno con 70 000 millones de parámetros para proyectos de mayor envergadura. Ambas versiones están bajo una Licencia de código abierto permisiva Incluso se puede utilizar con fines comerciales.
Acceso para todos: De profesionales a entusiastas
¿Quieres experimentar con Apertus tú mismo? El acceso es sencillo para profesionales y usuarios experimentados:
- Puede ver los modelos en la plataforma Cara de abrazo descarga. Allà también encontrará toda la documentación importante.
- Como socio estratégico, también Swisscom El modelo sobre tu Soberana plataforma suiza de IA disponible para las empresas.
- Para todos aquellos que quieran participar en un movimiento global para la IA abierta, el modelo también está disponible a través del Utilidad pública de inferencia de IA accesible.
Para todos aquellos que quieren sumergirse directamente en el asunto, el Semanas suizas de IA Ha sido una oportunidad ideal desde principios de septiembre. Los hackathons tienen lugar aquÃ, donde los desarrolladores pueden probar el modelo y dar comentarios valiosos para un mayor desarrollo.
Transparencia y ética como principios básicos
Otro aspecto importante en el desarrollo de Apertus fue la adhesión a los más altos estándares éticos. Los desarrolladores se han asegurado de que el modelo sea todo Leyes suizas de protección de datos y derechos de autor y los requisitos de transparencia del Ley de IA de la UE cumplido.
La formación se basó únicamente en datos a disposición del público. Se utilizaron filtros estrictos para eliminar datos personales y contenido no deseado. Apertus demuestra que se puede construir un modelo de IA potente sin comprometer valores fundamentales como la transparencia, la responsabilidad y el bien común.
Un proyecto colaborativo
Apertus es un trabajo comunitario. Es el resultado de la colaboración entre investigadores, ingenieros y estudiantes de toda Suiza. El proyecto fue apoyado por una inversión de más de 10 millones de horas GPU sobre el supercomputadora Alpes el CSCS También está financiado por la Junta de ETH. Como socio estratégico, Swisscom también ha hecho una contribución significativa a la financiación.
Como señala Antoine Bosselut, de la EPFL, la publicación de Apertus «no es un punto final, sino el comienzo de un viaje». El objetivo es crear una base de IA abierta, confiable y soberana para el bien común global.