Manuel Herranz participará en el VSCF 2026 con una intervención sobre IA soberana, ontologías, pequeños modelos y la cadena de suministro de datos que alimenta la economía generativa.
La IA soberana comienza mucho antes del centro de datos. Empieza con la información que una organización controla, con las ontologías mediante las que estructura su conocimiento institucional y con los modelos especializados que puede evaluar, adaptar y operar bajo sus propias condiciones técnicas, jurídicas y económicas.
Manuel Herranz, CEO de Pangeanic, participará el jueves 2 de julio de 2026 en el ValgrAI Scientific Council Forum 2026, que se celebrará en el Paraninfo de la Universitat Politècnica de València.
Su intervención, titulada «IA soberana: ontologías, pequeños modelos y “tokens are the new coal”», formará parte de una jornada que reunirá a investigadores, empresas e instituciones para analizar la evolución de la inteligencia artificial y su aplicación en entornos científicos, industriales y sociales.
El programa incluye intervenciones de Virginia Dignum, Hiroaki Kitano, Tom Dietterich, José María Azorín y Ramón López de Mántaras, entre otros especialistas internacionales. Pangeanic participa también como entidad colaboradora del encuentro, aportando una perspectiva construida desde la tecnología lingüística, los datos para IA, el alineamiento de modelos y el despliegue de sistemas en entornos empresariales e institucionales.
Una trayectoria que conecta modelos, datos y conocimiento
La intervención de 2026 continúa una línea de trabajo que Pangeanic viene desarrollando desde la tecnología lingüística y que ahora se extiende hacia la construcción de sistemas de IA especializados, gobernables y adaptados al conocimiento propio de cada organización.
Pequeños modelos para aplicaciones concretas
Manuel Herranz analizó el avance de modelos pequeños y especializados como arquitectura adecuada para tareas empresariales delimitadas, con menores necesidades computacionales y mayor capacidad de control.
Investigación y transferencia tecnológica
La colaboración con ValgrAI y la Universitat Jaume I trasladó esta visión al terreno de la investigación aplicada y la transferencia de conocimiento entre universidad y empresa.
Datos, ontologías y soberanía operativa
La nueva intervención amplía el análisis hacia el control de los datos, la organización del conocimiento y la capacidad de operar sistemas bajo criterios propios.
Pequeños modelos para tareas empresariales concretas
En la edición de 2025 del foro, Manuel Herranz analizó el avance de los pequeños modelos como una arquitectura especialmente adecuada para aplicaciones empresariales concretas.
Los pequeños modelos de lenguaje y otros modelos especializados pueden ofrecer ventajas importantes cuando el problema está bien delimitado: menor consumo computacional, tiempos de respuesta reducidos, mayor facilidad de adaptación y despliegues más controlables en infraestructuras privadas.
Su utilidad crece cuando se entrenan, ajustan o conectan con datos representativos del dominio y se evalúan frente a criterios operativos específicos. Un modelo destinado a interpretar documentación jurídica, clasificar expedientes, traducir contenido técnico o asistir en un proceso industrial necesita terminología, documentos, instrucciones, ejemplos, restricciones y criterios de calidad propios.
Pangeanic desarrolla esta capa mediante sus servicios de AI Data Operations, que abarcan preparación de datos, anotación, revisión humana, generación de preferencias, evaluación, alineamiento, gobernanza y mejora continua de sistemas de IA.
Las ontologías como arquitectura del conocimiento institucional
Las organizaciones acumulan grandes volúmenes de documentos, bases de datos, manuales, expedientes, terminología y conocimiento tácito. Sin una estructura que conecte esos elementos, la información permanece fragmentada y resulta difícil de utilizar de manera coherente por un sistema inteligente.
Las ontologías proporcionan ese mapa conceptual. Definen las entidades relevantes para una organización, las relaciones entre ellas, sus categorías, propiedades, jerarquías, permisos y reglas de interpretación.
Conceptos y terminología
Representación precisa de términos jurídicos, técnicos, administrativos o sectoriales.
Relaciones y jerarquías
Conexión entre entidades, documentos, procedimientos, responsabilidades y niveles de autoridad.
Permisos y contexto
Reglas para determinar qué información puede utilizarse, quién puede acceder a ella y bajo qué circunstancias.
Cuando esta estructura se combina con recuperación de conocimiento, modelos especializados y datos correctamente preparados, la IA puede operar sobre una representación mucho más fiel de la realidad institucional. La soberanía adquiere entonces una dimensión intelectual: la organización conserva el control sobre la forma en que representa, clasifica y utiliza su propio conocimiento.
«Tokens are the new coal»: el combustible de la economía generativa
La expresión «tokens are the new coal» presenta los tokens como la unidad consumible de la economía generativa. El paralelismo con el carbón resulta deliberadamente provocador: ambos alimentan infraestructuras productivas, requieren una cadena de suministro y concentran valor alrededor de quienes controlan su extracción, transformación y distribución.
Detrás de cada token útil existe una materia prima previa formada por documentos, conversaciones, imágenes, grabaciones, anotaciones, decisiones humanas y conocimiento experto.
Los datos deben recopilarse o licenciarse, limpiarse, normalizarse, clasificarse, anotarse, anonimizarse, evaluarse y relacionarse con una tarea concreta. El volumen tiene utilidad, aunque la procedencia, la representatividad y la calidad determinan en gran medida el comportamiento posterior del modelo.
Esta cadena de suministro sitúa los datasets para inteligencia artificial y las operaciones de datos en el centro de la autonomía tecnológica.
Preparación y transformación
Recopilación, licencia, limpieza, normalización, estructuración y preparación de datos para modelos y sistemas de IA.
Explorar datos para IA →Activos de entrenamiento y evaluación
Datos multilingües, texto, voz, audio, imagen, vídeo, OCR, evaluación y conocimiento específico de dominio.
Explorar datasets →Evaluación, alineamiento y mejora
Anotación, supervisión humana, preferencias, evaluación, alineamiento y ciclos de mejora para sistemas en producción.
Conocer AI Data Operations →De los datos multilingües al alineamiento de modelos europeos
Pangeanic comenzó su trayectoria recopilando, alineando y procesando datos para sistemas de traducción automática. Aquella experiencia dio lugar a grandes repositorios lingüísticos y a una capacidad industrial para trabajar con datos multilingües a escala.
Con el tiempo, este trabajo se amplió hacia datasets de texto, voz, audio, imagen, vídeo, documentos, instrucciones, evaluaciones y señales de preferencia humana. La continuidad técnica permanece: convertir información dispersa en material fiable para entrenar, adaptar, evaluar y gobernar sistemas inteligentes.
Colaboración con Barcelona Supercomputing Center
Pangeanic ha colaborado con el Barcelona Supercomputing Center en trabajos relacionados con datos para IA, anotación, evaluación, RLHF y alineamiento de modelos lingüísticos europeos como Salamandra y ALIA.
Esta colaboración ilustra el paso desde la recopilación de corpus hacia una tarea más compleja: determinar cómo debe comportarse un modelo en distintas lenguas, dominios y situaciones.
Ver el caso de uso con BSCAlineamiento multilingüe
El alineamiento requiere instrucciones, ejemplos, preferencias humanas, evaluaciones, taxonomías de error y revisión experta.
También necesita representar lenguas y contextos culturales que suelen quedar insuficientemente cubiertos en los grandes datasets generales.
Explorar alineamiento de modelosDe SAVIA a la aplicación empresarial
El proyecto SAVIA conecta investigación, conocimiento lingüístico y transferencia tecnológica, mostrando cómo la colaboración entre universidad y empresa puede trasladar avances científicos hacia herramientas y procesos aplicables.
VSCF 2025: el futuro de los pequeños modelos
La intervención anterior de Manuel Herranz anticipó la creciente importancia de modelos más pequeños y especializados para aplicaciones corporativas.
Proyecto SAVIA: investigación y transferencia
La colaboración con ValgrAI y la Universitat Jaume I trasladó el análisis sobre modelos y conocimiento al ámbito de la investigación aplicada.
La soberanía como capacidad operativa
La localización física de los servidores constituye una parte de la soberanía, aunque el concepto abarca una cadena mucho más extensa.
Una organización alcanza una mayor autonomía cuando puede decidir qué datos utiliza, qué conocimiento incorpora, qué modelos selecciona, cómo evalúa sus resultados y bajo qué condiciones despliega cada componente.
Capacidades que sostienen la soberanía
- Controlar la procedencia y los derechos de uso de los datos.
- Decidir qué conocimiento se incorpora al sistema.
- Seleccionar modelos adecuados para cada tarea.
- Aplicar criterios propios de evaluación y alineamiento.
- Proteger información personal, sensible o confidencial.
- Desplegar componentes en infraestructuras privadas.
- Supervisar el comportamiento mediante intervención humana.
- Sustituir proveedores o modelos sin perder conocimiento institucional.
Pangeanic articula estas capacidades dentro de su propuesta de sistemas de IA soberana, combinando datos preparados para cada dominio, modelos especializados, tecnología lingüística, evaluación y opciones de despliegue controlado.
La plataforma ECO añade una capa de orquestación para integrar traducción, recuperación de conocimiento, anonimización, evaluación de calidad, APIs e intervención humana dentro de flujos empresariales gobernados.
Una conversación europea sobre control y especialización
La intervención de Manuel Herranz situará en el foro una tesis concreta: la siguiente etapa de la IA empresarial dependerá menos de acumular capacidad generativa y más de organizar conocimiento, preparar datos y desplegar modelos adecuados para tareas específicas.
Los pequeños modelos aportan eficiencia y especialización. Las ontologías proporcionan estructura. Los datos determinan qué puede aprender el sistema. La evaluación y la supervisión humana permiten gobernar su comportamiento.
La combinación de estas capas configura una forma más madura de soberanía tecnológica, especialmente pertinente para empresas, administraciones públicas y sectores regulados europeos.
Construya una estrategia de IA basada en sus propios datos, modelos y conocimiento
Pangeanic ayuda a empresas, instituciones y administraciones públicas a preparar datos, adaptar modelos especializados, estructurar conocimiento, evaluar sistemas y desplegar flujos de IA multilingüe bajo condiciones de mayor control.