Manuel Herranz participará en el VSCF 2026 con una intervención sobre IA soberana, ontologías, pequeños modelos y la cadena de suministro de datos que alimenta la economía generativa.
La IA soberana comienza mucho antes del centro de datos. Empieza con la información que una organización controla, con las ontologías mediante las que estructura su conocimiento institucional y con los modelos especializados que puede evaluar, adaptar y operar bajo sus propias condiciones técnicas, jurídicas y económicas.
Manuel Herranz, CEO de Pangeanic, participará el jueves 2 de julio de 2026 en el ValgrAI Scientific Council Forum 2026, que se celebrará en el Paraninfo de la Universitat Politècnica de València.
Su intervención, titulada «IA soberana: ontologías, pequeños modelos y “tokens are the new coal”», formará parte de una jornada que reunirá a investigadores, empresas e instituciones para analizar la evolución de la inteligencia artificial y su aplicación en entornos científicos, industriales y sociales.
El programa incluye intervenciones de Virginia Dignum, Hiroaki Kitano, Tom Dietterich, José María Azorín y Ramón López de Mántaras, entre otros especialistas internacionales. Pangeanic participa también como entidad colaboradora del encuentro, aportando una perspectiva construida desde la tecnología lingüística, los datos para IA, el alineamiento de modelos y el despliegue de sistemas en entornos empresariales e institucionales.
La intervención de 2026 continúa una línea de trabajo que Pangeanic viene desarrollando desde la tecnología lingüística y que ahora se extiende hacia la construcción de sistemas de IA especializados, gobernables y adaptados al conocimiento propio de cada organización.
Manuel Herranz analizó el avance de modelos pequeños y especializados como arquitectura adecuada para tareas empresariales delimitadas, con menores necesidades computacionales y mayor capacidad de control.
La colaboración con ValgrAI y la Universitat Jaume I trasladó esta visión al terreno de la investigación aplicada y la transferencia de conocimiento entre universidad y empresa.
La nueva intervención amplía el análisis hacia el control de los datos, la organización del conocimiento y la capacidad de operar sistemas bajo criterios propios.
En la edición de 2025 del foro, Manuel Herranz analizó el avance de los pequeños modelos como una arquitectura especialmente adecuada para aplicaciones empresariales concretas.
Los pequeños modelos de lenguaje y otros modelos especializados pueden ofrecer ventajas importantes cuando el problema está bien delimitado: menor consumo computacional, tiempos de respuesta reducidos, mayor facilidad de adaptación y despliegues más controlables en infraestructuras privadas.
Su utilidad crece cuando se entrenan, ajustan o conectan con datos representativos del dominio y se evalúan frente a criterios operativos específicos. Un modelo destinado a interpretar documentación jurídica, clasificar expedientes, traducir contenido técnico o asistir en un proceso industrial necesita terminología, documentos, instrucciones, ejemplos, restricciones y criterios de calidad propios.
Pangeanic desarrolla esta capa mediante sus servicios de AI Data Operations, que abarcan preparación de datos, anotación, revisión humana, generación de preferencias, evaluación, alineamiento, gobernanza y mejora continua de sistemas de IA.
Gartner prevé que, en 2027, las organizaciones utilizarán modelos pequeños y específicos para cada tarea al menos tres veces más que modelos generales de gran tamaño.
Entre las razones se encuentran la necesidad de mayor precisión contextual, respuestas más rápidas, menores costes computacionales y una mejor adaptación a los datos propios de cada empresa.
Consultar la predicción de GartnerLas organizaciones acumulan grandes volúmenes de documentos, bases de datos, manuales, expedientes, terminología y conocimiento tácito. Sin una estructura que conecte esos elementos, la información permanece fragmentada y resulta difícil de utilizar de manera coherente por un sistema inteligente.
Las ontologías proporcionan ese mapa conceptual. Definen las entidades relevantes para una organización, las relaciones entre ellas, sus categorías, propiedades, jerarquías, permisos y reglas de interpretación.
Representación precisa de términos jurídicos, técnicos, administrativos o sectoriales.
Conexión entre entidades, documentos, procedimientos, responsabilidades y niveles de autoridad.
Reglas para determinar qué información puede utilizarse, quién puede acceder a ella y bajo qué circunstancias.
Cuando esta estructura se combina con recuperación de conocimiento, modelos especializados y datos correctamente preparados, la IA puede operar sobre una representación mucho más fiel de la realidad institucional. La soberanía adquiere entonces una dimensión intelectual: la organización conserva el control sobre la forma en que representa, clasifica y utiliza su propio conocimiento.
La expresión «tokens are the new coal» presenta los tokens como la unidad consumible de la economía generativa. El paralelismo con el carbón resulta deliberadamente provocador: ambos alimentan infraestructuras productivas, requieren una cadena de suministro y concentran valor alrededor de quienes controlan su extracción, transformación y distribución.
Detrás de cada token útil existe una materia prima previa formada por documentos, conversaciones, imágenes, grabaciones, anotaciones, decisiones humanas y conocimiento experto.
Los datos deben recopilarse o licenciarse, limpiarse, normalizarse, clasificarse, anotarse, anonimizarse, evaluarse y relacionarse con una tarea concreta. El volumen tiene utilidad, aunque la procedencia, la representatividad y la calidad determinan en gran medida el comportamiento posterior del modelo.
Esta cadena de suministro sitúa los datasets para inteligencia artificial y las operaciones de datos en el centro de la autonomía tecnológica.
Recopilación, licencia, limpieza, normalización, estructuración y preparación de datos para modelos y sistemas de IA.
Explorar datos para IA →Datos multilingües, texto, voz, audio, imagen, vídeo, OCR, evaluación y conocimiento específico de dominio.
Explorar datasets →Anotación, supervisión humana, preferencias, evaluación, alineamiento y ciclos de mejora para sistemas en producción.
Conocer AI Data Operations →Pangeanic comenzó su trayectoria recopilando, alineando y procesando datos para sistemas de traducción automática. Aquella experiencia dio lugar a grandes repositorios lingüísticos y a una capacidad industrial para trabajar con datos multilingües a escala.
Con el tiempo, este trabajo se amplió hacia datasets de texto, voz, audio, imagen, vídeo, documentos, instrucciones, evaluaciones y señales de preferencia humana. La continuidad técnica permanece: convertir información dispersa en material fiable para entrenar, adaptar, evaluar y gobernar sistemas inteligentes.
Pangeanic ha colaborado con el Barcelona Supercomputing Center en trabajos relacionados con datos para IA, anotación, evaluación, RLHF y alineamiento de modelos lingüísticos europeos como Salamandra y ALIA.
Esta colaboración ilustra el paso desde la recopilación de corpus hacia una tarea más compleja: determinar cómo debe comportarse un modelo en distintas lenguas, dominios y situaciones.
Ver el caso de uso con BSCEl alineamiento requiere instrucciones, ejemplos, preferencias humanas, evaluaciones, taxonomías de error y revisión experta.
También necesita representar lenguas y contextos culturales que suelen quedar insuficientemente cubiertos en los grandes datasets generales.
Explorar alineamiento de modelosEl proyecto SAVIA conecta investigación, conocimiento lingüístico y transferencia tecnológica, mostrando cómo la colaboración entre universidad y empresa puede trasladar avances científicos hacia herramientas y procesos aplicables.
La intervención anterior de Manuel Herranz anticipó la creciente importancia de modelos más pequeños y especializados para aplicaciones corporativas.
La colaboración con ValgrAI y la Universitat Jaume I trasladó el análisis sobre modelos y conocimiento al ámbito de la investigación aplicada.
La localización física de los servidores constituye una parte de la soberanía, aunque el concepto abarca una cadena mucho más extensa.
Una organización alcanza una mayor autonomía cuando puede decidir qué datos utiliza, qué conocimiento incorpora, qué modelos selecciona, cómo evalúa sus resultados y bajo qué condiciones despliega cada componente.
Pangeanic articula estas capacidades dentro de su propuesta de sistemas de IA soberana, combinando datos preparados para cada dominio, modelos especializados, tecnología lingüística, evaluación y opciones de despliegue controlado.
La plataforma ECO añade una capa de orquestación para integrar traducción, recuperación de conocimiento, anonimización, evaluación de calidad, APIs e intervención humana dentro de flujos empresariales gobernados.
La intervención de Manuel Herranz situará en el foro una tesis concreta: la siguiente etapa de la IA empresarial dependerá menos de acumular capacidad generativa y más de organizar conocimiento, preparar datos y desplegar modelos adecuados para tareas específicas.
Los pequeños modelos aportan eficiencia y especialización. Las ontologías proporcionan estructura. Los datos determinan qué puede aprender el sistema. La evaluación y la supervisión humana permiten gobernar su comportamiento.
La combinación de estas capas configura una forma más madura de soberanía tecnológica, especialmente pertinente para empresas, administraciones públicas y sectores regulados europeos.
Pangeanic ayuda a empresas, instituciones y administraciones públicas a preparar datos, adaptar modelos especializados, estructurar conocimiento, evaluar sistemas y desplegar flujos de IA multilingüe bajo condiciones de mayor control.