De los pequeños modelos a la IA soberana: Pangeanic regresa al ValgrAI Scientific Council Forum

Escrito por José Miguel Herrera | 30/06/26

IA SOBERANA · VALGRAI SCIENTIFIC COUNCIL FORUM 2026

Manuel Herranz participará en el VSCF 2026 con una intervención sobre IA soberana, ontologías, pequeños modelos y la cadena de suministro de datos que alimenta la economía generativa.

2 de julio de 2026 · Universitat Politècnica de València · Consultar el programa del VSCF 2026

La IA soberana comienza mucho antes del centro de datos. Empieza con la información que una organización controla, con las ontologías mediante las que estructura su conocimiento institucional y con los modelos especializados que puede evaluar, adaptar y operar bajo sus propias condiciones técnicas, jurídicas y económicas.

Manuel Herranz, CEO de Pangeanic, participará el jueves 2 de julio de 2026 en el ValgrAI Scientific Council Forum 2026, que se celebrará en el Paraninfo de la Universitat Politècnica de València.

Su intervención, titulada «IA soberana: ontologías, pequeños modelos y “tokens are the new coal”», formará parte de una jornada que reunirá a investigadores, empresas e instituciones para analizar la evolución de la inteligencia artificial y su aplicación en entornos científicos, industriales y sociales.

El programa incluye intervenciones de Virginia Dignum, Hiroaki Kitano, Tom Dietterich, José María Azorín y Ramón López de Mántaras, entre otros especialistas internacionales. Pangeanic participa también como entidad colaboradora del encuentro, aportando una perspectiva construida desde la tecnología lingüística, los datos para IA, el alineamiento de modelos y el despliegue de sistemas en entornos empresariales e institucionales.

Continuidad tecnológica

Una trayectoria que conecta modelos, datos y conocimiento

La intervención de 2026 continúa una línea de trabajo que Pangeanic viene desarrollando desde la tecnología lingüística y que ahora se extiende hacia la construcción de sistemas de IA especializados, gobernables y adaptados al conocimiento propio de cada organización.

VSCF 2025

Pequeños modelos para aplicaciones concretas

Manuel Herranz analizó el avance de modelos pequeños y especializados como arquitectura adecuada para tareas empresariales delimitadas, con menores necesidades computacionales y mayor capacidad de control.

Proyecto SAVIA

Investigación y transferencia tecnológica

La colaboración con ValgrAI y la Universitat Jaume I trasladó esta visión al terreno de la investigación aplicada y la transferencia de conocimiento entre universidad y empresa.

VSCF 2026

Datos, ontologías y soberanía operativa

La nueva intervención amplía el análisis hacia el control de los datos, la organización del conocimiento y la capacidad de operar sistemas bajo criterios propios.

Modelos especializados

Pequeños modelos para tareas empresariales concretas

En la edición de 2025 del foro, Manuel Herranz analizó el avance de los pequeños modelos como una arquitectura especialmente adecuada para aplicaciones empresariales concretas.

Los pequeños modelos de lenguaje y otros modelos especializados pueden ofrecer ventajas importantes cuando el problema está bien delimitado: menor consumo computacional, tiempos de respuesta reducidos, mayor facilidad de adaptación y despliegues más controlables en infraestructuras privadas.

Su utilidad crece cuando se entrenan, ajustan o conectan con datos representativos del dominio y se evalúan frente a criterios operativos específicos. Un modelo destinado a interpretar documentación jurídica, clasificar expedientes, traducir contenido técnico o asistir en un proceso industrial necesita terminología, documentos, instrucciones, ejemplos, restricciones y criterios de calidad propios.

Pangeanic desarrolla esta capa mediante sus servicios de AI Data Operations, que abarcan preparación de datos, anotación, revisión humana, generación de preferencias, evaluación, alineamiento, gobernanza y mejora continua de sistemas de IA.

Una tendencia que ya reconoce el mercado

Gartner prevé que, en 2027, las organizaciones utilizarán modelos pequeños y específicos para cada tarea al menos tres veces más que modelos generales de gran tamaño.

Entre las razones se encuentran la necesidad de mayor precisión contextual, respuestas más rápidas, menores costes computacionales y una mejor adaptación a los datos propios de cada empresa.

Consultar la predicción de Gartner

Conocimiento estructurado

Las ontologías como arquitectura del conocimiento institucional

Las organizaciones acumulan grandes volúmenes de documentos, bases de datos, manuales, expedientes, terminología y conocimiento tácito. Sin una estructura que conecte esos elementos, la información permanece fragmentada y resulta difícil de utilizar de manera coherente por un sistema inteligente.

Las ontologías proporcionan ese mapa conceptual. Definen las entidades relevantes para una organización, las relaciones entre ellas, sus categorías, propiedades, jerarquías, permisos y reglas de interpretación.

Conceptos y terminología

Representación precisa de términos jurídicos, técnicos, administrativos o sectoriales.

Relaciones y jerarquías

Conexión entre entidades, documentos, procedimientos, responsabilidades y niveles de autoridad.

Permisos y contexto

Reglas para determinar qué información puede utilizarse, quién puede acceder a ella y bajo qué circunstancias.

Cuando esta estructura se combina con recuperación de conocimiento, modelos especializados y datos correctamente preparados, la IA puede operar sobre una representación mucho más fiel de la realidad institucional. La soberanía adquiere entonces una dimensión intelectual: la organización conserva el control sobre la forma en que representa, clasifica y utiliza su propio conocimiento.

Cadena de suministro de la IA

«Tokens are the new coal»: el combustible de la economía generativa

La expresión «tokens are the new coal» presenta los tokens como la unidad consumible de la economía generativa. El paralelismo con el carbón resulta deliberadamente provocador: ambos alimentan infraestructuras productivas, requieren una cadena de suministro y concentran valor alrededor de quienes controlan su extracción, transformación y distribución.

Detrás de cada token útil existe una materia prima previa formada por documentos, conversaciones, imágenes, grabaciones, anotaciones, decisiones humanas y conocimiento experto.

Los datos deben recopilarse o licenciarse, limpiarse, normalizarse, clasificarse, anotarse, anonimizarse, evaluarse y relacionarse con una tarea concreta. El volumen tiene utilidad, aunque la procedencia, la representatividad y la calidad determinan en gran medida el comportamiento posterior del modelo.

Esta cadena de suministro sitúa los datasets para inteligencia artificial y las operaciones de datos en el centro de la autonomía tecnológica.

Datos para IA

Preparación y transformación

Recopilación, licencia, limpieza, normalización, estructuración y preparación de datos para modelos y sistemas de IA.

Explorar datos para IA →

Datasets

Activos de entrenamiento y evaluación

Datos multilingües, texto, voz, audio, imagen, vídeo, OCR, evaluación y conocimiento específico de dominio.

Explorar datasets →

AI Data Operations

Evaluación, alineamiento y mejora

Anotación, supervisión humana, preferencias, evaluación, alineamiento y ciclos de mejora para sistemas en producción.

Conocer AI Data Operations →

Historia y evolución

De los datos multilingües al alineamiento de modelos europeos

Pangeanic comenzó su trayectoria recopilando, alineando y procesando datos para sistemas de traducción automática. Aquella experiencia dio lugar a grandes repositorios lingüísticos y a una capacidad industrial para trabajar con datos multilingües a escala.

Con el tiempo, este trabajo se amplió hacia datasets de texto, voz, audio, imagen, vídeo, documentos, instrucciones, evaluaciones y señales de preferencia humana. La continuidad técnica permanece: convertir información dispersa en material fiable para entrenar, adaptar, evaluar y gobernar sistemas inteligentes.

Colaboración con Barcelona Supercomputing Center

Pangeanic ha colaborado con el Barcelona Supercomputing Center en trabajos relacionados con datos para IA, anotación, evaluación, RLHF y alineamiento de modelos lingüísticos europeos como Salamandra y ALIA.

Esta colaboración ilustra el paso desde la recopilación de corpus hacia una tarea más compleja: determinar cómo debe comportarse un modelo en distintas lenguas, dominios y situaciones.

Ver el caso de uso con BSC

Alineamiento multilingüe

El alineamiento requiere instrucciones, ejemplos, preferencias humanas, evaluaciones, taxonomías de error y revisión experta.

También necesita representar lenguas y contextos culturales que suelen quedar insuficientemente cubiertos en los grandes datasets generales.

Explorar alineamiento de modelos

Transferencia tecnológica

De SAVIA a la aplicación empresarial

El proyecto SAVIA conecta investigación, conocimiento lingüístico y transferencia tecnológica, mostrando cómo la colaboración entre universidad y empresa puede trasladar avances científicos hacia herramientas y procesos aplicables.

VSCF 2025: el futuro de los pequeños modelos

La intervención anterior de Manuel Herranz anticipó la creciente importancia de modelos más pequeños y especializados para aplicaciones corporativas.

Proyecto SAVIA: investigación y transferencia

La colaboración con ValgrAI y la Universitat Jaume I trasladó el análisis sobre modelos y conocimiento al ámbito de la investigación aplicada.

Autonomía tecnológica

La soberanía como capacidad operativa

La localización física de los servidores constituye una parte de la soberanía, aunque el concepto abarca una cadena mucho más extensa.

Una organización alcanza una mayor autonomía cuando puede decidir qué datos utiliza, qué conocimiento incorpora, qué modelos selecciona, cómo evalúa sus resultados y bajo qué condiciones despliega cada componente.

Capacidades que sostienen la soberanía

Controlar la procedencia y los derechos de uso de los datos.
Decidir qué conocimiento se incorpora al sistema.
Seleccionar modelos adecuados para cada tarea.
Aplicar criterios propios de evaluación y alineamiento.
Proteger información personal, sensible o confidencial.
Desplegar componentes en infraestructuras privadas.
Supervisar el comportamiento mediante intervención humana.
Sustituir proveedores o modelos sin perder conocimiento institucional.

Pangeanic articula estas capacidades dentro de su propuesta de sistemas de IA soberana, combinando datos preparados para cada dominio, modelos especializados, tecnología lingüística, evaluación y opciones de despliegue controlado.

La plataforma ECO añade una capa de orquestación para integrar traducción, recuperación de conocimiento, anonimización, evaluación de calidad, APIs e intervención humana dentro de flujos empresariales gobernados.

VSCF 2026

Una conversación europea sobre control y especialización

La intervención de Manuel Herranz situará en el foro una tesis concreta: la siguiente etapa de la IA empresarial dependerá menos de acumular capacidad generativa y más de organizar conocimiento, preparar datos y desplegar modelos adecuados para tareas específicas.

Los pequeños modelos aportan eficiencia y especialización. Las ontologías proporcionan estructura. Los datos determinan qué puede aprender el sistema. La evaluación y la supervisión humana permiten gobernar su comportamiento.

La combinación de estas capas configura una forma más madura de soberanía tecnológica, especialmente pertinente para empresas, administraciones públicas y sectores regulados europeos.

Fecha Jueves 2 de julio de 2026

Lugar Paraninfo de la Universitat Politècnica de València

Intervención IA soberana, ontologías, pequeños modelos y tokens

IA basada en conocimiento propio

Construya una estrategia de IA basada en sus propios datos, modelos y conocimiento

Pangeanic ayuda a empresas, instituciones y administraciones públicas a preparar datos, adaptar modelos especializados, estructurar conocimiento, evaluar sistemas y desplegar flujos de IA multilingüe bajo condiciones de mayor control.

Hablar sobre un proyecto de IA Explorar IA soberana Conocer AI Data Operations

Ver post completo