The Problem: Context-Free Facts in a Context-Dependent World
El Problema: Hechos Sin Contexto en un Mundo Dependiente del Contexto
Standard knowledge graphs store facts as triples (h, r, t)—head entity, relation, tail entity. A triple is either in the graph (true) or not (false). This binary treatment works for universal truths like “Paris is the capital of France,” but fails for statements whose validity depends on context. In medicine, the same relation may be valid for one patient and invalid for another based on comorbidities, lab values, age, or current medications.
Los grafos de conocimiento estándar almacenan hechos como tripletas (h, r, t)—entidad cabeza, relación, entidad cola. Una tripleta está en el grafo (verdadera) o no (falsa). Este tratamiento binario funciona para verdades universales como “París es la capital de Francia,” pero falla para afirmaciones cuya validez depende del contexto. En medicina, la misma relación puede ser válida para un paciente e inválida para otro según comorbilidades, valores de laboratorio, edad o medicamentos actuales.
Yao Wang, Zixu Geng, and Jun Yan (City University of Hong Kong, Tsinghua University, Duke University) formalize this as a context-dependent probability P(τ|C), where τ is a triplet and C is the observation context. They call this formulation a Quantum Knowledge Graph (QKG)—where “quantum” refers to context-dependent validity, not quantum-theoretic formalism. The key idea: triplet validity is not a global constant but a triplet-specific function Fτ(C) of context.
Yao Wang, Zixu Geng y Jun Yan (City University of Hong Kong, Universidad de Tsinghua, Universidad de Duke) formalizan esto como una probabilidad dependiente del contexto P(τ|C), donde τ es una tripleta y C es el contexto de observación. Llaman a esta formulación un Grafo de Conocimiento Cuántico (QKG)—donde “cuántico” se refiere a la validez dependiente del contexto, no al formalismo de la teoría cuántica. La idea clave: la validez de una tripleta no es una constante global sino una función Fτ(C) específica de la tripleta y dependiente del contexto.
Three Paradigms of Triplet Validity
Tres Paradigmas de Validez de Tripletas
The paper frames different KG paradigms as different parameterizations of P(τ|C):
El artículo enmarca diferentes paradigmas de KG como diferentes parametrizaciones de P(τ|C):
Conventional KG: P(τ|C) ∈ {0, 1} — every triple is universally valid or invalid. Simple but inflexible. A drug-disease indication triple like “metformin → indicated → diabetes” is stored as unconditionally true, even though metformin is contraindicated in patients with eGFR below 30.
KG Convencional: P(τ|C) ∈ {0, 1} — cada tripleta es universalmente válida o inválida. Simple pero inflexible. Una tripleta de indicación fármaco-enfermedad como “metformina → indicada → diabetes” se almacena como incondicionalmente verdadera, aunque la metformina está contraindicada en pacientes con eGFR inferior a 30.
Probabilistic KG: P(τ|C) = μτ ∈ [0, 1] — replaces binary validity with a population-level prior. Captures aggregate uncertainty (e.g., “metformin is indicated for diabetes with 85% confidence”) but still doesn’t specify which patients fall into the 15%.
KG Probabilístico: P(τ|C) = μτ ∈ [0, 1] — reemplaza la validez binaria con un prior a nivel de población. Captura incertidumbre agregada (ej., “la metformina está indicada para la diabetes con 85% de confianza”) pero aún no especifica qué pacientes caen en el 15%.
Quantum KG: P(τ|C) = Fτ(C) — a triplet-specific function of context. The validity of “metformin → indicated → diabetes” depends on whether this specific patient has renal impairment, which is determined at inference time by evaluating Fτ against the patient’s eGFR.
KG Cuántico: P(τ|C) = Fτ(C) — una función específica de la tripleta del contexto. La validez de “metformina → indicada → diabetes” depende de si este paciente específico tiene insuficiencia renal, lo que se determina en tiempo de inferencia evaluando Fτ contra el eGFR del paciente.
The QKG Construction Pipeline
El Pipeline de Construcción del QKG
The authors instantiate QKG in the medical domain starting from PrimeKG, a biomedical knowledge graph covering 17,080 diseases with 4,050,249 triples across 12 entity types. They construct a diabetes-centered subgraph in two layers:
Los autores instancian QKG en el dominio médico partiendo de PrimeKG, un grafo de conocimiento biomédico que cubre 17,080 enfermedades con 4,050,249 tripletas en 12 tipos de entidades. Construyen un subgrafo centrado en diabetes en dos capas:
Direct layer: all triplets where either the head or tail is diabetes mellitus. Yields 1,470 triplets and 735 intermediate entities.
Capa directa: todas las tripletas donde la cabeza o la cola es diabetes mellitus. Produce 1,470 tripletas y 735 entidades intermedias.
Indirect layer: all triplets where at least one endpoint belongs to the intermediate set. Captures second-order associations—drugs acting on proteins in diabetes-related pathways. Adds 861,070 triplets.
Capa indirecta: todas las tripletas donde al menos un extremo pertenece al conjunto intermedio. Captura asociaciones de segundo orden—fármacos que actúan sobre proteínas en rutas relacionadas con diabetes. Añade 861,070 tripletas.
After deduplication, the subgraph contains 862,540 triplets across 18,387 entities spanning 10 biomedical types and 25 relation types.
Después de deduplicación, el subgrafo contiene 862,540 tripletas en 18,387 entidades que abarcan 10 tipos biomédicos y 25 tipos de relaciones.
The key annotation step focuses on 4 relation types where validity varies most with patient context: indication, contraindication, off-label use, and drug_effect. For each unique triplet over these types, the authors use an LLM to generate structured ConstraintItem records containing patient characteristics in which the relation holds, an applicability level (five-point ordinal scale), and supporting evidence. The resulting relation_with_facts collection contains 68,651 annotated facts.
El paso clave de anotación se centra en 4 tipos de relación donde la validez varía más con el contexto del paciente: indicación, contraindicación, uso off-label y efecto de fármaco. Para cada tripleta única sobre estos tipos, los autores usan un LLM para generar registros ConstraintItem estructurados que contienen las características del paciente en las que la relación es válida, un nivel de aplicabilidad (escala ordinal de cinco puntos) y evidencia de apoyo. La colección relation_with_facts resultante contiene 68,651 hechos anotados.
The Reasoner–Validator Architecture
La Arquitectura Razonador–Validador
QKG is evaluated in a two-agent loop consisting of a pure-LLM Reasoner and a KG-grounded Validator:
QKG se evalúa en un bucle de dos agentes que consiste en un Razonador puramente LLM y un Validador basado en KG:
Results: Context Matching Matters
Resultados: La Concordancia de Contexto Importa
The pipeline is evaluated on a KG-grounded subset of MedReason containing 2,788 diabetes-related clinical questions. Three settings are compared:
El pipeline se evalúa en un subconjunto basado en KG de MedReason que contiene 2,788 preguntas clínicas relacionadas con diabetes. Se comparan tres configuraciones:
With Haiku-4.5 as both Reasoner and Validator:
Con Haiku-4.5 como Razonador y Validador:
The context-matched setting also produces more wrong-to-correct revisions (55 vs. 39) and fewer correct-to-wrong regressions (16 vs. 22), demonstrating that patient-context filtering improves both the signal and the specificity of KG-backed validation.
La configuración con concordancia de contexto también produce más revisiones incorrecto-a-correcto (55 vs. 39) y menos regresiones correcto-a-incorrecto (16 vs. 22), demostrando que el filtrado por contexto del paciente mejora tanto la señal como la especificidad de la validación basada en KG.
Why Context-Free KG Validation Falls Short
Por Qué la Validación KG Sin Contexto se Queda Corta
The case studies reveal the mechanism. In one example, a patient presents with Achilles tendon pain six weeks after starting ciprofloxacin—a fluoroquinolone antibiotic. The patient is 68, smokes, and consumes alcohol. A context-free KG might retrieve the relation “fluoroquinolones → has_adverse_event → tendinopathy” as relevant and count it as supporting evidence. But the QKG validator goes further: it checks the patient-specific applicability conditions and finds that advanced age (>60), smoking, alcohol use, and recent exposure (within 60 days) are all documented risk amplifiers. Each of these is a patient-context constraint attached to the triplet. The combination of multiple amplifiers crossing the applicability threshold triggers a CONTRADICTED status for the alternative answer, leading to a correct revision.
Los estudios de caso revelan el mecanismo. En un ejemplo, un paciente presenta dolor en el tendón de Aquiles seis semanas después de comenzar ciprofloxacino—un antibiótico fluoroquinolona. El paciente tiene 68 años, fuma y consume alcohol. Un KG sin contexto podría recuperar la relación “fluoroquinolonas → tiene_evento_adverso → tendinopatía” como relevante y contar como evidencia de apoyo. Pero el validador QKG va más allá: verifica las condiciones de aplicabilidad específicas del paciente y encuentra que la edad avanzada (>60), el tabaquismo, el consumo de alcohol y la exposición reciente (dentro de 60 días) son amplificadores de riesgo documentados. Cada uno de estos es una restricción de contexto del paciente adjunta a la tripleta. La combinación de múltiples amplificadores cruzando el umbral de aplicabilidad activa un estado CONTRADICTED para la respuesta alternativa, llevando a una revisión correcta.
In a second case, the threshold is quantitative: a patient with a platelet count of 95,000/mm³ is being evaluated for IV tPA after acute ischemic stroke. The standard guideline states tPA is contraindicated below 100,000/mm³. A context-free KG knows the relation “tPA → contraindicated → thrombocytopenia” but cannot match the specific threshold to the patient’s lab value. The QKG validator, using the patient-context annotated relation, determines that the contraindication applies to this specific platelet count.
En un segundo caso, el umbral es cuantitativo: un paciente con un recuento de plaquetas de 95,000/mm³ está siendo evaluado para tPA IV después de un accidente cerebrovascular isquémico agudo. La guía estándar indica que tPA está contraindicado por debajo de 100,000/mm³. Un KG sin contexto conoce la relación “tPA → contraindicado → trombocitopenia” pero no puede coincidir el umbral específico con el valor de laboratorio del paciente. El validador QKG, usando la relación anotada con contexto del paciente, determina que la contraindicación aplica a este recuento de plaquetas específico.
Stronger Validators and the Benchmark Ceiling
Validadores Más Fuertes y el Techo del Benchmark
With a stronger validator (Qwen-3.6-Plus), the raw QKG gain over baseline grows from +1.40 pp to +5.96 pp. The gap between context-matched and context-free KG is non-significant on raw accuracy (p=0.73) but becomes borderline significant (p=0.05) after adjusting for knowledge leakage. The leakage analysis reveals that the strong validator’s model-internal medical knowledge sometimes drives corrections independently of the KG—a form of answer contamination. However, a careful per-case classification shows that the elevated correction-to-wrong regressions under QKG are dominated by KG-supported cases (36/38), not by validator hallucination, and that 20 of those explicitly cite QKG-specific applicability tokens versus 0 in the no-context run.
Con un validador más fuerte (Qwen-3.6-Plus), la ganancia bruta de QKG sobre la línea base crece de +1.40 pp a +5.96 pp. La brecha entre KG con contexto y sin contexto no es significativa en precisión bruta (p=0.73) pero se vuelve limítrofe (p=0.05) después de ajustar por fuga de conocimiento. El análisis de fuga revela que el conocimiento médico interno del validador fuerte a veces impulsa correcciones independientemente del KG—una forma de contaminación de respuestas. Sin embargo, una clasificación cuidadosa por caso muestra que las regresiones correcto-a-incorrecto elevadas bajo QKG están dominadas por casos apoyados por KG (36/38), no por alucinación del validador, y que 20 de ellos citan explícitamente tokens de aplicabilidad específicos de QKG versus 0 en la ejecución sin contexto.
Implications for Knowledge-Augmented AI
Implicaciones para la IA Aumentada por Conocimiento
The core insight generalizes beyond medicine: in any domain where the applicability of knowledge depends on context—legal reasoning, scientific literature review, financial analysis, engineering diagnostics—the value of a knowledge graph lies not merely in storing relevant facts, but in representing whether those facts are applicable in the specific context in which they are used.
La idea central se generaliza más allá de la medicina: en cualquier dominio donde la aplicabilidad del conocimiento dependa del contexto—razonamiento legal, revisión de literatura científica, análisis financiero, diagnóstico en ingeniería—el valor de un grafo de conocimiento no reside meramente en almacenar hechos relevantes, sino en representar si esos hechos son aplicables en el contexto específico en el que se utilizan.
For agentic systems that reason over knowledge bases, QKG suggests a practical architecture: attach natural-language validity conditions to relations, evaluate them against context at inference time, and down-weight or exclude relations whose conditions are not met. This is implementable with existing LLMs and KG infrastructure, and the paper shows it works across both weak and strong reasoner-validator pairings.
Para sistemas agénticos que razonan sobre bases de conocimiento, QKG sugiere una arquitectura práctica: adjuntar condiciones de validez en lenguaje natural a las relaciones, evaluarlas contra el contexto en tiempo de inferencia, y reducir el peso o excluir las relaciones cuyas condiciones no se cumplen. Esto es implementable con LLMs e infraestructura KG existentes, y el artículo muestra que funciona tanto con pares razonador-validador débiles como fuertes.
The limitation acknowledged by the authors is that benchmark medical QA cannot fully disentangle QKG-based contextual validation from model-internal knowledge—especially for strong validators. A cleaner test would require real-world patient-level reasoning tasks, which the authors identify as future work. But the evidence across 2,788 questions, 550 QSG configurations, and paired McNemar significance tests makes a strong case that context-dependent triplet validity is not merely a theoretical nicety but a measurable improvement for knowledge-grounded reasoning.
La limitación reconocida por los autores es que la evaluación con QA médico de referencia no puede separar completamente la validación contextual basada en QKG del conocimiento interno del modelo—especialmente para validadores fuertes. Una prueba más limpia requeriría tareas de razonamiento a nivel de paciente del mundo real, que los autores identifican como trabajo futuro. Pero la evidencia en 2,788 preguntas, 550 configuraciones QSG y pruebas de significación McNemar pareadas presenta un caso sólido de que la validez de tripletas dependiente del contexto no es meramente una sutileza teórica sino una mejora medible para el razonamiento basado en conocimiento.
References
Referencias
- Wang, Y., Geng, Z., & Yan, J. (2026). *Quantum Knowledge Graph: Modeling Context-Dependent Triplet Validity*. arxiv.org/abs/2604.23972
- Chandak, P. et al. (2023). *PrimeKG: a knowledge graph for precision medicine*. Scientific Data.
- Wu, J. et al. (2025). *MedReason: Eliciting Factual Medical Reasoning Steps in LLMs via Knowledge Graphs*. arxiv.org/abs/2504.00993
- QKG GitHub Repository: github.com/HKAI-Sci/QKG
- Wang, Y., Geng, Z., & Yan, J. (2026). *Quantum Knowledge Graph: Modeling Context-Dependent Triplet Validity*. arxiv.org/abs/2604.23972
- Chandak, P. et al. (2023). *PrimeKG: a knowledge graph for precision medicine*. Scientific Data.
- Wu, J. et al. (2025). *MedReason: Eliciting Factual Medical Reasoning Steps in LLMs via Knowledge Graphs*. arxiv.org/abs/2504.00993
- Repositorio QKG en GitHub: github.com/HKAI-Sci/QKG