In 2012, Jennifer Doudna and Emmanuelle Charpentier demonstrated that CRISPR-Cas9—a bacterial immune mechanism—could be repurposed as a programmable DNA editor. The discovery earned them the 2020 Nobel Prize and ignited a revolution in genetic engineering. But the early days of CRISPR were rough. Designing a guide RNA meant wading through heuristic rules, empirical scores, and expensive trial-and-error. Today, transformer models, protein language models, and reinforcement learning are automating every step of the gene editing pipeline. For ML engineers, CRISPR is a sequence-to-function prediction problem at its core—and that’s exactly where modern AI excels.
En 2012, Jennifer Doudna y Emmanuelle Charpentier demostraron que CRISPR-Cas9—un mecanismo inmunológico bacteriano—podía reapropiarse como un editor de ADN programable. El descubrimiento les valió el Premio Nobel de 2020 e inició una revolución en ingeniería genética. Pero los primeros días de CRISPR fueron difíciles. Diseñar un ARN guía significaba navegar reglas heurísticas, puntajes empíricos y costoso ensayo y error. Hoy, modelos transformer, modelos de lenguaje de proteínas y aprendizaje por refuerzo están automatizando cada paso del pipeline de edición genética. Para ingenieros de ML, CRISPR es un problema de predicción secuencia-a-función en su esencia—y eso es exactamente donde la IA moderna destaca.
The Guide RNA Design Problem
El Problema del Diseño de ARN Guía
Every CRISPR application starts with an sgRNA—a 20-nucleotide guide sequence that directs Cas9 to cut the genome at a specific location. The challenge: you need the guide to bind your target strongly (on-target efficiency) while ignoring similar sequences elsewhere in the genome (off-target avoidance). Only 0.1–30% of randomly designed guides achieve high editing efficiency. Early tools like CHOPCHOP and CRISPRscan relied on hand-crafted sequence features and basic thermodynamic models. They worked, but barely.
Cada aplicación CRISPR comienza con un sgRNA—una secuencia guía de 20 nucleótidos que dirige Cas9 a cortar el genoma en una ubicación específica. El desafío: necesitas que la guía se una fuertemente a tu objetivo (eficiencia on-target) mientras ignora secuencias similares en otras partes del genoma (evitar off-target). Solo 0.1–30% de las guías diseñadas aleatoriamente logran alta eficiencia de edición. Las primeras herramientas como CHOPCHOP y CRISPRscan dependían de características de secuencia diseñadas a mano y modelos termodinámicos básicos. Funcionaban, pero apenas.
The fundamental issue is that guide efficiency depends on dozens of factors: local chromatin state, DNA methylation, nucleosome positioning, GC content, position-specific sequence motifs, and the list goes on. These interactions are too complex for manual rule-writing. Deep learning changed this by learning these patterns directly from data.
El problema fundamental es que la eficiencia de la guía depende de docenas de factores: estado local de cromatina, metilación del ADN, posicionamiento de nucleosomas, contenido de GC, motivos de secuencia específicos por posición, y la lista continúa. Estas interacciones son demasiado complejas para reglas manuales. El aprendizaje profundo cambió esto aprendiendo estos patrones directamente de los datos.
Deep Learning for sgRNA Design
Aprendizaje Profundo para Diseño de sgRNA
DeepCRISPR (2018) established the first end-to-end deep learning framework for CRISPR design. The model uses a stacked denoising autoencoder (SDAE) for unsupervised pretraining on 4.3 million sgRNA sequences, followed by a CNN for efficiency prediction. This semi-supervised approach—pretraining on unlabeled data, fine-tuning on labeled data—boosted performance by 5–10% over training from scratch. Trained on ~15,000 validated sgRNAs across four cell lines, DeepCRISPR achieved Spearman correlations of 0.70–0.80, dramatically outperforming earlier Doench scores.
DeepCRISPR (2018) estableció el primer framework de aprendizaje profundo端 a端 para diseño CRISPR. El modelo usa un autoencoder de eliminación de ruido apilado (SDAE) para preentrenamiento no supervisado en 4.3 millones de secuencias sgRNA, seguido de una CNN para predicción de eficiencia. Este enfoque semi-supervisado—preentrenamiento en datos sin etiquetar, ajuste fino en datos etiquetados—mejoró el rendimiento en 5–10% sobre entrenamiento desde cero. Entrenado en ~15,000 sgRNAs validados en cuatro líneas celulares, DeepCRISPR logró correlaciones de Spearman de 0.70–0.80, superando dramáticamente los puntajes anteriores de Doench.
AttCRISPR (2021) introduced attention mechanisms to the problem, adding interpretability alongside accuracy. The model combines CNNs with BiLSTM and two attention modules—spatial attention that identifies important nucleotide positions, and temporal attention that captures dependencies between positions. The result: Spearman ρ = 0.872 across wild-type and high-fidelity Cas9 variants, plus attention weights that reveal exactly which positions in the guide matter most. The seed region near the PAM sequence lights up in attention maps—exactly where biology says it should.
AttCRISPR (2021) introdujo mecanismos de atención al problema, agregando interpretabilidad junto con precisión. El modelo combina CNNs con BiLSTM y dos módulos de atención—atención espacial que identifica posiciones importantes de nucleótidos, y atención temporal que captura dependencias entre posiciones. El resultado: Spearman ρ = 0.872 a través de variantes wild-type y Cas9 de alta fidelidad, más pesos de atención que revelan exactamente qué posiciones en la guía importan más. La región semilla cerca de la secuencia PAM se ilumina en los mapas de atención—exactamente donde la biología dice que debería.
CRISPRon (2022) brought transformer architectures to CRISPR, replacing convolutions with multi-head self-attention. Unlike CNNs with limited receptive fields, transformers can model interactions between any two positions in the sgRNA—critical because functional motifs exist at non-adjacent locations. With positional encoding and learned nucleotide embeddings, CRISPRon captures long-range dependencies across the full guide sequence. Spearman ~0.84–0.87—the best on-target scores of the pre-foundation-model era. The parallel to NLP is exact: CNN → attention → transformer mirrors text classification evolving from n-grams to attention to LLMs.
CRISPRon (2022) llevó arquitecturas transformer a CRISPR, reemplazando convoluciones con autoatención multi-cabeza. A diferencia de CNNs con campos receptivos limitados, los transformers pueden modelar interacciones entre cualquier par de posiciones en el sgRNA—crítico porque los motivos funcionales existen en ubicaciones no adyacentes. Con codificación posicional y embeddings aprendidos de nucleótidos, CRISPRon captura dependencias de largo alcance a través de la secuencia completa de la guía. Spearman ~0.84–0.87—los mejores puntajes on-target de la era pre-modelos-fundación. El paralelo con PNL es exacto: CNN → atención → transformer refleja la evolución de clasificación de texto desde n-gramas hasta atención hasta LLMs.
The next leap came from transfer learning. DeepCRISTL (2024) demonstrated that models pretrained on high-throughput datasets could be fine-tuned to specific cellular contexts—a direct analogy to NLP foundation models. The model adapts CRISPRon weights to the target cell type, improving predictions in biologically relevant but under-sampled conditions. This is now standard practice: start with large-scale pretraining, then specialize to your specific tissue or disease model.
El siguiente salto vino del aprendizaje por transferencia. DeepCRISTL (2024) demostró que modelos preentrenados en conjuntos de datos de alto rendimiento podían ajustarse a contextos celulares específicos—una analogía directa a los modelos fundación de PNL. El modelo adapta los pesos de CRISPRon al tipo celular objetivo, mejorando predicciones en condiciones biológicamente relevantes pero sub-muestreadas. Esto ahora es práctica estándar: comienza con preentrenamiento a gran escala, luego especializa en tu tejido o modelo de enfermedad específico.
Off-Target Prediction
Predicción de Off-Target
Off-target effects—unintended cleavage at genomic sites similar to the target—represent the primary safety barrier for therapeutic CRISPR applications. Predicting them computationally is harder than on-target prediction because you need to evaluate binding similarity across the entire genome.
Los efectos off-target—cortes no intencionales en sitios genómicos similares al objetivo—representan la barrera principal de seguridad para aplicaciones CRISPR terapéuticas. Predecirlos computacionalmente es más difícil que la predicción on-target porque necesitas evaluar similitud de unión a través del genoma completo.
Elevation (Microsoft Research, 2018) introduced the state-of-the-art approach with two interdependent models: an elevation-score for individual guide-off-target pair activity, and an elevation-aggregate for overall guide specificity. Trained on GUIDE-seq empirical data, Elevation outperformed earlier methods like CFD (Cutting Frequency Determination). Pre-computed scores for the entire human exome are available at crispr.ml—making genome-scale guide screening practical without runtime computation.
Elevation (Microsoft Research, 2018) introdujo el enfoque más avanzado con dos modelos interdependientes: un elevation-score para actividad de pares individuales guía-off-target, y un elevation-aggregate para especificidad general de la guía. Entrenado en datos empíricos de GUIDE-seq, Elevation superó métodos anteriores como CFD (Cutting Frequency Determination). Puntajes precalculados para todo el exoma humano están disponibles en crispr.ml—haciendo práctico el tamizaje de guías a escala genómica sin computación en tiempo de ejecución.
CRISPRoff (2018) takes a thermodynamic approach—computing approximate free energy gain for gRNA:off-target binding. Higher binding energy correlates with increased cleavage likelihood. CCLMoff (2025) represents the next generation: pretrained RNA language models from RNAcentral, trained on data from 13 genome-wide detection technologies. The language model approach generalizes better across experimental paradigms than methods trained on single detection assays.
CRISPRoff (2018) toma un enfoque termodinámico—calculando la ganancia aproximada de energía libre para unión gRNA:off-target. Mayor energía de unión correlaciona con mayor probabilidad de corte. CCLMoff (2025) representa la siguiente generación: modelos de lenguaje ARN preentrenados de RNAcentral, entrenados en datos de 13 tecnologías de detección genómica. El enfoque de modelo de lenguaje generaliza mejor a través de paradigmas experimentales que métodos entrenados en ensayos de detección individuales.
AI-Designed CRISPR Proteins: OpenCRISPR-1
Proteínas CRISPR Diseñadas por IA: OpenCRISPR-1
The most consequential result in this space isn’t a prediction model—it’s a completely AI-designed gene editor. OpenCRISPR-1 (Ruffolo et al., Profluent Bio, Nature 2025) is the first artificially designed protein to successfully edit the human genome. No natural CRISPR protein served as a template. The process: curate 1 million CRISPR operons from 26 terabases of genomic data, train large language models on this diversity, generate novel proteins, filter by predicted fitness, validate experimentally.
El resultado más significativo en este espacio no es un modelo de predicción—es un editor genético completamente diseñado por IA. OpenCRISPR-1 (Ruffolo et al., Profluent Bio, Nature 2025) es la primera proteína diseñada artificialmente que edita exitosamente el genoma humano. Ninguna proteína CRISPR natural sirvió como plantilla. El proceso: curar 1 millón de operones CRISPR de 26 terabases de datos genómicos, entrenar modelos de lenguaje grandes en esta diversidad, generar proteínas novedosas, filtrar por aptitud predicha, validar experimentalmente.
The results are remarkable. OpenCRISPR-1 achieves 45.7% editing efficiency versus 48.3% for wild-type SpCas9—comparable performance. But its off-target rate is 0.32% versus 6.1% for wild-type—an 18× reduction in unintended editing. This is the promise of AI protein design: optimizing for properties that are simultaneously beneficial and difficult to achieve through directed evolution alone. The sequence is fully open source on GitHub (Profluent-AI/OpenCRISPR).
Los resultados son notables. OpenCRISPR-1 logra 45.7% de eficiencia de edición versus 48.3% para SpCas9 wild-type—desempeño comparable. Pero su tasa de off-target es 0.32% versus 6.1% para wild-type—una reducción de 18× en edición no intencional. Esta es la promesa del diseño de proteínas por IA: optimizar simultáneamente propiedades beneficiosas y difíciles de lograr solo con evolución dirigida. La secuencia es completamente de código abierto en GitHub (Profluent-AI/OpenCRISPR).
What makes OpenCRISPR-1 distinctive is its distance from nature. It’s not a variant of SpCas9 with a few mutations—it’s hundreds of mutations away from any natural Cas9, representing entirely novel sequence space. The LLM learned the principles of CRISPR function from evolutionary diversity, then extrapolated to proteins that exist nowhere in nature but that perform the function better. This is de novo protein design applied to gene editing.
Lo que hace distintivo a OpenCRISPR-1 es su distancia de la naturaleza. No es una variante de SpCas9 con algunas mutaciones—son cientos de mutaciones de cualquier Cas9 natural, representando espacio de secuencia completamente nuevo. El LLM aprendió los principios de la función CRISPR de diversidad evolutiva, luego extrapoló a proteínas que no existen en ninguna parte de la naturaleza pero que realizan la función mejor. Este es diseño de proteínas de novo aplicado a la edición genética.
Protein Language Models for CRISPR Engineering
Modelos de Lenguaje de Proteínas para Ingeniería CRISPR
The foundation for OpenCRISPR-1 was laid by protein language models pretrained on evolutionary sequence data at scale. ESM-2 (Meta AI, up to 15B parameters) is trained on 250 million protein sequences using masked language modeling—predicting masked amino acids from context. This pretraining encodes rich biological structure: residue-residue contacts, structural motifs, functional annotations emerge without explicit supervision.
La base para OpenCRISPR-1 fue establecida por modelos de lenguaje de proteínas preentrenados en datos de secuencias evolutivas a escala. ESM-2 (Meta AI, hasta 15B parámetros) se entrena en 250 millones de secuencias de proteínas usando modelado de lenguaje con máscaras—prediciendo aminoácidos enmascarados del contexto. Este preentrenamiento codifica rica estructura biológica: contactos residuo-residuo, motivos estructurales, anotaciones funcionales emergen sin supervisión explícita.
AlphaFold2 and AlphaFold3 (DeepMind) accelerated Cas protein engineering by enabling structure-guided mutagenesis without crystallography. Predicting how a mutation affects protein stability and function—before picking up a pipette—transformed the engineering cycle from months to days. PAMmla (Nature 2025) combined this with neural networks trained on ~1,000 SpCas9 variants, learning PAM specificity from sequence. The model identified effective editors from 64 million candidates, reprogramming PAM requirements for allele-selective editing of a retinitis pigmentosa target.
AlphaFold2 y AlphaFold3 (DeepMind) aceleraron la ingeniería de proteínas Cas permitiendo mutagénesis guiada por estructura sin cristalografía. Predecir cómo una mutación afecta la estabilidad y función de una proteína—antes de tomar una pipeta—transformó el ciclo de ingeniería de meses a días. PAMmla (Nature 2025) combinó esto con redes neuronales entrenadas en ~1,000 variantes de SpCas9, aprendiendo especificidad PAM de la secuencia. El modelo identificó editores efectivos de 64 millones de candidatos, reprogramando requisitos PAM para edición alelo-selectiva de un objetivo de retinosis pigmentosa.
The Agentic Parallel
El Paralelo Agéntico
For ML engineers working on agentic systems, the CRISPR-AI convergence offers direct architectural parallels. Guide RNA design is tool selection—picking the right sgRNA from sequence space, analogous to choosing the right API call or function. Cas proteins are model architectures—larger/smaller Cas variants trade off efficiency and delivery, just as model size trades off capability and latency. Off-target prediction is function calling safety—predicting unintended consequences of the chosen action.
Para ingenieros de ML trabajando en sistemas agénticos, la convergencia CRISPR-IA ofrece paralelos arquitectónicos directos. El diseño de ARN guía es selección de herramientas—elegir el sgRNA correcto del espacio de secuencias, análogo a elegir la llamada API o función correcta. Las proteínas Cas son arquitecturas de modelo—variantes Cas más grandes/pequeñas intercambian eficiencia y entrega, igual que el tamaño de modelo intercambia capacidad y latencia. La predicción de off-target es seguridad de llamadas de función—predecir consecuencias no intencionales de la acción elegida.
Self-driving labs complete the analogy: autonomous agents with tools, executing in the physical world, learning from feedback. An ML model designs sgRNA libraries, robotics executes transfections, sequencing reads outcomes, the model integrates learnings. The loop is identical to an agentic system planning, acting, observing, and updating. The difference is that CRISPR’s state space is the genome—and the stakes are biology, not bytes.
Los laboratorios autónomos completan la analogía: agentes autónomos con herramientas, ejecutando en el mundo físico, aprendiendo de retroalimentación. Un modelo de ML diseña bibliotecas sgRNA, robótica ejecuta transfeciones, secuenciación lee resultados, el modelo integra aprendizajes. El ciclo es idéntico a un sistema agéntico planificando, actuando, observando y actualizando. La diferencia es que el espacio de estado de CRISPR es el genoma—y las apuestas son biología, no bytes.
Clinical Applications
Aplicaciones Clínicas
All this computation feeds into real therapies. Casgevy (Vertex + CRISPR Therapeutics, FDA approved December 2023) is the first approved CRISPR therapy—ex vivo editing of patient stem cells targeting the BCL11A erythroid enhancer to reactivate fetal hemoglobin. In clinical trials, 93.5% of sickle cell patients were free of vaso-occlusive crises for ≥12 months. The cost is $2.2 million per treatment. This is what AI-optimized guide design makes possible: therapies that work.
Toda esta computación alimenta terapias reales. Casgevy (Vertex + CRISPR Therapeutics, FDA aprobado diciembre 2023) es la primera terapia CRISPR aprobada—edición ex vivo de células madre del paciente dirigiendo el enhancer eritroide BCL11A para reactivar hemoglobina fetal. En ensayos clínicos, 93.5% de pacientes de célula falciforme estuvieron libres de crisis vaso-oclusivas por ≥12 meses. El costo es $2.2 millones por tratamiento. Esto es lo que el diseño de guías optimizado por IA hace posible: terapias que funcionan.
Intellia NTLA-2002 goes further—in vivo LNP delivery of CRISPR components targeting the KLKB1 gene for hereditary angioedema. No ex vivo cell manipulation. The system delivers mRNA encoding Cas9 plus sgRNA directly to the liver. Phase 2 results: 77–81% reduction in monthly attack rates, with 8 of 11 patients completely attack-free for 16 weeks. Phase 3 HAELO is now enrolling.
Intellia NTLA-2002 va más allá—entrega in vivo vía LNP de componentes CRISPR dirigiendo el gen KLKB1 para angioedema hereditario. Sin manipulación celular ex vivo. El sistema entrega ARNm codificando Cas9 más sgRNA directamente al hígado. Resultados de Fase 2: reducción de 77–81% en tasas de ataque mensuales, con 8 de 11 pacientes completamente libres de ataques por 16 semanas. Fase 3 HAELO ahora está inscribiendo.
Beam Therapeutics takes a different approach: base editing (APOBEC/AID deaminases) rather than nuclease cleavage. No double-strand breaks, no canonical NHEJ repair pathway—single-nucleotide precision. BEAM-101 (sickle cell) induces fetal hemoglobin through precise edits to the HBG promoter. BEAM-302 (alpha-1 antitrypsin deficiency) uses in vivo liver delivery to correct the most common PiZ mutation—currently in Phase 1/2.
Beam Therapeutics toma un enfoque diferente: edición de base (desaminasas APOBEC/AID) en lugar de corte por nucleasa. Sin roturas de doble hebra, sin vía de reparación NHEJ canónica—precisión de nucleótido único. BEAM-101 (célula falciforme) induce hemoglobina fetal a través de ediciones precisas al promotor HBG. BEAM-302 (deficiencia de alfa-1 antitripsina) usa entrega in vivo al hígado para corregir la mutación PiZ más común—actualmente en Fase 1/2.
Challenges
Desafíos
Delivery remains the hardest problem. Lipid nanoparticles (LNPs) target the liver efficiently but struggle with other tissues—neurons, muscle, and heart require different formulations. Viral delivery (AAV) has capacity limits that exclude large Cas proteins. AI-guided delivery optimization is an active frontier: predict tissue tropism from LNP composition, optimize formulation for specific targets, design Cas variants small enough to fit in AAV.
La entrega sigue siendo el problema más difícil. Nanopartículas lipídicas (LNPs) apuntan al hígado eficientemente pero luchan con otros tejidos—neuronas, músculo y corazón requieren formulaciones diferentes. La entrega viral (AAV) tiene límites de capacidad que excluyen proteínas Cas grandes. Optimización de entrega guiada por IA es una frontera activa: predecir tropismo tisular de composición de LNP, optimizar formulación para objetivos específicos, diseñar variantes Cas lo suficientemente pequeñas para caber en AAV.
Long-term safety remains incompletely characterized. Casgevy’s 2+ year follow-up shows durability, but multi-decade data doesn’t exist. AI can help here too—predicting immunogenicity of Cas proteins, modeling immune clearance kinetics, designing hypoimmunogenic editors. The regulatory path for AI-designed proteins is also unsettled: OpenCRISPR-1’s open-source release is a research milestone, not a clinical pathway.
La seguridad a largo plazo permanece incompletamente caracterizada. El seguimiento de 2+ años de Casgevy muestra durabilidad, pero no existen datos de múltiples décadas. La IA también puede ayudar aquí—prediciendo inmunogenicidad de proteínas Cas, modelando cinéticas de清除 inmune, diseñando editores hipo-inmunogénicos. El camino regulatorio para proteínas diseñadas por IA también está sin resolver: el lanzamiento de código abierto de OpenCRISPR-1 es un hito de investigación, no una vía clínica.
The ethical horizon is real. AI-designed gene editors that work—OpenCRISPR-1 proves the concept—raise questions about germline editing, enhancement, and access. The Profluent license explicitly excludes human germline applications. But the technical capability to design novel life forms is now established. The field will need governance frameworks commensurate with the power it has created.
El horizonte ético es real. Editores genéticos diseñados por IA que funcionan—OpenCRISPR-1 prueba el concepto—plantean preguntas sobre edición de línea germinal, mejoras y acceso. La licencia de Profluent excluye explícitamente aplicaciones de línea germinal humana. Pero la capacidad técnica de diseñar formas de vida novedosas ahora está establecida. El campo necesitará marcos de gobernanza proporcionales al poder que ha creado.
References
Referencias
- Jinek, M. et al. (2012). *A Programmable Dual-RNA–Guided DNA Endonuclease in Adaptive Bacterial Immunity*. Science 337, 816–821.
- Cong, L. et al. (2013). *Multiplex Genome Engineering Using CRISPR/Cas Systems*. Science 339, 819–823.
- Chuai, G. et al. (2018). *DeepCRISPR: Optimized CRISPR Guide RNA Design by Deep Learning*. Genome Biology 19, 80.
- Wang, D. et al. (2019). *Optimized CRISPR Guide RNA Design for Two High-Fidelity Cas9 Variants by Deep Learning*. Nature Communications 10, 4284.
- Listgarten, J. et al. (2018). *Prediction of Off-Target Activities for the End-to-End Design of CRISPR Guide RNAs*. Nature Biomedical Engineering 2, 656–665.
- Lin, Z. et al. (2022). *Evolutionary-Scale Prediction of Atomic-Level Protein Structure with a Language Model*. Science 376, 498–502.
- Ruffolo, J.A. et al. (2025). *Design of Highly Functional Genome Editors by Modelling CRISPR–Cas Sequences*. Nature 645, 518–525.
- Kleinstiver, B.P. et al. (2025). *Custom CRISPR–Cas9 PAM Variants via Scalable Engineering and Machine Learning*. Nature 643, 539–550.
- Frangoul, H. et al. (2024). *Casgevy Gene Therapy Eliminates Vaso-Occlusive Crises in Sickle Cell Disease*. New England Journal of Medicine 390, 655–665.
- Jinek, M. et al. (2012). *Una Endonucleasa de ADN Dual-RNA Programable en la Inmunidad Bacteriana Adaptativa*. Science 337, 816–821.
- Cong, L. et al. (2013). *Ingeniería Genómica Multiplex Usando Sistemas CRISPR/Cas*. Science 339, 819–823.
- Chuai, G. et al. (2018). *DeepCRISPR: Diseño Optimizado de ARN Guía CRISPR por Aprendizaje Profundo*. Genome Biology 19, 80.
- Wang, D. et al. (2019). *Diseño Optimizado de ARN Guía CRISPR para Dos Variantes de Cas9 de Alta Fidelidad por Aprendizaje Profundo*. Nature Communications 10, 4284.
- Listgarten, J. et al. (2018). *Predicción de Actividades Off-Target para el Diseño de Extremo a Extremo de ARN Guía CRISPR*. Nature Biomedical Engineering 2, 656–665.
- Lin, Z. et al. (2022). *Predicción a Nivel Atómico de Estructura Proteica a Escala Evolutiva con un Modelo de Lenguaje*. Science 376, 498–502.
- Ruffolo, J.A. et al. (2025). *Diseño de Editores Genómicos Altamente Funcionales Modelando Secuencias CRISPR–Cas*. Nature 645, 518–525.
- Kleinstiver, B.P. et al. (2025). *Variantes Personalizadas de PAM CRISPR–Cas9 vía Ingeniería y Aprendizaje Automático Escalables*. Nature 643, 539–550.
- Frangoul, H. et al. (2024). *Terapia Génica Casgevy Elimina Crisis Vaso-Oclusivas en Enfermedad de Célula Falciforme*. New England Journal of Medicine 390, 655–665.