Universitat Autònoma de Barcelona. Programa de Doctorat en Química
La representació d'entitats bioquímiques, com ara molècules petites i cavitats farmacològicament aprofitables de les proteïnes, mitjançant descriptors vectorials facilita l'ús de tecnologies innovadores, inspirades en la intel·ligència artificial, en el camp del descobriment de fàrmacs. De fet, els vectors numèrics proporcionen representacions simplificades però potents, que permeten realitzar comparacions eficients i faciliten una millor interpretabilitat. En el cas de les molècules petites, la immensitat de l'espai químic farmacològicament aprofitable, essencialment infinit, es manté en gran part desaprofitada, i la seva exploració amb descriptors ofereix accés a una gran quantitat de compostos potencialment bioactius. Pel que fa a les cavitats de les proteïnes -els receptors principals dels fàrmacs basats en molècules petites-, la seva representació vectorial accelera la predicció de les funcions de les proteïnes i facilita l'avaluació de la polifarmacologia de compostos. En aquesta tesi, pretenem ampliar el concepte de descriptors de molècules petites i cavitats susceptibles de ser objectius de fàrmacs, abordant les limitacions principals dels mètodes existents i dissenyant estratègies noves per millorar la capacitat d'aquests descriptors de captar característiques estructurals, químiques i funcionals rellevants. Concretament, hem (i) utilitzat signatures químiques per agrupar i comparar biblioteques de compostos, (ii) il·lustrat l'adveniment de les signatures de bioactivitat per permetre una exploració biològicament rellevant de l'espai químic i (iii) implementat una estratègia computacional predefinida d'integració de dades per crear noves signatures de bioactivitat. A més a més, també hem (iv) avaluat la relació entre l'estereoisomeria i la bioactivitat a una escala sense precedents i dissenyat nous generadors de signatures de compostos sensibles a l'estereoisomeria. Basant-nos en aquests avenços en la caracterització de molècules petites, hem dirigit el focus als objectius proteics, (v) dissenyant i avaluant àmpliament una nova metodologia, anomenada PocketVec, per generar descriptors vectorials de cavitats basats en les seves característiques estructurals. Aquesta nova estratègia, basada en el principi de la quimiogenòmica, que estableix que cavitats similars s'uneixen a compostos similars, ens ha permès (vi) caracteritzar i explorar tot el proteoma humà des de la perspectiva de les cavitats, identificant cavitats similars farmacològicament aprofitables en proteïnes sense relació aparent. En conjunt, aquesta tesi representa una modesta contribució als camps en creixement constant de la quimioinformàtica i la bioinformàtica, emmarcada dins el procés més ampli i llarg del descobriment de fàrmacs.
La representación de entidades bioquímicas, como moléculas pequeñas y cavidades de proteínas aprovechables farmacológicamente, mediante descriptores vectoriales, facilita el uso de tecnologías innovadoras, inspiradas en la inteligencia artificial, en el campo del descubrimiento de fármacos. De hecho, los vectores numéricos proporcionan representaciones simplificadas pero potentes, que permiten realizar comparaciones eficientes y favorecen una mejor interpretabilidad. En el caso de las moléculas pequeñas, la inmensidad del espacio químico farmacológicamente aprovechable, esencialmente infinito, permanece en gran medida desaprovechada, y su exploración con descriptores ofrece acceso a una gran cantidad de compuestos potencialmente bioactivos. En cuanto a las cavidades de las proteínas -los principales receptores de los fármacos basados en moléculas pequeñas-, su representación vectorial acelera la predicción de las funciones de las proteínas y facilita la evaluación de la polifarmacología de compuestos. En esta tesis, pretendemos ampliar el concepto de descriptores de moléculas pequeñas y cavidades susceptibles de ser objetivos de fármacos, abordando las principales limitaciones de los métodos existentes y diseñando estrategias nuevas para mejorar la capacidad de estos descriptores de captar características estructurales, químicas y funcionales relevantes. Concretamente, hemos (i) utilizado signaturas químicas para agrupar y comparar bibliotecas de compuestos, (ii) ilustrado el advenimiento de las signaturas de bioactividad para permitir una exploración biológicamente relevante del espacio químico e (iii) implementado una estrategia computacional predefinida de integración de datos para crear nuevas signaturas de bioactividad. Además, también hemos (iv) evaluado la relación entre la estereoisomería y la bioactividad a una escala sin precedentes y diseñado nuevos generadores de signaturas de compuestos sensibles a la estereoisomería. Basándonos en estos avances en la caracterización de moléculas pequeñas, hemos dirigido el enfoque hacia los objetivos proteicos, (v) diseñando y evaluando ampliamente una nueva metodología, llamada PocketVec, para generar descriptores vectoriales de cavidades basados en sus características estructurales. Esta nueva estrategia, basada en el principio de la quimiogenómica, que establece que cavidades similares se unen a compuestos similares, nos ha permitido (vi) caracterizar y explorar todo el proteoma humano desde la perspectiva de las cavidades, identificando cavidades similares aprovechables farmacológicamente en proteínas sin relación aparente. En conjunto, esta tesis representa una modesta contribución a los campos en constante crecimiento de la quimioinformática y la bioinformática, enmarcada dentro del proceso más amplio y prolongado del descubrimiento de fármacos.
The representation of biochemical entities, such as small molecules and protein druggable pockets, with vectorial descriptors facilitates the use of novel AI-inspired technologies in drug discovery. Indeed, numerical vectors provide simplified yet powerful representations, amenable to efficient comparisons and improved interpretability. For small molecules, the vastness of the essentially infinite drug-like chemical space remains largely uncharted, and its exploration with descriptors offers a wealth of potentially bioactive compounds. For protein pockets -the primary targets of small molecule drugs- vectorial representation expedites the prediction of protein function as well as supporting the evaluation of compound polypharmacology. In this thesis, we aim at further extending the concept of small molecule and druggable pocket descriptors, addressing the main limitations of existing methods and designing novel approaches to enhance their ability to capture relevant structural, chemical and functional features. More specifically, we have (i) leveraged chemical signatures to cluster and compare compound libraries, (ii) illustrated the advent of bioactivity signatures to enable the biologically relevant exploration of the chemical space, and (iii) implemented a predefined data integration framework to create novel bioactivity signatures. Moreover, we have also (iv) assessed the relationship between stereoisomerism and bioactivity at an unprecedented scale while designing new stereochemically-aware compound signaturizers. Building on these advancements in small molecule characterization, we have expanded our focus to protein targets by (v) designing and extensively benchmarking a new methodology to generate structure-based vectorial pocket descriptors, named PoketVec. This novel approach, founded on the chemogenomics principle stating that similar pockets will bind similar compounds, has enabled us to (vi) characterize, and explore, the complete human proteome from the pocket perspective, identifying similar druggable pockets in otherwise unrelated protein targets. Overall, this thesis represents a modest contribution to the ever-growing fields of cheminformatics and bioinformatics, encompassed within the wider and long-term process of drug discovery.
Quimioinformàtica; Cheminformatics; Quimioinformática; Disseny de fàrmacs; Drug Design; Diseño de fármacos; Bioinformàtica; Bioinformatics; Bioinformática
54 - Chemistry
Ciències Experimentals