dc.contributor
Universitat Pompeu Fabra. Departament de Medicina i Ciències de la Vida
dc.contributor.author
Schapin, Nikolai
dc.date.accessioned
2024-12-10T14:55:31Z
dc.date.available
2024-12-10T14:55:31Z
dc.date.issued
2024-11-28
dc.identifier.uri
http://hdl.handle.net/10803/692716
dc.description.abstract
Molecular properties are highly important in drug discovery with binding affinity being crucial
for selecting hit and lead candidates. Existing machine learning models often lack speed for
large-scale screening or lack generalizability. This thesis develops faster models for binding
affinity prediction, surpassing previous voxel-based models. It compares 2D and 3D models
through extensive benchmarks, highlighting scenarios where simpler 2D models outperform
complex 3D models and showing how neural networks improve with supervised and
unsupervised pretraining. The work also shows how combining 2D and 3D models yields
state-of-the-art results in active learning. To address the difficult interpretability of neural
network predictions, a new application is introduced to identify key contributing areas of the
input space. Additionally, correct protonation states are essential for preparing molecular
libraries. The thesis extends 3D graph-based models for micro-pKa estimation, presenting a
new model and application that is more robust to diverse chemical compounds than existing
methods.
ca
dc.description.abstract
Les propietats moleculars són molt importants en el descobriment de fàrmacs, on l’afinitat
d’unió és crucial per seleccionar candidats potencials i caps de sèrie. Els models
d’aprenentatge automàtic existents sovint els hi falta velocitat suficient per a cribatges de
gran escala o generalitzabilitat. Aquesta tesi desenvolupa models més ràpids per a la
predicció d’afinitat d’unió, superant els models anteriors basats en vòxels. La tesi compara
models 2D i 3D a través de d’extenses dades de referència, remarcant escenaris on models
2D més simples obtenen millors resultats que models 3D més complexes i ensenyant com
les xarxes neuronals milloren amb pre-entrenaments supervisats i no supervisats. El treball
també mostra com la combinació de models 2D i 3D produeix resultats punters en
aprenentatge actiu. Per abordar la difícil interpretabilitat de les prediccions de les xarxes
neuronals, s’introdueix una nova aplicació per identificar les àrees clau que contribueixen a
l’espai d’entrada. Addicionalment, la correcta protonació de les molecules és essencial per a
la preparació de llibreries moleculars. La tesi estén els models 3D basats en grafs per a
l’estimació de micro-pKa, presentat un nou model i aplicació més robust envers la diversitat
química dels compostos que els mètodes actuals.
ca
dc.format.extent
279 p.
ca
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
ca
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Machine learning
ca
dc.subject
Active learning
ca
dc.subject
Binding affinity
ca
dc.subject
Acid-base dissociation constant
ca
dc.subject
Interpretability
ca
dc.subject
Aprendizaje automático
ca
dc.subject
Aprendizaje activo
ca
dc.subject
Afinidad de unión
ca
dc.subject
Interpretabilidad
ca
dc.subject
Constante de disociación ácido-base
ca
dc.title
Machine learning methods of property prediction in drug discovery
ca
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.contributor.authoremail
nikolai.schapin01@estudiant.upf.edu
ca
dc.contributor.director
De Fabritiis, Gianni
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de Doctorat en Biomedicina