Vision

Die Bestimmung von Molekül- oder Reaktionseigenschaften durch quantenmechanische Berechnungen oder Experimente im Nasslabor kann teuer und zeitaufwändig sein, was den Fortschritt bei der Entwicklung neuer Katalysatoren oder beim Entwurf neuer Verbindungen mit gewünschten Eigenschaften verlangsamt. Hier kann das maschinelle Lernen helfen, solche Untersuchungen zu beschleunigen. Eine effiziente und genaue Modellierung erfordert jedoch, dass die Repräsentationen und Architekturen des maschinellen Lernens auf die Besonderheiten der Chemie zugeschnitten sind, z. B. in Bezug auf Chiralität oder weitreichende Wechselwirkungen. Wir entwickeln daher aktiv neue Repräsentationen und Architekturen für das maschinelle Lernen und arbeiten daher an der Schnittstelle zwischen Informatik, Datenwissenschaft und Chemie. Unsere Vision ist es, das aufstrebende Feld des maschinellen Lernens von Reaktionen voranzutreiben und zu fördern, indem wir hochwertige Open-Source-Software und Benchmark-Daten bereitstellen.

Deep Learning auf chemische Reaktionen zuschneiden

Wir entwickeln und pflegen Software für maschinelles Lernen für chemische Reaktionseigenschaften, wobei wir verstärkt darauf achten, die Informationen in einer Reaktion auf sinnvolle Weise darzustellen, indem wir die Erkenntnisse von Chemikern und Softwareingenieuren zusammenbringen. Wir erforschen und entwickeln verschiedene Architekturen, wie z. B. graphfehlerkonvergente neuronale Netze, Graphentransformatoren und Mischungen davon.

  • Chemprop: A Machine Learning Package for Chemical Property Prediction. E. Heid, K. P. Greenman, Y. Chung, S.-C. Li, D. E. Graff, F. H. Vermeire, H. Wu, W. H. Green, C. J. McGill. J. Chem. Inf. Model. (2023), 64, 9-17  DOI:10.1021/acs.jcim.3c01250
  • Machine learning of reaction properties via learned representations of the condensed graph of reaction. E. Heid, W. H. Green. J. Chem. Inf. Model. (2022) 62, 2101-2110, DOI:10.1021/acs.jcim.1c00975

Machine Learning für nachhaltige Chemie

Aufbauend auf unserer Software für maschinelles Lernen von Reaktionen wollen wir unsere Modelle auf organokatalytische und biokatalytische Reaktionen anwenden, wobei der Schwerpunkt auf chemo-, regio- und stereoselektiven Reaktionen liegt. Durch eine starke experimentelle Zusammenarbeit soll dieses Projekt einen realen Einfluss auf die Welt haben und Deep Learning auf leicht zugängliche Weise ins Labor bringen.


Ausgewählte Referenzen:

  • EnzymeMap: Curation, validation and data-driven prediction of enzymatic reactions. E. Heid, D. Probst, W. H. Green, G. K. H. Madsen. Chem. Sci. (2023), 14, 14229-14242.  DOI:10.1039/D3SC02048G

Uncertainty Quantification

Maschinell erlernte Vorhersagen chemischer Eigenschaften sind nur dann nützlich, wenn wir die Zuverlässigkeit des Modells auf neuen Testdaten abschätzen können, möglicherweise sogar unter Verteilungsverschiebungen. Wir entwickeln daher bewährte Verfahren sowie Routinen zur Quantifizierung der Ungewissheit für das maschinelle Lernen in der Chemie, die im Vergleich zu anderen Bereichen des maschinellen Lernens andere Ansätze erfordern (oder ermöglichen). Wenn wir zum Beispiel die Energie eines Moleküls als Funktion der Atomkoordinaten vorhersagen, erhalten wir auch die atomaren Kräfte als negativen Gradienten der Energie gegenüber den Atompositionen, der verwendet werden kann, um zuverlässigere Unsicherheitsmetriken zu erhalten.

Ausgewählte Referenzen:

  • Spatially resolved uncertainties for machine learning potentials. E. Heid, J. Schörghuber, R. Wanzenböck, G. K. H. Madsen.  J. Chem. Inf. Model. (2024), 64, 6377-6387 DOI:10.1021/acs.jcim.4c00904
  • Deep Ensembles vs. Committees for Uncertainty Estimation in Neural-Network Force Fields: Comparison and Application to Active Learning. J. Carrete, J. Montes-Campos, R. Wanzenböck, E. Heid, G. K. H. Madsen. J. Chem. Phys. (2023), 158, 204801 DOI:10.1063/5.0146905
  • Characterizing Uncertainty in Machine Learning for Chemistry. E. Heid, C. J. McGill, F. Vermeire, W. H. Green. J. Chem. Inf. Model. (2023), 63, 4012-4029 DOI:10.1021/acs.jcim.3c00373

Cheminformatics

Zur Erstellung und Kuratierung von Datenbanken mit Molekül- oder Reaktionseigenschaften verwenden und entwickeln wir ein umfangreiches Set von Chemoinformatik-Tools, die heuristische Regeln zur Manipulation von Molekülgraphen oder deren String-Darstellungen verwenden.

Ausgewählte Referenzen:

  • EnzymeMap: Curation, validation and data-driven prediction of enzymatic reactions. E. Heid, D. Probst, W. H. Green, G. K. H. Madsen. Chem. Sci. (2023), 14, 14229-14242.  DOI:10.1039/D3SC02048G
  • On the Value of Using 3D Shape and Electrostatic Similarities in Deep Generative Methods. G. Bolcato, E. Heid, J. Boström. J. Chem. Inf. Model. (2022) 62, 1388-1398, DOI:10.1021/acs.jcim.1c01535
  • EHreact: Extended Hasse diagrams for the extraction and scoring of enzymatic reaction templates. E. Heid, S. Goldman, K. Sankaranarayaran, C. W. Coley, C. Flamm, W. H. Green. J. Chem. Inf. Model (2021) 61, 4949-4061, DOI:10.1021/acs.jcim.1c00921

Wie mitmachen?

Haben Sie Interesse, unserem interdisziplinären Team von Chemikern und Programmierern beizutreten?
Für offene Stellen wenden Sie sich bitte an esther.heid@tuwien.ac.at.