Cet article est une Preprint
Les preprints sont des rapports de recherche préliminaires qui n'ont pas été certifiés par l’évaluation par les pairs. Ils ne devraient pas être considérés comme guidant la pratique clinique ou les comportements liés à la santé et ne devraient pas être rapportés dans les médias comme des informations établies.
Les preprints publiées en ligne permettent aux auteurs de recevoir des commentaires rapidement, et toute la communauté scientifique peut évaluer indépendamment le travail et répondre en conséquence. Ces commentaires sont publiés avec les preprints que quiconque peut lire et servir d’évaluation post-publication.
Language Models for the Prediction of SARS-CoV-2 Inhibitors (preprint)
biorxiv; 2021.
Preprint
Dans Anglais
| bioRxiv | ID: ppzbmed-10.1101.2021.12.10.471928
ABSTRACT
The COVID-19 pandemic highlights the need for computational tools to automate and accelerate drug design for novel protein targets. We leverage deep learning language models to generate and score drug candidates based on predicted protein binding affinity. We pre-trained a deep learning language model (BERT) on ~9.6 billion molecules and achieved peak performance of 603 petaflops in mixed precision. Our work reduces pre-training time from days to hours, compared to previous efforts with this architecture, while also increasing the dataset size by nearly an order of magnitude. For scoring, we fine-tuned the language model using an assembled set of thousands of protein targets with binding affinity data and searched for inhibitors of specific protein targets, SARS-CoV-2 Mpro and PLpro. We utilized a genetic algorithm approach for finding optimal candidates using the generation and scoring capabilities of the language model. Our generalizable models accelerate the identification of inhibitors for emerging therapeutic targets.
Texte intégral:
Disponible
Collection:
Preprints
Base de données:
bioRxiv
Sujet Principal:
COVID-19
/
Troubles du langage
langue:
Anglais
Année:
2021
Type de document:
Preprint
Documents relatifs à ce sujet
MEDLINE
...
LILACS
LIS