← Volver a resultados
Ficha bibliográfica · Consulta y acceso
Artículo

iRaPCA and SOMoC: Development and Validation of Web Applications for New Approaches for the Clustering of Small Molecules

Prada Gori, Denis Nihuel et al · American Chemical Society · 2022

Acceso abierto al texto completo
Lectura rápida. Revisá los datos básicos del recurso y luego accedé al contenido desde el botón principal. En esta ficha solo se muestra la información necesaria para identificar la obra, citarla y abrirla.

Acceso al recurso

Entrá al contenido desde la opción principal o elegí otra fuente disponible.

Acceso principal

Acceso abierto al texto completo

Texto completo identificado como acceso abierto.
Abrir texto

Resumen

Descripción general del contenido del recurso.

The clustering of small molecules implies the organization of a group of chemical structures into smaller subgroups with similar features. Clustering has important applications to sample chemical datasets or libraries in a representative manner (e.g., to choose, from a virtual screening hit list, a chemically diverse subset of compounds to be submitted to experimental confirmation, or to split datasets into representative training and validation sets when implementing machine learning models). Most strategies for clustering molecules are based on molecular fingerprints and hierarchical clustering algorithms. Here, two open-source in-house methodologies for clustering of small molecules are presented: iterative Random subspace Principal Component Analysis clustering (iRaPCA), an iterative approach based on feature bagging, dimensionality reduction, and K-means optimization; and Silhouette Optimized Molecular Clustering (SOMoC), which combines molecular fingerprints with the Uniform Manifold Approximation and Projection (UMAP) and Gaussian Mixture Model algorithm (GMM). In a benchmarking exercise, the performance of both clustering methods has been examined across 29 datasets containing between 100 and 5000 small molecules, comparing these results with those given by two other well-known clustering methods, Ward and Butina. iRaPCA and SOMoC consistently showed the best performance across these 29 datasets, both in terms of within-cluster and between-cluster distances. Both iRaPCA and SOMoC have been implemented as free Web Apps and standalone applications, to allow their use to a wide audience within the scientific community.
Fil: Prada Gori, Denis Nihuel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina
Fil: Llanos, Manuel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina

Cómo citar

Elegí el formato que necesitás y copiá la referencia al portapapeles.

APA 7

Prada Gori, D. N. E. A. (2022). iRaPCA and SOMoC: Development and Validation of Web Applications for New Approaches for the Clustering of Small Molecules. http://hdl.handle.net/11336/223388

MLA

Prada Gori, Denis Nihuel et al. "iRaPCA and SOMoC: Development and Validation of Web Applications for New Approaches for the Clustering of Small Molecules." 2022. http://hdl.handle.net/11336/223388.

Chicago

Prada Gori, Denis Nihuel et al. 2022. "iRaPCA and SOMoC: Development and Validation of Web Applications for New Approaches for the Clustering of Small Molecules.". http://hdl.handle.net/11336/223388.

Harvard

Prada Gori, D. N. E. A. 2022, iRaPCA and SOMoC: Development and Validation of Web Applications for New Approaches for the Clustering of Small Molecules, American Chemical Society, available at: http://hdl.handle.net/11336/223388 [Accessed 28 Jun. 2026].

Compartir e imprimir

Guardá la ficha, copiá su enlace permanente o imprimila como PDF.

Exportar referencia

Si usás un gestor bibliográfico, podés exportar el registro en los formatos más comunes.

Detalles del recurso

Información bibliográfica útil para confirmar que se trata del material correcto.

Título
iRaPCA and SOMoC: Development and Validation of Web Applications for New Approaches for the Clustering of Small Molecules
Autor / colaboradores
Prada Gori, Denis Nihuel et al
Editorial
American Chemical Society
Año de publicación
2022
ISSN
2987-2998
ISSN
2987-2998
Idioma
eng

Materias

Explorá otros recursos relacionados a partir de estas materias.

Copiado