Información

Sistema de entrada de línea de entrada molecular simplificado

Sistema de entrada de línea de entrada molecular simplificado


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Esta puede ser una pregunta un poco abrupta / vaga, pero no sabía cómo proceder con la búsqueda para obtener la respuesta.
¿Cuáles son las propiedades de una biomolécula 3D que se ignora cuando una biomolécula 3D se convierte en una representación 1D en SMILES (sistema simplificado de entrada de línea de entrada molecular)? Dos propiedades que encontré que se descuidan son los vínculos, las propiedades de interacción. Por propiedades me refiero al recuento de isómeros, al umbral de isómeros, etc. ¿Hay más propiedades que se descuiden?


A 3D El modelo de una (bio) molécula representa una tridimensionalidad física. Para una estructura experimental, cada átomo tiene una coordenada 3D (x, y, z) y, si se determina mediante cristalografía, un factor B isotrópico o aniosotrópico adicional (que modela las fluctuaciones del átomo).

UNA SONRISA '1D' no es una físico Representación unidimensional y se puede convertir en un gráfico (matemáticas) que representa la estructura química. La especificación de SMILES PUEDEN retienen información sobre isómeros estructurales, estereoisómeros (cis / trans; D / L), pero no confórmeros / rotómeros, que, a diferencia de las estructuras químicas más pequeñas, ES restringido a ciertas regiones favorables para biomoléculas más grandes.

Por "enlace", si se refiere a un enlace químico, como un enlace disulfuro, SMILES puede retener dicha información. Por "interacciones", si te refieres a enlaces de hidrógeno, puentes de sal e incluso interacciones hidrófobas, etc., SMILES no codifica esa información, pero tampoco un modelo 3D explícitamente; están implícitas en las coordenadas 3D de cada átomo. .

Por lo tanto, al convertir de un modelo 3D a SMILES, perdería

  1. Longitud de enlace y ángulo de enlace inusuales: se especifican necesariamente a partir de las coordenadas 3D, pero en SMILES (o el gráfico posterior), se toman como "ideales".

  2. Factor B o factor de temperatura

  3. Rotómeros: p. Ej. Las proteínas han favorecido los ángulos diedros tanto en la columna vertebral como en las cadenas laterales, lo que no se especifica en SMILES.

  4. "Interacciones": cierta interacción intramolecular que es inevitable (por ejemplo, salicilaldehído) está implícita tanto en SMILES como en un modelo 3D. La mayoría de los demás solo se pueden inferir en el modelo 3D.


Sistema de entrada de línea de entrada molecular simplificado

los sistema simplificado de entrada de línea de entrada molecular o Sonrisas es una especificación en forma de notación de línea para describir la estructura de moléculas químicas utilizando cadenas ASCII cortas. La mayoría de los editores de moléculas pueden importar cadenas de SMILES para convertirlas de nuevo en dibujos bidimensionales o modelos tridimensionales de las moléculas.

La especificación SMILES original fue desarrollada por Arthur Weininger y David Weininger a fines de la década de 1980. La Agencia de Protección Ambiental financió el proyecto inicial para desarrollar SMILES. Desde entonces ha sido modificado y ampliado por otros, sobre todo por Daylight Chemical Information Systems Inc. En 2007, la comunidad de química de código abierto Blue Obelisk desarrolló un estándar abierto llamado "OpenSMILES". Otras notaciones 'lineales' incluyen Wiswesser Line Notation (WLN), ROSDAL y SLN (Tripos Inc).

En julio de 2006, la IUPAC introdujo el InChI como estándar para la representación de fórmulas. En general, se considera que SMILES tiene la ventaja de ser un poco más legible por humanos que InChI; también tiene una amplia base de soporte de software con un respaldo teórico extenso (por ejemplo, teoría de grafos).

Citas célebres que contienen el sistema de palabras y / o simplificado:

& ldquo En nada fue la esclavitud tan salvaje e implacable como en su intento de destrucción de los instintos familiares de la raza negra en América. Individuos, no familias refugios, hogares pastoreando, no matrimonios, eran los pecados capitales en ese sistema de los horrores. & rdquo
& mdash Fannie Barrier Williams (1855 & # 1501944)

& ldquo tengo simplificado mi política en una total repugnancia a todos los gobiernos existentes y, como es el sentimiento más breve, agradable y sumario que se pueda imaginar, el primer momento de una república universal me convertiría en un defensor del despotismo único y sin oposición. El hecho es que las riquezas son poder y la pobreza es esclavitud en toda la tierra, y un tipo de establecimiento no es mejor ni peor para un pueblo que para otro. & rdquo
y mdashGeorge Gordon Noel Byron (1788 & # 1501824)


Abstracto

Se realizó un estudio simplificado de la relación estructura-actividad (QSAR) del sistema de entrada de línea de entrada molecular simplificado (SMILES) en un conjunto de inhibidores de la proteasa del VIH para explorar las funcionalidades estructurales para la inhibición de la proteasa del VIH. Para ello, se recogió de la bibliografía un conjunto de inhibidores del VIH junto con sus constantes inhibitorias. Se utilizó el software CORAL basado en la optimización de Monte Carlo para el desarrollo del modelo QSAR. En primer lugar, el conjunto de datos se dividió en tres divisiones aleatorias y, en segundo lugar, cada división se dividió en conjuntos de entrenamiento, calibración, prueba y validación. Se utilizó un conjunto de entrenamiento para el desarrollo del modelo, mientras que el resto de los conjuntos se utilizó para evaluar la calidad de los modelos desarrollados. Los modelos QSAR se desarrollaron con y sin considerar la influencia de los anillos cíclicos hacia la actividad inhibidora. La calidad estadística de los modelos QSAR desarrollados a partir de todas las divisiones fue muy buena y cumplió con los criterios. Los valores de R 2 , Q 2 , s, R 2 pred y r 2 metro explicó que los modelos seleccionados son de naturaleza robusta y lo suficientemente eficientes como para predecir la actividad inhibidora de las moléculas fuera del conjunto de entrenamiento. Los parámetros estadísticos también sugirieron que la presencia de anillos cíclicos tiene un impacto crucial en la actividad inhibidora. Se descubrió que los fragmentos moleculares son importantes para el aumento o la disminución de la actividad inhibitoria, lo que explica que los modelos tienen una interpretación mecanicista. Este estudio QSAR basado en ligandos puede proporcionar instrucciones claras para diseñar y modular posibles inhibidores de la proteasa del VIH.


Tutorial de SONRISAS

Sonrisas (Simplícito METROolecular Ientrada Line mintry System) es una notación química que permite al usuario representar una estructura química de una manera que puede ser utilizada por la computadora. Sonrisas es una notación flexible y fácil de aprender. los Sonrisas La notación requiere que aprenda un puñado de reglas. No necesita preocuparse por representaciones ambiguas porque el software reordenará automáticamente su entrada en un único Sonrisas cadena cuando sea necesario.

Sonrisas se desarrolló a través de fondos de la Agencia de Protección Ambiental de EE. UU., División de Ecología del Continente Medio-Duluth, (MED-Duluth) Duluth, MN para el Proyecto de Química Médica en Pomona College, Claremont, CA y Computer Sciences Corporation, Duluth, MN. Varias publicaciones discuten Sonrisas con más detalle, incluidos Anderson et al. 1987, Weininger 1988, Weininger et al. 1989 y Hunter et al., 1987.

Sonrisas tiene cinco reglas de sintaxis básicas que deben observarse. Si no se siguen las reglas básicas de la química en Sonrisas entrada, el sistema advertirá al usuario y le pedirá que la estructura sea editada o reingresada. Por ejemplo, si el usuario coloca demasiados enlaces en un átomo, un Sonrisas aparecerá una advertencia de que la estructura es imposible. Las reglas se describen a continuación y se proporcionan algunos ejemplos. Las siguientes reglas permiten la representación de una estructura bidimensional de una sustancia química. Para el sistema ASTER, una representación bidimensional es adecuada. Hay otras reglas disponibles para productos químicos que son isómeros estructurales, pero no se discutirán en este tutorial básico.

Regla uno: átomos y enlaces

Sonrisas admite todos los elementos de la tabla periódica. Un átomo se representa utilizando su símbolo atómico respectivo. Las letras mayúsculas se refieren a átomos no aromáticos. Las letras minúsculas se refieren a átomos aromáticos. Si el símbolo atómico tiene más de una letra, la segunda letra debe ser minúscula.

Los bonos se indican como se muestra a continuación:

Los bonos simples son los predeterminados y, por lo tanto, no es necesario ingresarlos. Por ejemplo, 'CC' significaría que hay un carbono no aromático unido a otro carbono no aromático mediante un enlace sencillo, y la computadora identificaría la estructura como el etano químico. También se supone que el enlace entre dos símbolos de átomos en minúsculas es aromático. Un espacio en blanco termina el Sonrisas cuerda.

Regla dos: cadenas simples

Combinando símbolos atómicos y símbolos de enlace se pueden representar estructuras de cadenas simples. Las estructuras que se ingresan usando Sonrisas tienen supresión de hidrógeno, es decir, las moléculas están representadas sin hidrógenos. los Sonrisas El software comprende el número de conexiones posibles que puede tener un átomo. Si el usuario no identifica suficientes enlaces a través de Sonrisas notación, el sistema asumirá automáticamente que las otras conexiones se satisfacen mediante enlaces de hidrógeno.

CC CH3CH3 Etano
C = C CH2CH2 Ethene
CBr CH3Br Bromometano
C # N C=norte Ácido cianhídrico
Na.Cl NaCl Cloruro de sodio

El usuario puede identificar explícitamente los enlaces de hidrógeno, pero si se identifica un enlace de hidrógeno en la cadena, el Sonrisas El intérprete asumirá que el usuario ha identificado todos hidrógenos para esa molécula.

Porque Sonrisas permite la entrada de todos los elementos en la tabla periódica y también utiliza supresión de hidrógeno, el usuario debe estar al tanto de los productos químicos con dos letras que la computadora podría malinterpretar. Por ejemplo, 'Sc' podría interpretarse como un átomo de azufre conectado a un carbono aromático por un enlace simple, o podría ser el símbolo del escandio. los Sonrisas El intérprete da prioridad a la interpretación de un enlace simple que conecta un átomo de azufre y un carbono aromático. Para identificar el escandio, el usuario debe ingresar [Sc].

Una rama de una cadena se especifica colocando el Sonrisas símbolo (s) para la rama entre paréntesis. La cadena entre paréntesis se coloca directamente después del símbolo del átomo al que está conectado. Si está conectado por un enlace doble o triple, el símbolo del enlace sigue inmediatamente al paréntesis izquierdo. Algunos ejemplos:

CC (O) C 2-propanol
CC (= O) C 2-propanona
CC (CC) C 2-metilbutano
CC (C) CC (= O) 2-metilbutanal
c1c (N (= O) = O) cccc1 Nitrobenceno
CC (C) (C) CC 2,2-dimetilbutano

Sonrisas permite al usuario identificar estructuras de anillo mediante el uso de números para identificar el átomo del anillo de apertura y cierre. Por ejemplo, en C1CCCCC1, el primer carbono tiene un número '1' que se conecta mediante un enlace sencillo con el último carbono que también tiene un número '1'. La estructura resultante es ciclohexano. Los productos químicos que tienen múltiples anillos se pueden identificar usando diferentes números para cada anillo. Si se utiliza un enlace doble, simple o aromático para el cierre del anillo, el símbolo del enlace se coloca antes del número de cierre del anillo. Algunos ejemplos:

o C = 1CCCCC1 Ciclohexeno
C * 1 * C * C * C * C * C1
c1ccccc1 Benceno
C1OC1CC Etiloxirano
c1cc2ccccc2cc1 Naftalina

Regla cinco: átomos cargados

Las cargas en un átomo se pueden utilizar para anular el conocimiento sobre la valencia que está integrado en Sonrisas software. El formato para identificar un átomo cargado consiste en el átomo seguido de corchetes que encierran la carga del átomo. El número de cargos puede indicarse explícitamente (<-1>) o no (<->). Por ejemplo:

Si tiene preguntas sobre el Sonrisas notación, póngase en contacto con el soporte de ECOTOX en -
T: (218) 529-5225 Correo electrónico: [email protected]

Anderson, E., G.D. Veith y D. Weininger. 1987. SMILES: Una notación de líneas e intérprete computarizado para estructuras químicas. Informe No. EPA / 600 / M-87/021. Agencia de Protección Ambiental de los Estados Unidos, Laboratorio de Investigación Ambiental-Duluth, Duluth, MN 55804

Hunter, R.S., F.D. Culver y A. Fitzgerald. 1987. SMILES User Manual. Un sistema de entrada de línea de entrada molecular simplificado. Incluye SONRISAS extendidas para definir fragmentos. Revisión del borrador, informe interno, Universidad Estatal de Montana, Instituto de Control de Procesos Biológicos y Químicos (IPA), Bozeman, MT.

Weininger, D. 1988. SONRISAS, lenguaje químico y sistema de información. 1. Introducción a la metodología y reglas de codificación. Revista de información química y ciencias de la computación 28: 31-36.


Palabras clave

  • APA
  • Estándar
  • Harvard
  • Vancouver
  • Autor
  • BIBTEX
  • RIS

Resultado de la investigación: Contribución a la revista ›Artículo› revisión por pares

T1 - Descriptores óptimos basados ​​en el sistema de entrada de línea de entrada molecular simplificado

T2 - Mutagenicidad de modelado cuantitativo de la relación estructura-actividad de hidrocarburos aromáticos policíclicos nitrados

N2 - Desarrollamos un nuevo modelo QSAR, basado en los descriptores óptimos, calculado con un sistema de entrada de línea de entrada molecular simplificado. Estos descriptores se correlacionan con el potencial mutagénico de un conjunto de entrenamiento y se correlacionan con este punto final para un conjunto de prueba. Las características estadísticas del modelo son n = 28, r2 = 0.902, q2 = 0.892, s = 0.554, F = 240 (conjunto de entrenamiento) yn = 20, r2 = 0.853, q2 = 0.823, s = 0.702, F = 105 ( equipo de prueba).

AB - Desarrollamos un nuevo modelo QSAR, basado en los descriptores óptimos, calculado con un sistema de entrada de línea de entrada molecular simplificado. Estos descriptores se correlacionan con el potencial mutagénico de un conjunto de entrenamiento y se correlacionan con este punto final para un conjunto de prueba. Las características estadísticas del modelo son n = 28, r2 = 0.902, q2 = 0.892, s = 0.554, F = 240 (conjunto de entrenamiento) yn = 20, r2 = 0.853, q2 = 0.823, s = 0.702, F = 105 ( equipo de prueba).


Definiția SMILES ca șiruri de limbaj fără context

Din punctul de vedere al teoriei limbajului formal, SMILES este un cuvânt. Un SMILES este analizat cu un analizor fără context. Utilizarea acestei reprezentări a fost în predicția ownertăților biochimice (incl. Toxicitatea și biodegradabilitatea) pe baza principiului principal al chimioterapiei conform căruia molécula similar au proprietăți similar. Modelele predictive au implementat o abordare sintactică de recunoaștere a modelelor (care a implicat definirea unei distanțe moleculare), precum și o schemă mai robustă bazată pe recunoașterea statistică a modelelor.


Sistema simplificado de entrada de línea de entrada molecular - Biología

Haz - expresar mediante una sonrisa radiante

Beam es un juego de herramientas gratuito dedicado a analizar y generar un sistema de entrada de línea de entrada molecular simplificado: notaciones de línea SMILES ™. El enfoque principal de la biblioteca es manejar con elegancia la sintaxis SMILES ™ y lo más rápido posible.

Nota: Beam todavía está en desarrollo y es probable que algunas API cambien hasta que se publique.

Uno de los tipos principales de Beam es Graph, que proporciona métodos prácticos para leer la notación SMILES ™ directamente.

y por escribirlo en notación SMILES ™.

Beam proporciona un disparo redondo excelente, conservando exactamente cómo se especificó la entrada. Sin tener en cuenta las entradas con paréntesis redundantes y números de timbre erróneos / repetidos, la entrada real generalmente será idéntica a la salida.

Aunque preservar la representación fue uno de los objetivos del diseño de la viga, es común normalizar la salida SMILES ™.

Colapso un gráfico con hidrógenos marcados [CH3] [CH2] [OH] a uno con hidrógenos implícitos CCO.

Expandir un gráfico donde los hidrógenos son CCO implícitos a uno con hidrógenos marcados [CH3] [CH2] [OH].

La especificación estéreo se mantiene a través de reordenamientos. El siguiente ejemplo genera aleatoriamente SMILES ™ que conserva la configuración estéreo correcta.

La configuración de doble enlace basada en enlaces es normal en SMILES, pero puede ser problemática. El problema es que un solo símbolo puede especificar dos configuraciones adyacentes. Una extensión propuesta fue utilizar una configuración de doble enlace basada en átomos.

Beam ingresará, emitirá y convertirá la especificación estéreo de doble enlace basada en enlaces y átomos.

Convierta un gráfico con enlaces deslocalizados en representación kekulé.

Con la especificación estéreo de doble enlace basada en enlaces, hay dos formas posibles de escribir cada configuración basada en enlaces. beam le permite normalizar las etiquetas de modo que el primer símbolo sea siempre una barra inclinada (/). Algunos ejemplos se muestran a continuación.

Beam todavía está en desarrollo, pero puede obtener la última compilación del repositorio de instantáneas de EBI. A continuación se muestra un ejemplo de configuración para maven.

Copyright (c) 2013, Instituto Europeo de Bioinformática (EMBL-EBI) Todos los derechos reservados.

Se permite la redistribución y el uso en formato fuente y binario, con o sin modificaciones, siempre que se cumplan las siguientes condiciones:

  1. Las redistribuciones del código fuente deben conservar el aviso de derechos de autor anterior, esta lista de condiciones y el siguiente descargo de responsabilidad.
  2. Las redistribuciones en formato binario deben reproducir el aviso de derechos de autor anterior, esta lista de condiciones y el siguiente descargo de responsabilidad en la documentación y / u otros materiales proporcionados con la distribución.

ESTE SOFTWARE ES PROPORCIONADO POR LOS TITULARES DE LOS DERECHOS DE AUTOR Y COLABORADORES "TAL CUAL" Y CUALQUIER GARANTÍA EXPRESA O IMPLÍCITA, INCLUYENDO, PERO NO LIMITADO A, LAS GARANTÍAS IMPLÍCITAS DE COMERCIABILIDAD E IDONEIDAD PARA UN PROPÓSITO PARTICULAR SE RECHAZAN. EN NINGÚN CASO EL PROPIETARIO DE LOS DERECHOS DE AUTOR O LOS COLABORADORES SERÁN RESPONSABLES DE NINGÚN DAÑO DIRECTO, INDIRECTO, INCIDENTAL, ESPECIAL, EJEMPLAR O CONSECUENTE (INCLUYENDO, PERO NO LIMITADO A, LA ADQUISICIÓN DE BIENES O SERVICIOS SUSTITUTOS, PÉRDIDA DE USO, DATOS O BENEFICIOS O NEGOCIO INTERRUPCIÓN) SIN EMBARGO Y SOBRE CUALQUIER TEORÍA DE RESPONSABILIDAD, YA SEA POR CONTRATO, RESPONSABILIDAD ESTRICTA O AGRAVIO (INCLUYENDO NEGLIGENCIA O DE OTRO MODO) QUE SURJA DE CUALQUIER FORMA DEL USO DE ESTE SOFTWARE, AUNQUE SE INDIQUE LA POSIBILIDAD DE DICHO DAÑO.

Las opiniones y conclusiones contenidas en el software y la documentación son las de los autores y no deben interpretarse como representantes de políticas oficiales, ya sea expresas o implícitas, del Proyecto FreeBSD.


Átomos

Los átomos están representados por la abreviatura estándar de los elementos químicos, entre corchetes, como [Au] para el oro. El anión hidróxido es [OH-]. Los corchetes se pueden omitir para el "subconjunto orgánico" de B, C, N, O, P, S, F, Cl, Br e I. Todos los demás elementos deben incluirse entre corchetes. Si se omiten los corchetes, se supone que el número apropiado de átomos de hidrógeno implícitos, por ejemplo, SMILES para el agua es simplemente O.

Cautiverio

Se supone que los enlaces entre átomos alifáticos son simples a menos que se especifique lo contrario y están implícitos en la adyacencia en SMILES. Por ejemplo, las SONRISAS para el etanol se pueden escribir como CCO. Las etiquetas de cierre de anillo se utilizan para indicar la conectividad entre átomos no adyacentes en SMILES, que para ciclohexano y dioxano se pueden escribir como C1CCCCC1 y O1CCOCC1 respectivamente. Los enlaces dobles y triples están representados por los símbolos '=' y '#' respectivamente, como se ilustra con SMILES O = C = O (dióxido de carbono) y C # N (cianuro de hidrógeno).

Derivación

Las ramas se describen entre paréntesis, como en CCC (= O) O para ácido propiónico y C (F) (F) F para fluoroformo. Los anillos sustituidos se pueden escribir con el punto de ramificación en el anillo como se ilustra con SMILES COc (c1) cccc1C # N (ver descripción) y COc (cc1) ccc1C # N (ver descripción) que codifican los isómeros 3 y 4-cianoanisol. Escribir SMILES para anillos sustituidos de esta manera puede hacerlos más legibles por humanos.

Aromaticidad

Los átomos aromáticos de C, O, S y N se muestran en su minúscula 'c', 'o', 's' y 'n' respectivamente. El benceno, la piridina y el furano se pueden representar respectivamente por SMILES c1ccccc1, n1ccccc1 y o1cccc1. Los enlaces entre átomos aromáticos son, por defecto, aromáticos, aunque pueden especificarse explícitamente mediante el símbolo ':'. Los átomos aromáticos se pueden unir individualmente entre sí y el bifenilo se puede representar por c1ccccc1-c2ccccc2. El nitrógeno aromático unido al hidrógeno, como se encuentra en el pirrol, debe representarse como [nH] y el imidazol se escribe en notación SMILES como n1c [nH] cc1.

Los algoritmos Daylight y OpenEye para generar SONRISAS canónicas difieren en su tratamiento de la aromaticidad.

Estereoquímica

La configuración alrededor de dobles enlaces se especifica mediante los caracteres "/" y "". Por ejemplo, F / C = C / F (ver dibujo) es una representación de trans-difluoroeteno, en el que los átomos de flúor están en lados opuestos del doble enlace, mientras que F / C = C F (ver dibujo) es una posible representación de cis-difluoroeteno, en el que las F están en el mismo lado del doble enlace, como se muestra en la figura.

La configuración en el carbono tetraédrico se especifica mediante @ o @@. La L-alanina, el enantiómero más común del aminoácido alanina, se puede escribir como N [C @@ H] (C) C (= O) O (ver descripción). El especificador @@ indica que, cuando se ve desde el nitrógeno a lo largo del enlace al centro quiral, la secuencia de sustituyentes hidrógeno (H), metilo (C) y carboxilato (C (= O) O) aparece en el sentido de las agujas del reloj. La D-alanina se puede escribir como N [C @ H] (C) C (= O) O (ver dibujo). El orden de los sustituyentes en la cadena SMILES es muy importante y la D-alanina también se puede codificar como N [C @@ H] (C (= O) O) C (ver dibujo).

Isótopos

Los isótopos se especifican con un número igual a la masa isotópica entera que precede al símbolo atómico. El benceno en el que un átomo es carbono 14 se escribe como [14c] 1ccccc1 y el deuterocloroformo es [2H] C (Cl) (Cl) Cl.

Otros ejemplos de SONRISAS

La notación SMILES se describe ampliamente en el manual de teoría SMILES proporcionado por Daylight Chemical Information Systems y se presentan varios ejemplos ilustrativos. La utilidad de representación de Daylight proporciona a los usuarios los medios para comprobar sus propios ejemplos de SMILES y es una valiosa herramienta educativa.


Sistema simplificado de entrada de línea de entrada molecular - Biología

SMILES (Sistema simplificado de entrada de línea de entrada molecular) es un notación de línea (un método tipográfico que usa caracteres imprimibles) para ingresar y representar moléculas y reacciones. Algunos ejemplos son:

SonrisasNombreSonrisasNombre
CC etano [OH3 +] Ion de hidronio
O = C = O dióxido de carbono [2H] O [2H] óxido de deuterio
C # N cianuro de hidrógeno [235U] uranio-235
CCN (CC) CC trietilamina F / C = C / F E-difluoroeteno
CC (= O) O ácido acético F / C = C F Z-difluoroeteno
C1CCCCC1 ciclohexano N [C @@ H] (C) C (= O) O L-alanina
c1ccccc1 benceno N [C @ H] (C) C (= O) O D-alanina

Sonrisas de reacciónNombre
[I -]. [Na +]. C = CCBr >> [Na +]. [Br -]. C = CCI reacción de desplazamiento
(C (= O) O). (OCC) >> (C (= O) OCC). (O) esterificación intermolecular

SMILES contiene la misma información que se puede encontrar en una tabla de conexión ampliada. La razón principal por la que SMILES es más útil que una tabla de conexión es que se trata de una construcción lingüística, en lugar de una estructura de datos de computadora. SMILES es un idioma verdadero, aunque con un vocabulario simple (símbolos de átomos y enlaces) y solo unas pocas reglas gramaticales. Las representaciones de SMILES de la estructura pueden, a su vez, usarse como "palabras" en el vocabulario de otros lenguajes diseñados para el almacenamiento de información química (información sobre sustancias químicas) e inteligencia química (información sobre química).

Parte del poder de SMILES es que existen SMILES únicas. Con SONRISAS estándar, el nombre de una molécula es sinónimo de su estructura con SONRISAS únicas, el nombre es universal. Cualquiera en el mundo que use SONRISAS únicas para nombrar una molécula elegirá exactamente el mismo nombre.

Otra propiedad importante de SMILES es que es bastante compacto en comparación con la mayoría de los otros métodos de representación de estructuras. Una SMILES típica ocupará entre un 50% y un 70% menos de espacio que una tabla de conexión equivalente, incluso tablas de conexión binaria. Por ejemplo, una base de datos de 23.137 estructuras, con un promedio de 20 átomos por estructura, usa solo 1.6 bytes por átomo cuando se representa con SMILES. Además, la compresión ordinaria de SMILES es extremadamente eficaz. La misma base de datos citada anteriormente se redujo al 27% de su tamaño original mediante la compresión Ziv-Lempel (es decir, 0,42 bytes por átomo).

  • Claves para el acceso a la base de datos
  • Mecanismo para que los investigadores intercambien información química
  • Sistema de entrada de datos químicos
  • Parte de lenguajes para inteligencia artificial o sistemas expertos en química

3.1 Canonicalización

Entrada SONRISASSONRISAS ÚNICAS
OCC CCO
[CH3] [CH2] [OH] CCO
C-C-O CCO
C (O) C CCO
OC (= O) C (Br) (Cl) N NC (Cl) (Br) C (= O) O
ClC (Br) (N) C (= O) O NC (Cl) (Br) C (= O) O
O = C (O) C (N) (Br) Cl NC (Cl) (Br) C (= O) O

3.2 Reglas de especificación de SMILES

Hay cinco reglas de codificación SMILES genéricas, correspondientes a la especificación de átomos, enlaces, ramas, cierres de anillo y desconexiones. Las reglas para especificar varios tipos de isomería se discuten en la siguiente sección, SONRISAS ISOMÉRICAS.

3.2.1 Átomos

C metano (CH4)
PAG fosfina (PH3)
norte amoníaco (NH3)
S sulfuro de hidrógeno (H2S)
O agua (H2O)
Cl ácido clorhídrico (HCl)

Los átomos con valencias distintas de las "normales" y los elementos que no están en el "subconjunto orgánico" deben describirse entre paréntesis.

[S] azufre elemental
[Au] oro elemental

Entre paréntesis, siempre se deben especificar los hidrógenos adjuntos y las cargas formales. El número de hidrógenos unidos se muestra con el símbolo H seguido de un dígito opcional. De manera similar, una carga formal se muestra mediante uno de los símbolos + o -, seguido de un dígito opcional. Si no se especifica, se supone que el número de hidrógenos unidos y la carga es cero para un átomo entre paréntesis. Las construcciones de la forma [Fe +++] son ​​sinónimos de la forma [Fe + 3]. Algunos ejemplos son:

[H +] protón
[Fe + 2] catión de hierro (II)
[OH-] anión hidroxilo
[Fe ++] catión de hierro (II)
[OH3 +] catión hidronio
[NH4 +] catión de amonio

3.2.2 Bonos

CC etano (CH3CH3)
C = O formaldehído (CH2O)
C = C eteno (CH2 = CH2)
O = C = O dióxido de carbono (CO2)
COC dimetil éter (CH3OCH3)
C # N cianuro de hidrógeno (HCN)
CCO etanol (CH3CH2OH)
[S.S] hidrógeno molecular (H2)

Para estructuras lineales, la notación SMILES corresponde a la notación diagramática convencional excepto que los hidrógenos y los enlaces simples generalmente se omiten. Por ejemplo, el 6-hidroxi-1,4-hexadieno se puede representar mediante muchas SONRISAS igualmente válidas, incluidas las tres siguientes:

EstructuraSonrisas válidas
C = CCC = CCO
CH2 = CH-CH2-CH = CH-CH2-OH C = C-C-C = C-C-O
OCC = CCC = C

3.2.3 Sucursales

CCN (CC) CC CC (C) C (= O) O C = CC (CCC) C (C (C) C) CCC
Trietilamina Ácido isobutírico 3-propil-4-isopropil-1-hepteno

3.2.4 Estructuras cíclicas

Por lo general, hay muchas descripciones diferentes, pero igualmente válidas, de la misma estructura, por ejemplo, las siguientes notaciones SMILES para 1-metil-3-bromo-ciclohexeno-1:

Se pueden escribir muchas otras notaciones para la misma estructura, derivadas de diferentes cierres de anillo. SMILES no tiene una entrada preferida en la entrada, aunque (a) anterior puede ser más simple, otros son igualmente válidos.

Un solo átomo puede tener más de un cierre de anillo. Esto se ilustra con la estructura de cubano en la que dos átomos tienen más de un cierre de anillo:

Generación de SONRISAS para cubano: C12C3C4C1C5C4C3C25.

Si lo desea, se pueden reutilizar los dígitos que denotan cierres de anillo. Como ejemplo, el dígito 1 utilizado dos veces en la especificación:

La capacidad de reutilizar los dígitos del cierre del anillo permite especificar estructuras con 10 o más anillos. Las estructuras que requieren más de 10 cierres de anillo para abrirse a la vez son extremadamente raras. Si es necesario o deseado, los cierres de anillo con números más altos pueden especificarse anteponiendo un número de dos dígitos con un signo de porcentaje (%). Por ejemplo, C2% 13% 24 es un átomo de carbono con cierres de anillo 2, 13 y 24.

3.2.5 Estructuras desconectadas

Los pares de dígitos coincidentes que siguen las especificaciones de los átomos implican que los átomos están unidos entre sí. El enlace puede ser explícito (símbolo de enlace y / o dirección que precede al dígito de cierre del anillo) o implícito (un enlace simple o aromático no direccional). Esto es cierto tanto si el vínculo termina como parte de un anillo como si no.

Los átomos adyacentes separados por un punto (.) Implica que los átomos no están unidos entre sí. Esto es cierto tanto si los átomos están en el mismo componente conectado como si no.

Por ejemplo, C1.C1 especifica la misma molécula que CC(etano)

3.3 SONRISAS isoméricas

Las reglas de especificación de isómeros SMILES permiten especificar completamente la quiralidad para cualquier estructura, si se conoce. A diferencia de la mayoría de las nomenclaturas químicas existentes, como CIP e IUPAC, estas reglas también están diseñadas para permitir parcial especificación de quiralidad. Aparte del uso en macros, búsqueda de subestructuras y otras operaciones de coincidencia de patrones, esto es importante porque gran parte de la información química disponible en el mundo es conocida por estructuras con quiralidades resueltas de manera incompleta (no todos los centros quirales posibles están separados, conocidos o reportados).

Por lo tanto, todas las reglas de especificación de isómeros en SMILES son opcionales. La ausencia de una especificación para cualquier atributo implica que el valor de ese atributo no está especificado.

3.3.1 Especificación isotópica

Sonrisas Nombre
[12C] carbono-12
[13C] carbono-13
[C] carbono (masa no especificada)
[13CH4] Metano C-13

3.3.2 Configuración alrededor de enlaces dobles

Una diferencia importante entre las convenciones de quiralidad SMILES y otras como CIP es que SMILES utiliza quiralidad local representación (a diferencia de quiralidad absoluta), Que permite parcial especificaciones. A continuación se ilustra un ejemplo de esto:

F / C = C / C = C / C F / C = C / C = CC
(completamente especificado) (parcialmente especificado)

3.3.3. Configuración alrededor de centros tetraédricos

El tipo de quiralidad más simple y común es tetraédrico. Cuatro átomos vecinos están dispuestos uniformemente alrededor de un átomo central, conocido como "centro quiral". Si los cuatro vecinos son diferentes entre sí de alguna manera, las imágenes en espejo de la estructura no serán idénticas. Las dos imágenes especulares se conocen como "enantiómeros" y son las únicas dos formas que puede tener un centro tetraédrico. Si dos (o más) de los cuatro vecinos son idénticos entre sí, el átomo central no será quiral (sus imágenes especulares pueden superponerse en el espacio).

En SMILES, los centros tetraédricos pueden indicarse mediante una especificación quiral simplificada (@ o @@) escrito como una propiedad atómica que sigue al símbolo atómico del átomo quiral. Si una especificación quiral no está presente para un átomo quiral, su quiralidad no se especifica implícitamente. Por ejemplo:

NC (C) (F) C (= O) O N [C @] (C) (F) C (= O) O
NC (F) (C) C (= O) O N [C @@] (F) (C) C (= O) O
(quiralidad no especificada) (quiralidad especificada)

Mirando de el amino norte para el quiral C (como se escribe la SONRISA), los otros tres vecinos aparecen en sentido antihorario en el orden en que están escritos en la parte superior SONRISAS, N [C @] (C) (F) C (= O) O (metil-C, F, carboxi-C), y en el sentido de las agujas del reloj en el de abajo, N [C @@] (F) (C) C (= O) O. El símbolo "@"indica que los siguientes vecinos se enumeran en sentido antihorario (es un" mnemónico visual "en el sentido de que el símbolo parece una espiral en sentido antihorario alrededor de un círculo central)".@@"indica que los vecinos se enumeran en el sentido de las agujas del reloj (lo adivinó, en el sentido contrario a las agujas del reloj).

Si el carbono central no es el primer átomo de SMILES y tiene un hidrógeno implícito adjunto (puede tener como máximo uno y aún ser quiral), el hidrógeno implícito se toma como el primer átomo vecino de los tres vecinos que siguen a un especificación tetraédrica. Si el carbono central está primero en SMILES, el hidrógeno implícito se toma como el átomo "de". Los hidrógenos siempre pueden escribirse explícitamente (como [H]) en cuyo caso se tratan como cualquier otro átomo. En cada caso, el El orden implícito es exactamente como está escrito en SMILES.. Algunas de las SONRISAS válidas para la alanina son:

N [C @@] ([H]) (C) C (= O) O N [C @] ([H]) (C) C (= O) O
N [C @@ H] (C) C (= O) O N [C @ H] (C) C (= O) O
N [C @ H] (C (= O) O) C N [C @@ H] (C (= O) O) C
[H] [C @] (N) (C) C (= O) O [H] [C @@] (N) (C) C (= O) O
[C @ H] (N) (C) C (= O) O [C @@ H] (N) (C) C (= O) O

El orden quiral del vínculo de cierre del anillo está implícito en el orden léxico en el que aparece el dígito de cierre del anillo. en el átomo quiral (no en el orden léxico del átomo "sustituyente").

C [C @ H] 1CCCCO1
o
O1CCCC [C @@ H] 1C

3.3.4 Especificación quiral general

La especificación quiral general utilizada en SMILES tiene tres partes: la @ símbolo, seguido de un indicador de clase quiral de dos letras, seguido de un designador de permutación quiral numérico. Se asigna una clase quiral predeterminada a cada grado (número de conexiones), la clase predeterminada para cuatro conexiones es tetraédrica (TH). La mayoría de las quiralidades tienen más de dos opciones posibles; las opciones se asignan de una tabla numéricamente. En la mayoría de los casos, @1 designación significa "en sentido antihorario alrededor del eje representado por el orden SONRISAS" y @2 significa "en el sentido de las agujas del reloj". Anotaciones en el formulario "@@" y "@@@"se interpretan como"@2 "y"@3 "(análogo a"+++" sentido "+3"). Los "@" y "@@"las notaciones utilizadas anteriormente son atajos para las especificaciones completas"@ TH1" y "@ TH2". En la práctica, a menudo no se necesitan especificaciones quirales completas.

SMILES maneja toda la gama de especificaciones quirales, incluida la resolución de "quiralidad reducida" (donde el número de enantiómeros se reduce por simetría) y "quiralidad degenerada" (donde el centro se vuelve no quiral debido a la sustitución simétrica). As with other aspects of SMILES, the language guarantees the ability to specify exactly what is known, including partial specifications. The SMILES system will generate unique isomeric SMILES for any given specification, and substructure recognition will operate correctly on all types of chirality.

The rest of this section will be limited to discussing the following chiralities: tetrahedral, allene-like, square-planar, trigonal-bipyramidal, and octahedral. Although many more chiral classes can be handled by this system (it's table-driven), these five classes are very common in chemistry and cover most of the issues to be encountered in the remainder.

Tetrahedral. The tetrahedral class symbol is TH. This is the default chiral class for degree four. Possible values are 1 and 2. @TH1 (or just @) indicates that, looking from the first connected atom, the following three connected atoms are listed anticlockwise @TH2 (o @@) indicates clockwise.

Allene-like. The allene-like class symbol is Alabama. This is the default chiral class for degree 2 (the chiral center is the central atom with two double bonds). Although substituted C=C=C structures are most common, C=C=C=C=C structures are also allene-like, as are any odd number of serially double-bonded atoms. Possible values are @AL1 (or just @) y @AL2 (o @@) these are interpreted by superimposing the substituted atoms and evaluating as per tetrahedral. Hydrogens attached to substituted allene-like atoms are taken to be immediately following that atom, as shown below:

OC(Cl)=[[email protected]]=C(C)F OC=[[email protected]]=CF
OC(Cl)=[[email protected]]=C(C)F OC([H])=[[email protected]]=C([H])F

Square-planar. The square-planar class symbol is SP Possible values are @SP1, @SP2, y @SP3 this is not the default chiral class for degree four, so shorthand specifications are not allowed. Square-planar is also somewhat unusual in that the ideas of clockwise and anticlockwise do not apply.

F[[email protected]](Cl)(Br)I (SP1 lists in a "U shape")
F[[email protected]](Br)(Cl)I (SP2 lists in a "4-shape")
F[[email protected]](Cl)(I)Br (SP3 lists in a "Z shape")

Trigonal-bipyramidal. The trigonal-bipyramidal class symbol is TB. This is the default chiral class for degree five. Possible values are @TB1 para @TB20. @TB1 (or just @) indicates that, when the SMILES is listed from one axial connection to the other, the three intermediate, equatorially-connected atoms are listed anticlockwise @TB2 (o @@) indicates clockwise. This is illustrated below.

Octahedral . The octahedral class symbol is OH. This is the default chiral class for degree six. Possible values are @OH1 para @OH30. @OH1 (or just @) indicates that, when the SMILES is listed from one axial connection to the other, the four intermediate, equatorially-connected atoms are listed anticlockwise @OH2 (o @@) indicates clockwise. This is illustrated below.

3.4 SMILES Conventions

3.4.1 Hydrogens

  • Implicitly. for atoms specified without brackets, from normal valence assumptions.
  • Explicitly by count. inside brackets, by the hydrogen count supplied zero if unspecified.
  • As explicit atoms. as [H] atoms.

There is no distinction between "organic" and "inorganic" SMILES nomenclature. One may specify the number of attached hydrogens for any atom in any SMILES. For example, propane may be entered as [CH3][CH2][CH3] instead of CCC.

There are four situations where specification of explicit hydrogen specification is required:

  • charged hydrogen, i.e. a proton, [H+]
  • hydrogens connected to other hydrogens, e.g., molecular hydrogen, [H][H]
  • hydrogens connected to other than one other atom, e.g., bridging hydrogens and
  • isotopic hydrogen specifications, e.g. in heavy water, [2H]O[2H].

3.4.2 Aromaticity

The SMILES algorithm uses an extended version of Hueckel's rule to identify aromatic molecules and ions. To qualify as aromatic, all atoms in the ring must be sp 2 hybridized and the number of available "excess" p-electrons must satisfy Hueckel's 4N+2 criterion. As an example, benzene is written c1ccccc1, but an entry of C1=CC=CC=C1 - cyclohexatriene, the Kekulé form - leads to detection of aromaticity and results in an internal structural conversion to aromatic representation. Conversely, entries of c1ccc1 y c1ccccccc1 will produce the correct anti-aromatic structures for cyclobutadiene and cyclooctatetraene, C1=CC=C1 y C1=CC=CC=CC=C1. In such cases the SMILES system looks for a structure that preserves the implied sp 2 hybridization, the implied hydrogen count, and the specified formal charge, if any. Some inputs, however, may not only be incorrect but also impossible, such as c1cccc1. Aquí c1cccc1 cannot be converted to C1=CCC=C1 since one of the carbon atoms would be sp 3 with two attached hydrogens. In such a structure alternating single and double bond assignments cannot be made. The SMILES system will flag this as an "impossible" input. Please note that only atoms on the following list can be considered aromatic: C, N, O, P, S, As, Se, and * (wildcard). In addition, exocyclic double bonds do not break aromaticity.

C1=COC=C1 C1=CN=C[NH]C(=O)1 C1=C*=CC=C1
c1cocc1 c1cnc[nH]c(=O)1 c1c*ccc1

It is important to remember that the purpose of the SMILES aromaticity detection algorithm is for the purposes of chemical information representation only! To this end, rigorous rules are provided for determining the "aromaticity" of charged, heterocyclic, and electron-deficient ring systems. The "aromaticity" designation as used here is not intended to imply anything about the reactivity, magnetic resonance spectra, heat of formation, or odor of substances.

3.4.3 Aromatic Nitrogen Compounds

n1ccccc1 O=n1ccccc1 [O-][n+]1ccccc1 Cn1cccc1 [nH]1cccc1
Pyridine Pyridine-N-oxide Methyl and 1H-pyrrole

Note that the pyrrolyl nitrogen in 1H-pyrrole is written [nH] to distinguish this kind of nitrogen from a pyridyl-N. Alternative valid SMILES for 1H-pyrrole include [H]n1cccc1 (with explicit hydrogen) and N1C=CC=C1 (aliphatic form) all three input forms are equivalent.

3.4.4 Bonding Conventions

Given one valence model of a structure, chemical database systems such as THOR and Merlin have the ability to retrieve data about that structure even if the data were stored under a different valence model of the structure. With such systems, the choice of valence conventions is not critical to either database design nor database query.

3.4.5 Tautomers

O=c1[nH]cccc1 Oc1ncccc1
2-pyridone 2-pyridinol

3.5 Extensions for Reactions

The SMILES language is extended to handle reactions. There are two areas where SMILES is extended: distinguishing component parts of a reactions and atom maps.

Component parts of a reaction are handled by introducing the ">" character as a new separator. Any reaction must have exactly two > characters in it. ">>" is a valid reaction SMILES for an empty reaction. Each of the ">"-separated components of a reaction must be a valid molecule SMILES.

As an aside, molecule SMILES never have a ">" character. In a program, one can quickly determine if a SMILES refers to a reaction or molecule by searching for a ">" character in the string.

Reaction SMILES Grammar:

Por ejemplo: C=CCBr>>C=CCI This is a valid reaction. Note that there are no agent molecules. Also note that several atoms are missing from the reaction (the product "Br" and the reactant "F").

[I-].[Na+].C=CCBr>>[Na+].[Br-].C=CCI This is a more complete version of the same reaction. It has been canonicalized. It would form the root of a datatree when stored in a THOR database.

C=CCBr.[Na+].[I-]>CC(=O)C>C=CCI.[Na+].[Br-] This version of the reaction includes an agent. Note that the SMILES does not indicate how the agent participates. Whether the agent is a solvent, catalyst, or performs another function within the reaction must be stored separately as data. This SMILES could be stored in a THOR database as an absolute SMILES and would appear on the same datatree page as the previous example.

In the above example, note that the reaction is ambiguous with respect to the carbon atoms involved. One might assume that a normal Sn2 displacement is occurring. In fact, an equally reasonable allylic displacement is possible, via either an Sn1-like allyl cation. Recognize that the reaction SMILES given above do not say which carbons are which and hence do not discriminate between the two alternate mechanisms.

This case demonstrates the use and need for atom maps for reaction processing. Atom maps are used primarily to further define the overall reaction in cases where the reaction mechanism may not be evident from the reactant and product molecules. Atom maps are non-negative integer atom modifiers. They follow the ":" character within an atom expression. They must be the last modifier within the atom expression:

SMILES Atom Expression Grammar:

Atom maps are an atomic propiedad. They can legally appear in a SMILES for any atom, whether or not it is part of a reaction. Atom with atom map labels in a molecule SMILES are considered valid the atom maps are ignored for molecule processing. Absolute and unique SMILES generated by the system for molecules never include atom maps.

Finally, there are some differences in the handling of atom maps and agent components in the único versus absoluto SMILES for reactions. Atom maps and agent components are not part of the unique SMILES specification. This is important for the THOR database, where the datatree roots are formed from the unique SMILES. The net result is that each reaction datatree may contain multiple specific reactions with different agents and atom maps.

3.5.1 Reaction Atom Maps

Atom mappings are properties of the atoms in the reaction molecules. The mappings represent equivalence classes of atoms within a reaction. In effect, the map tells the computer which atoms are the same on the reactant and products sides of a reaction. Without this map information, it is difficult to derive the reaction bond changes which occur.

Within the SMILES language, atom maps are represented as a non-negative numeric atom modifier following the ":" character (e.g. [CH3:2] is a carbon in class 2).

Within the Daylight toolkit, the atom maps are manipulated as sets of mapped atoms. The atom map class numbers which are used in SMILES do not appear in the toolkit interface to a reaction. The map class numbers in SMILES do not have any additional significance, except to associate all atoms with the same map class label to one another.

There are no requirements for completeness or uniqueness of the atom mappings. Atom mappings are independent of the connectivity and properties of the underlying molecules. This is so for several reasons: first, there are limits to the valence representation of molecules which appear when processing reactions. For example the oxygens in sodium acetate (CC(=O)[O-].[Na+]) are chemically indistinguishable, even though the valence model used in the toolkit requires that they be connected differently. Some systems (CAS, for example) recognize this equivalence in their structural representation (the tautomer bond). It is often useful to map these to the same class for reaction purposes: [CH3:1][C:2](=[O:3])[O-:3].[Na+:4]

A second case is where there is ambiguity in a reaction mechanism which one wants to express:

can undergo a cope rearrangement before reaction (which yields the same molecule graph). In effect, there are two distinct mechanisms by which the product is produced. This can be expressed as part of a reaction by: [CH2:1]=[CH:2][CH2:1][CH2:3][C:4](C)[CH2:3]

A third case is simply a lack of information about the reaction itself. It should be possible to omit some atom maps or specify partial information for sets of atoms which *might* end up in a given position in the product. It is never acceptable to force a user to make up data in order to register a reaction. One should only store exactly what is known about the reaction. Atom maps are, by definition ambiguous with respect to the underlying molecules. Atom maps do not appear in the lexical representation of a unique SMILES. They do appear in the lexical representation of an absolute SMILES.

Finally, atom maps are arbitrary class designations the values of the numbers have no meaning. The Daylight system reserves the right to change the class numbers upon canonicalization of a reaction. The system will reorder the atom map classes over the entire reaction during canonicalization. The resulting maps are guaranteed to have the same meaning as the reaction before canonicalization. Practically, the maps are renumbered as small, dense integers in canonical atom order, but this is not guaranteed. Also, during canonicalization, the atom map classes for agent atoms are removed.

3.5.2 Hydrogens

Hydrogens in reactions are handled as with molecules they are suppressed unless "special". Recall that for molecules, hydrogens are special if they are: charged, isotopic, bonded to another hydrogen, or multiply bonded. With reactions, there is an additional case which will make a hydrogen special. It is often desirable (eg. 1,5-hydride shift) to store information about the location of hydrogens as part of the atom map of a reaction. Hydrogens with a supplied atom map are considered "special" and these hydrogens are not suppressed. These mapped hydrogens appear explicitly in Absolute SMILES for reactions. Otherwise, atom-mapped hydrogens do not appear in Unique SMILES.


Rozšíření

SMARTS je liniový zápis pro specifikaci substrukturních vzorů v molekulách. I když používá mnoho stejných symbolů jako SMILES, umožňuje také specifikaci zástupných atomů a vazeb, které lze použít k definování substrukturálních dotazů pro vyhledávání v chemické databázi . Jedna běžná mylná představa je, že substrukturální vyhledávání založené na SMARTS zahrnuje porovnávání řetězců SMILES a SMARTS. Ve skutečnosti jsou řetězce SMILES i SMARTS nejprve převedeny na interní grafové reprezentace, které jsou hledány pro izomorfismus podgrafu .

SMIRKS, nadmnožina „reakce SMILES“ a podmnožina „reakce SMARTS“, je řádkový zápis pro specifikaci reakčních transformací. Obecná syntaxe pro rozšíření reakcí je REACTANT>AGENT>PRODUCT (bez mezer), kde kterékoli z polí může být buď prázdné, nebo vyplněno několika molekulami s tečkou ( . ) a další popisy závislé na základním jazyce. Atomy lze dodatečně identifikovat číslem (např. [C:1] ) Pro mapování, například v [CH2:1]=[CH:2][CH:3]=[CH:4][CH2:5][H:6]>>[H:6][CH2:1][CH:2]=[CH:3][CH:4]=[CH2:5] .


Ver el vídeo: Modelos moleculares alcanos (Mayo 2022).