Resumen

El trabajo en conjunto de disciplinas como la Informática y la Lingüística ha resultado en la innovación de herramientas tecnológicas de búsqueda, selección y organización de la información escrita que se encuentra en internet. El objetivo de este artículo es realizar un aporte desde la Ingeniería Lingüística por medio de una herramienta que genere definiciones automáticamente a partir de información conceptual, contextos de uso y patrones lingüísticos.  La posibilidad de extraer información de un corpus con marcas que indiquen si es información académica, coloquial o de otro orden, permite clasificar sus contextos definitorios y generar automáticamente diferentes tipos de diccionarios y glosarios dirigidos a diferentes audiencias y con diferentes propósitos. Este trabajo nace gracias al apoyo durante la creación de una herramienta metodológica que selecciona la información necesaria para la conformación de un corpus textual recopilado de Internet, que tiene como resultado la confección de un diccionario especializado de la sexualidad para el grupo de escolares mexicanos. Con esto, se pretende crear nuevos documentos que motiven un impacto en la reducción de enfermedades de transmisión sexual, embarazos no deseados y violencia sexual en este segmento de la población.

Palabras clave: Ingeniería lingüística, generación de definiciones, corpues textuales, diccionario, glosario