Revista de Matemática: Teoría y Aplicaciones ISSN Impreso: 1409-2433 ISSN electrónico: 2215-3373

OAI: https://revistas.ucr.ac.cr/index.php/matematica/oai
Generación de reglas estadísticas a partir de grandes bases de datos
PDF

Cómo citar

Schektman, Y., Trejos Zelaya, J., & Troupé, M. (1994). Generación de reglas estadísticas a partir de grandes bases de datos. Revista De Matemática: Teoría Y Aplicaciones, 1(1), 87–100. https://doi.org/10.15517/rmta.v1i1.106

Resumen

Dado un conjunto de variables cualitativas, queremos predecir una o varias de ellas mediante reglas. Proponemos un algoritmo que (i) es guiado por resultados estadísticos en el marco de una geometría relacional, dentro de la cual se utilizan índices de asociación disimétricos, y (ii) efectúa aproximaciones estadísticas y euclidianas. El método iterativo propuesto puede obtener muchas reglas sin tener que introducir a priori sus premisas en el conjunto de conjunciones explicativas que el generador analiza en cada etapa. El algoritmo es de complejidad lineal respecto al número de individuos, por lo que sería particularmente bien adaptado a las grandes bases de datos. Se presentan resultados sobre ejemplos de datos.

Palabras clave: reglas de producción, asociación disimétrica, adquisición de conocimientos, distancia relacional, número equivalente.

https://doi.org/10.15517/rmta.v1i1.106
PDF

Citas

Abdesselam, R.; Schektman, Y. (1989) Dissymetrical association analysis between two qualitative variables. En: Data Analysis, Learning Symbolic and Numeric Knowledge, E. Diday (ed.), Nova Science –INRIA, New York, 39-46.

Cohen, P.R.; Feigenbaum, E.A. (1982) The Handbook of Artificial Intelligence, Vol. III. Pitman, London.

Croquette, A. (1980) Quelques résultats synthétiques en analyse des données multidimensionnelles. Optimalité et métriques à effets relationnels. Tesis de 3er ciclo, Universidad Paul Sabatier, Toulouse.

Der Megreditchian, G. (1979) L’optimisation des réseaux d’observation des champs météorologiques. La Météorologie, VI, n°17, Paris.

Grau, D. (1983) Mesure des effets relationnels. Tesis de 3er ciclo, Universidad Paul Sabatier, Toulouse.

Hammad, A; Jockin, J.; Sadeg, B.; Schektman, Y.; Vielle, D. (1987) Bibliothèque Mathématique pour l’Analyse des Données (BMAD). En: Data Analysis and Informatics, E. Didayet al.(eds.), INRIA,North-Holland, Amsterdam, 5-13.

Ibrahim, A.; Schektman, Y. (1984) Analyse en partitions principales. Algorithme et exemples. Journées de Classification, La Grande–Motte, Publ. CNET, 61-89.

Kodratoff, Y; Diday, E. (1991) Induction symbolique et numérique à partir de données. Cépaduès-Editions, Toulouse.

Labrèche, S.; Schektman, Y.; Trejos, J.; Troup é, M. (1992) Les distances relationnelles: deux applications récentes. Actes de Distancia’92; S. Joly, G. Le Calvé (eds.), Rennes, 369-372.

Ralambondrainy, H. (1987) GENREG un générateur de règles combinant techniques d’apprentissage ettechniques d’Analyse des Données. En: Actes des I Journées Symbolique–Numérique, Universidad Paris IX - Dauphine, 40-44.

Schektman, Y. (1978) Contribution `a la mesure en facteurs dans les sciences expérimentales et à lamise en œuvre automatique dans les calculs statistiques. Tesis de Estado, Universidad Paul Sabatier,Toulouse.

Schektman, Y. (1987) A general euclidean approach for measuring and describing associations between several sets of variables. En: Recent Developments in Clustering and Data Analysis. Proc. of the 1st French-Japanese Sem., Inst. Stat., Tokyo, 37-48.

Schektman, Y. (1989) Euclidean approach and statistical approximations for generating weighted knowledge rules from large sets of data. En: Klassifikation und Ordnung, Gesellschaft für Klassifikation,Indeks-Verlag, Frankfurt, 328-330.

Schektman, Y; Trejos, J.; Troupé, M. (1992) Un générateur de règles floues à partir de bases de données volumineuses. En: Actes des III Journées Symbolique–Numérique, Universidad Paris IX - Dauphine, 121-130.

Schektman, Y; Trejos, J; Troupé, M. (1992)Une approche relationnelle en prédiction par générationde règles en présence de bases de données volumineuses. En: Actes des XXIV Journées de Statistique, ASU, Bruxelles, 441-443.

Sebag, M. (1991) it Une approche symbolique-numérique pour la discrimination à partir d’exemples et de règles: l’apprentisage multicouches. Tesis doctoral, Universidad Paris IX-Dauphine.

Thanh Huyen, T.T.; Bao, H.T. (1991) A method for generating rules from examples and its application. En: Symbolic–Numeric Data Analysis and Learning; E. Diday, Y. Lechevallier (eds.), Nova Science –INRIA, New York, 493-504.

Trejos, J.; Troupé, M. (1993) Generating statistical rules for large volumes of data. En: Proceedings First Panamerican Workshop in Applied and Computational Mathematics, Caracas, Venezuela, pp.1.25-1.26.

Trejos, J. (1994) Contribution à l’acquisition automatique de connaisances à partir de données qualitatives. Tesis doctoral, Universidad Paul Sabatier, Toulouse.

Troupé, M. (1994) Contribution à la protection de la régression multiple multidimensionnelle et à la génération de règles prévisionnelles. Tesis doctoral, Universidad Paul Sabatier, Toulouse.

Comentarios

Descargas

Los datos de descargas todavía no están disponibles.