Abstract
Given a set of categorical variables, we want to predict one or more of them by the way rules. We propose an algorithm that (i) is guided by statistical results in a relational geometry where we use assymetrical association indices, and (ii) makes statistical and euclidian approximations. The iterative method we propose can obtain rules without introducing a priori their premises in the set of independent conjonctions analized by the generator at each step. The algorithm has a linear complexity with regard to the number of individual; this property makes it suitable for large data sets. We present results over data examples.
References
Abdesselam, R.; Schektman, Y. (1989) Dissymetrical association analysis between two qualitative variables. En: Data Analysis, Learning Symbolic and Numeric Knowledge, E. Diday (ed.), Nova Science –INRIA, New York, 39-46.
Cohen, P.R.; Feigenbaum, E.A. (1982) The Handbook of Artificial Intelligence, Vol. III. Pitman, London.
Croquette, A. (1980) Quelques résultats synthétiques en analyse des données multidimensionnelles. Optimalité et métriques à effets relationnels. Tesis de 3er ciclo, Universidad Paul Sabatier, Toulouse.
Der Megreditchian, G. (1979) L’optimisation des réseaux d’observation des champs météorologiques. La Météorologie, VI, n°17, Paris.
Grau, D. (1983) Mesure des effets relationnels. Tesis de 3er ciclo, Universidad Paul Sabatier, Toulouse.
Hammad, A; Jockin, J.; Sadeg, B.; Schektman, Y.; Vielle, D. (1987) Bibliothèque Mathématique pour l’Analyse des Données (BMAD). En: Data Analysis and Informatics, E. Didayet al.(eds.), INRIA,North-Holland, Amsterdam, 5-13.
Ibrahim, A.; Schektman, Y. (1984) Analyse en partitions principales. Algorithme et exemples. Journées de Classification, La Grande–Motte, Publ. CNET, 61-89.
Kodratoff, Y; Diday, E. (1991) Induction symbolique et numérique à partir de données. Cépaduès-Editions, Toulouse.
Labrèche, S.; Schektman, Y.; Trejos, J.; Troup é, M. (1992) Les distances relationnelles: deux applications récentes. Actes de Distancia’92; S. Joly, G. Le Calvé (eds.), Rennes, 369-372.
Ralambondrainy, H. (1987) GENREG un générateur de règles combinant techniques d’apprentissage ettechniques d’Analyse des Données. En: Actes des I Journées Symbolique–Numérique, Universidad Paris IX - Dauphine, 40-44.
Schektman, Y. (1978) Contribution `a la mesure en facteurs dans les sciences expérimentales et à lamise en œuvre automatique dans les calculs statistiques. Tesis de Estado, Universidad Paul Sabatier,Toulouse.
Schektman, Y. (1987) A general euclidean approach for measuring and describing associations between several sets of variables. En: Recent Developments in Clustering and Data Analysis. Proc. of the 1st French-Japanese Sem., Inst. Stat., Tokyo, 37-48.
Schektman, Y. (1989) Euclidean approach and statistical approximations for generating weighted knowledge rules from large sets of data. En: Klassifikation und Ordnung, Gesellschaft für Klassifikation,Indeks-Verlag, Frankfurt, 328-330.
Schektman, Y; Trejos, J.; Troupé, M. (1992) Un générateur de règles floues à partir de bases de données volumineuses. En: Actes des III Journées Symbolique–Numérique, Universidad Paris IX - Dauphine, 121-130.
Schektman, Y; Trejos, J; Troupé, M. (1992)Une approche relationnelle en prédiction par générationde règles en présence de bases de données volumineuses. En: Actes des XXIV Journées de Statistique, ASU, Bruxelles, 441-443.
Sebag, M. (1991) it Une approche symbolique-numérique pour la discrimination à partir d’exemples et de règles: l’apprentisage multicouches. Tesis doctoral, Universidad Paris IX-Dauphine.
Thanh Huyen, T.T.; Bao, H.T. (1991) A method for generating rules from examples and its application. En: Symbolic–Numeric Data Analysis and Learning; E. Diday, Y. Lechevallier (eds.), Nova Science –INRIA, New York, 493-504.
Trejos, J.; Troupé, M. (1993) Generating statistical rules for large volumes of data. En: Proceedings First Panamerican Workshop in Applied and Computational Mathematics, Caracas, Venezuela, pp.1.25-1.26.
Trejos, J. (1994) Contribution à l’acquisition automatique de connaisances à partir de données qualitatives. Tesis doctoral, Universidad Paul Sabatier, Toulouse.
Troupé, M. (1994) Contribution à la protection de la régression multiple multidimensionnelle et à la génération de règles prévisionnelles. Tesis doctoral, Universidad Paul Sabatier, Toulouse.