Résumé :
|
Révolution annoncée de l'ingénierie de la connaissance, permettant de découvrir de nouvelles corrélations, tendances, modèles pertinents au sein des grands entrepôts de données, le data mining (ou fouille de données) promettait de devenir l'outil de veille technologique, stratégique et concurrentielle par excellence, grâce à des logiciels d'analyse toujours plus puissants. Mais ces derniers, mal utilisés, peuvent conduire à des interprétations erronées. Seule une bonne compréhension des mécanismes complexes, au carrefour de l'algorithmique et de la statistique, qui sous-tendent ces logiciels permet de les utiliser efficacement et de transformer une masse de données en connaissance, c'est-à-dire en information utile et mobilisable. Mêlant la théorie et la pratique au travers d'exemples concrets, abondamment illustré, ce livre propose une méthodologie claire du data mining en expliquant ses concepts et techniques : classification et re-engénierie de données, exploration et prédiction, arbres de décision, réseaux de neurones et de Kohonen, logique et règles associatives, structures hiérarchiques par mots-clés, évaluation de profils de recherche et de modèles de données, etc. Le cédérom compagnon de cet ouvrage inclus une version test du logiciel Clémentine de SPSS, la solution de data mining la plus vendue dans le monde.
|