Adam Mohamed Ali Fadlalla
L'exploration de données est le processus d'identification de modèles valides, nouveaux, utiles et compréhensibles dans les données et l'extraction ou la découverte de résumés utiles de modèles de données ou de connaissances à partir d'une énorme quantité de données et également appelé découverte de connaissances KDD dans les bases de données. Un processus KDD comprend le nettoyage des données, l'exploration de données, la sélection des données, la transformation, l'intégration des données, l'évaluation des modèles et la présentation des connaissances. Il s'agit d'une croissance explosive des données, des téraoctets aux pétaoctets. La confluence de multiples disciplines comprend l'apprentissage automatique, les statistiques, l'intelligence artificielle, la visualisation, le calcul haute performance, la technologie des bases de données, les algorithmes, la reconnaissance de formes. Ses applications comprennent l'analyse des données biologiques et médicales : classification, analyse de cluster et analyse de données de microarray, exploration du Web