Tamirat H et Yohannes T
Pour les organisations orientées vers l'information, la qualité des données est un problème majeur. La nécessité d'associer des données géographiques pour des spécifications de qualité est devenue particulièrement évidente au cours des trente dernières années. Les données sont collectées à partir de diverses sources et stockées dans une base de données. Les différentes origines et qualités des données spatiales numériques sont généralement intégrées dans des environnements SIG, en déterminant un niveau indéfini de précision globale dans de tels systèmes. Cependant, dans le système d'information, des problèmes de qualité des données peuvent survenir n'importe où. L'évaluation des données est un processus utilisé pour déterminer les données inexactes, incomplètes ou déraisonnables, puis pour améliorer la qualité en corrigeant les erreurs et omissions détectées. L'Institut éthiopien de la biodiversité a été créé en 1976, avec pour objectif principal d'assurer la conservation et l'utilisation appropriées de la biodiversité du pays. Dans ce contexte, un ensemble de données a été créé après la compilation des enregistrements d'occurrence (plus de 81 500) dont 8 147 sont des espèces de cultures oléagineuses, obtenues à partir de la base de données de l'institut. La présente étude vise à évaluer la qualité des ensembles de données géospatiales et des enregistrements sur les cultures oléagineuses qui permettent d'accéder aux fonctions de base et avancées pour détecter les problèmes d'exhaustivité et de cohérence ainsi que les erreurs générales dans les enregistrements existants ou dans l'ensemble des enregistrements de conservation de la biodiversité. Pour évaluer l'adéquation à l'utilisation de l'ensemble de données spatiales sur les cultures oléagineuses, des analyses de requêtes d'attributs ont été appliquées. Une approche d'analyse de requête d'attributs d'ensemble de données spatiales a été utilisée pour tester l'importance des différences entre l'étendue attendue et observée de la qualité des données spatiales. Pour comparer les erreurs entre la précision positionnelle et la précision des attributs, une approche d'analyse de requête d'attributs a été utilisée. Les résultats ont montré que 3 357 enregistrements (41,2 %) étaient considérés comme de bonne qualité et que les 4 790 enregistrements restants (58,8 %) de l'ensemble de données étaient erronés pour diverses raisons. En général, cinq groupes de causes d'erreurs pouvant survenir lors de la collecte ou du codage des données ou à toute autre étape ont été trouvés. De tous les enregistrements erronés, les 357 points erronés ont été corrigés à l'aide des méthodes d'analyse de requêtes Arc-GIS avec le support des informations de Google Earth et Diva-GIS et des recommandations ont été données pour une utilisation future.