Hadoop, l'implémentation open source et basée sur Java du framework Map/Reduce de l'Apache Software Foundation, est un framework informatique distribué conçu pour les applications distribuées gourmandes en données. Il fournit les outils nécessaires au traitement de grandes quantités de données à l'aide du framework Map/Reduce et implémente en outre un système de fichiers distribué similaire à celui de Google. Il peut être utilisé pour traiter de grandes quantités de données en parallèle sur de grands clusters de manière fiable et tolérante aux pannes. Depuis longtemps, Java est utilisé par de nombreux programmeurs pour le traitement des données. Dans cet ouvrage, nous avons comparé et analysé les performances de Hadoop avec Java, de Hadoop avec Hadoop Optimize et de Hadoop Optimize avec Java en fonction de différents critères de performance, tels que le traitement (utilisation du CPU), le stockage et l'efficacité lors du traitement des données. Nos résultats expérimentaux montrent une amélioration du temps d'exécution lors de l'utilisation de l'algorithme Map/Reduce optimisé. En comparant Hadoop et Java, Hadoop est plus performant lorsque nous avons un cluster à plusieurs noeuds et que la taille des données est importante. Cependant, lorsque nous avons un seul noeud et une petite taille de données, même Java peut être plus performant.