Des expériences ont été réalisées pour analyser les relations entre les mesures de performance de plusieurs applications MapReduce et les concepts de performance qui représentent le mieux les performances de CCP et de BDA, comme par exemple le temps de traitement du CPU et le comportement temporel. Nous avons constaté que lorsqu`une application est développée dans le modèle de programmation MapReduce à exécuter dans le CCP expérimental, les performances de l`expérience sont déterminées par deux concepts de performance principaux; Comportement temporel et utilisation des ressources. Les résultats de l`analyse de performance montrent que les principales mesures de performance impliquées dans ces concepts sont: temps de traitement, exécution d`emploi et octets de disque dur écrits. Ainsi, ces mesures doivent être prises en compte afin d`améliorer l`exécution de la demande. Parfois, les anomalies et les défauts trouvés dans les plateformes de systèmes de Cloud Computing (CCS) affectent les performances de BDA entraînant une dégradation de l`ensemble du système. Les modèles d`analyse de la performance (PAM) de la BDA en CC devraient proposer un moyen d`identifier et de quantifier le «comportement normal des applications», qui peut servir de base pour détecter et prédire les éventuelles anomalies du logiciel (c.-à-d. les applications dans les plateformes Big Data ) qui peuvent avoir une incidence sur la BDA elle-même. Pour être en mesure de concevoir un tel PAM pour BDA, des méthodes sont nécessaires pour collecter les mesures de base nécessaires propres à la performance, et un cadre de performance doit être utilisé pour déterminer les relations qui existent entre ces mesures. Ce document présente les conclusions de notre recherche, qui propose un modèle d`analyse de la performance pour les grandes applications – PAM pour BDA. Ce modèle d`analyse de performance est basé sur un cadre de mesure pour le CC, qui a été validé par les chercheurs et les praticiens. Ce cadre définit les éléments nécessaires pour mesurer les performances d`un CCS à l`aide de concepts de qualité logicielle. La conception du cadre est basée sur les notions de métrologie, ainsi que sur les aspects de la qualité logicielle directement liés au concept de performance, qui sont abordés dans la norme internationale ISO 25010. “La performance d`un système de Cloud Computing est déterminée par l`analyse des caractéristiques impliquées dans l`exécution d`un service efficace et fiable qui répond aux exigences dans les conditions indiquées et dans les limites maximales des paramètres du système”.

Les chercheurs ont analysé la performance de BDA de divers points de vue. Par exemple, Alexandru [5] analyse les performances du système de Cloud Computing Services for many-Task Computing (MTC). Selon Alexandru, les charges de travail scientifiques exigent souvent des capacités de calcul à haute performance, dans lesquelles la communauté de l`informatique scientifique a commencé à se concentrer sur MTC, cela signifie une exécution à haute performance des applications faiblement couplées comprenant de nombreux Tâches. Au moyen de cette approche, il est possible de demander aux systèmes de fonctionner à des utilisations élevées, comme aux grilles de production actuelles. Alexandru analyse la performance basée sur la prémisse si les nuages actuels peuvent exécuter la charge de travail scientifique basée sur MTC avec des performances similaires et à moindre coût que les systèmes de traitement scientifique actuels. Pour cela, l`auteur se concentre sur les infrastructures en tant que service (IaaS), cela signifie que les fournisseurs sur les clouds publics qui ne sont pas limités au sein d`une entreprise. Dans cette recherche, Alexandru a sélectionné quatre fournisseurs de clouds publics; Amazon EC2, GoGrid, Élastichosts et Mosso dans lequel il est effectué un benchmarking système traditionnel afin de fournir une estimation de premier ordre des performances du système. Alexandru utilise principalement des métriques liées au disque, à la mémoire, au réseau et au CPU pour déterminer les performances grâce à l`analyse des charges de travail MTC qui comprennent des dizaines de milliers de centaines de milliers de tâches.