<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Decrypt &#187; MapReduce</title>
	<atom:link href="http://decrypt.ysance.com/tag/mapreduce/feed/" rel="self" type="application/rss+xml" />
	<link>http://decrypt.ysance.com</link>
	<description>Le site de decryptage des technologies de l&#039;informatique</description>
	<lastBuildDate>Fri, 03 Feb 2012 08:25:47 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.3</generator>
		<item>
		<title>Comprendre l&#8217;offre Amazon Web Services en 20 min !</title>
		<link>http://decrypt.ysance.com/2009/08/comprendre-offre-amazon-web-services/</link>
		<comments>http://decrypt.ysance.com/2009/08/comprendre-offre-amazon-web-services/#comments</comments>
		<pubDate>Thu, 13 Aug 2009 14:44:59 +0000</pubDate>
		<dc:creator>Frédéric Faure</dc:creator>
				<category><![CDATA[Cloud Computing]]></category>
		<category><![CDATA[Amazon Web Services]]></category>
		<category><![CDATA[HaaS]]></category>
		<category><![CDATA[MapReduce]]></category>
		<category><![CDATA[Mechanical Turk]]></category>

		<guid isPermaLink="false">http://decrypt.ysance.com/?p=498</guid>
		<description><![CDATA[Voilà un webcast qui a pour objectif de vous aider à comprendre l'offre d'Amazon avec ses AWS (<a title="Site de Amazon" href="http://aws.amazon.com/">Amazon Web Services</a>) et d'en avoir une vision globale. Les AWS proposent un gamme de services riche en fonctionalités, autant au niveau de l'infrastructure (EC2, S3, MapReduce, SimpleDB, SQS, CloudFront) qu'au niveau de besoins sortant de ce scope et plus spécifiques pour certains métiers (FPS, DevPay, Mechanical Turk, AWIS, Alexa Top Sites, FWS), comme la vente en ligne par exemple.

Le Cloud Computing vu par Amazon est promis à un bel avenir. Il s’inscrit en effet dans la démarche en vogue de restructuration des infrastructures et de réduction des coûts. Il rejoint de plus le modèle économique SaaS par ce que l’on pourrait appeler le modèle HaaS (Hardware as a Service). Ce modèle économique s’inscrit dans l’évolution naturelle des architectures vers les SOA (Services Oriented Architecture) et répond aux besoins des consommateurs.

[...]]]></description>
			<content:encoded><![CDATA[<p>Voilà un webcast qui a pour objectif de vous aider à comprendre l&#8217;offre d&#8217;Amazon avec ses AWS (<a title="Site de Amazon" href="http://aws.amazon.com/">Amazon Web Services</a>) et d&#8217;en avoir une vision globale. Les AWS proposent un gamme de services riches en fonctionalités, autant au niveau de l&#8217;infrastructure (EC2, S3, MapReduce, SimpleDB, SQS, CloudFront) qu&#8217;au niveau de besoins sortant de ce scope et plus spécifiques pour certains métiers (FPS, DevPay, Mechanical Turk, AWIS, Alexa Top Sites, FWS), comme la vente en ligne par exemple.</p>
<p>Le Cloud Computing vu par Amazon est promis à un bel avenir. Il s’inscrit en effet dans la démarche en vogue de restructuration des infrastructures et de réduction des coûts. Il rejoint de plus le modèle économique SaaS par ce que l’on pourrait appeler le modèle HaaS (Hardware as a Service). Ce modèle économique s’inscrit dans l’évolution naturelle des architectures vers les SOA (Services Oriented Architecture) et répond aux besoins des consommateurs.</p>
<div id="media"><object id="csSWF" classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="640" height="498" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="src" value="http://www.labdecisionnel.fr/decrypt-content/Web/Ysance-Cloud-Computing-AWS.swf" /><param name="bgcolor" value="#1a1a1a" /><param name="quality" value="best" /><param name="allowScriptAccess" value="always" /><param name="allowFullScreen" value="true" /><param name="scale" value="showall" /><param name="flashVars" value="autostart=false" /><param name="name" value="csSWF" /><param name="flashvars" value="autostart=false" /><param name="allowfullscreen" value="true" /><embed id="csSWF" type="application/x-shockwave-flash" width="640" height="498" src="http://www.labdecisionnel.fr/decrypt-content/Web/Ysance-Cloud-Computing-AWS.swf" flashvars="autostart=false" allowfullscreen="true" allowscriptaccess="always" scale="showall" quality="best" bgcolor="#1a1a1a" name="csSWF"></embed></object></div>
<div class="mceTemp">
<p><img class="size-full wp-image-510" title="Logo AWS" src="http://decrypt.ysance.com/wp-content/uploads/2009/08/logo_aws.gif" alt="Logo AWS" width="164" height="60" /></p>
<p> </p></div>
<div class="mceTemp">Vous pouvez également accéder aux versions <strong>IPhone</strong> et <strong>IPod</strong> de ce webcast :</div>
<p><a href="http://www.labdecisionnel.fr/decrypt-content/IPhone/Ysance-Cloud-Computing-AWS.m4v">Version IPhone</a><br />
<a href="http://www.labdecisionnel.fr/decrypt-content/IPod/Ysance-Cloud-Computing-AWS.m4v">Version IPod</a></p>
<p>Quelques précisions concernant des questions qui m&#8217;ont été posées :</p>
<p><strong><em>Le SLA</em></strong><br />
Chaque service a son propre SLA qu&#8217;il faut bien lire, par exemple pour EC2 le SLA est de 99,95% par région sur une année glissante. Ce que Amazon entend par service inaccessible est que vos instances n&#8217;ont plus d&#8217;accès externe pendant une période de 5 min et que vous êtes incapables d&#8217;en relancer. Cela doit se produire sur plus d&#8217;une zone d&#8217;accessibilté (donc au moins 2) dans laquelle vous avez des instances. Cela veut donc dire que Amazon part déjà du principe que vous avez redondé votre infrastructure sur 2 zones afin de faire de la haute disponibilité.<br />
Il faut donc bien lire et comprendre les termes du SLA par rapport à l&#8217;infrastructure Amazon.<br />
Dans la pratique, je travaille sur une infrastructure non redondée exclusivement sur une zone d&#8217;accessibilité et sur 8 mois d&#8217;utilisation, je n&#8217;ai rencontré un problème d&#8217;accessibilité de quelques minutes qu&#8217;une seule fois. Je n&#8217;ai rien à redire sur le service.</p>
<p><strong><em>La durabilité d&#8217;EBS, EBS/S3 et la fiabilité en général</em></strong><br />
La durabilité des EBS est assurée par réplication réseau dans une zone d&#8217;accessibilité donnée (cela ne sert donc à rien de monter plusieurs EBS dans une zone donnée et de dupliquer les données ;ob Amazon le fait déjà !). Selon Amazon, cela donne une fiabilité de 10 fois supérieure à celle d&#8217;un disque standard dans un data center. Il est vrai que je n&#8217;ai pas rencontré de problème sur 8 mois d&#8217;utilisation avec un parc d&#8217;environ 25 EBS.</p>
<p>Par rapport à S3, la différence est que S3 accroit la durabilité, donc faire un backup de vos EBS par snapshot ou bien en effectuant un dump des données est une très bonne pratique de backup. Aucun problème rencontré avec S3 à ce jour pour ma part. Deux différences entre EBS et S3 : la portée, régionale pour S3 et dans la zone d&#8217;accessibilité pour l&#8217;EBS, et la capacité en I/O optimisée pour l&#8217;EBS. Chaque outil de stockage a son rôle !</p>
<p>Sur une quarantaine d&#8217;EC2, j&#8217;ai perdu 3 instances en 8 mois. Mais comme aucune donnée sensible n&#8217;est stockée dessus et que l&#8217;infrastructure est automatisée (Cf. <a title="Puppet et Capistrano : la clé de l’automatisation" href="http://decrypt.ysance.com/2009/07/automatisation-puppet-capistrano/">Puppet et Capistrano : la clé de l’automatisation</a>), l&#8217;intégration d&#8217;une nouvelle instance, entre la survenue du problème, la détection, la réparation et la reconfiguration des outils de monitoring/backup, n&#8217;a pas excédé une heure. La remise en ligne, elle-même, d&#8217;une nouvelle instance (réparation) n&#8217;a pris que 10 min !</p>
<p>Pour plus d&#8217;info, n&#8217;hésitez pas à consulter les article précédents sur le sujet et notamment <a title="Conception d’une infrastructure sur AWS : best practices !" href="http://decrypt.ysance.com/2009/04/cloud-computing-conception-infrastructure-aws-best-practices/">Conception d’une infrastructure sur AWS : best practices !</a>.</p>
<p><em><strong>MapReduce&#8230; QUID ?</strong></em><br />
Qu&#8217;est ce donc ? Je compare ça à un ETL puisque le but de la manipulation est de partir d&#8217;une source de données, un fichier de logs par exemple, d&#8217;extraire les éléments que nous souhaitons traiter (fonction de mapping) et de les transformer (fonction de réduction) avant de les remettre à diposition sous forme d&#8217;un fichier et de les charger sur S3. Ce qu&#8217;il faut, c&#8217;est écrire ces fonctions de map et de reduce à appliquer sur vos fichiers pour obtenir ce que vous voulez en sortie (des statistiques par exemple). Pour plus d&#8217;infos, <a title="Site de Amazon, rubrique MapReduce" href="http://aws.amazon.com/elasticmapreduce/">MapReduce</a></p>
<p><em><strong>Comment calculer l&#8217;utilisation de son application avec DevPay ?</strong></em><br />
C&#8217;est Amazon qui s&#8217;occupe de calculer l&#8217;utilisation, vous avez juste à définir le coût fixe (one-shot ou mensuel) et le coût variable lié à l&#8217;utilisation (trafic, &#8230;). Et bien sûr mettre à disposition votre application ou votre AMI ! ;ob</p>
<p><em><strong>Mechanical Turk, comment ça marche ?</strong></em><br />
Pour ça je vous invite à regarder le site d&#8217;Amazon, rubrique <a title="Site de Amazon, rubrique Mechanical Turk" href="http://aws.amazon.com/mturk/">Mechanical Turk</a>, qui explique très bien le concept. Mais dans les grandes lignes des personnes souhaitant effectuer ces tâches (tagging d&#8217;images, reconnaissance video, transcription de podcast, traduction, enquêtes d&#8217;opinion, dédoublonage catalogue produits online, &#8230;) se connectent sur le site d&#8217;Amazon, sélectionnent et effectuent les tâches que vous avez proposées via l&#8217;API web service d&#8217;Amazon intégrée dans votre application. L&#8217;intégration de la réponse peut être automatique, ou soumise à validation. La validation peut être effectuée sur plusieurs résultats identiques pour une même tâche distribuée à plusieurs personnes et le paiement découle de votre acceptation ou non du travail résultant en fonction de sa qualité. La personne ayant effectué le travail voit donc ses statistiques d&#8217;acceptation de travail évoluer et donc obtient un indicateur de compétences.</p>
<p><em><strong>Frédéric FAURE</strong></em></p>
]]></content:encoded>
			<wfw:commentRss>http://decrypt.ysance.com/2009/08/comprendre-offre-amazon-web-services/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
	</channel>
</rss>

