<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>visualization &#8211; Smals Research</title>
	<atom:link href="https://www.smalsresearch.be/tag/visualization/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.smalsresearch.be</link>
	<description></description>
	<lastBuildDate>Thu, 09 Apr 2026 12:19:00 +0000</lastBuildDate>
	<language>en-GB</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://www.smalsresearch.be/wp-content/uploads/2026/01/cropped-cropped-Smals_Research-32x32.png</url>
	<title>visualization &#8211; Smals Research</title>
	<link>https://www.smalsresearch.be</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Comment mentir avec un graphique</title>
		<link>https://www.smalsresearch.be/comment-mentir-avec-un-graphique/</link>
					<comments>https://www.smalsresearch.be/comment-mentir-avec-un-graphique/#comments</comments>
		
		<dc:creator><![CDATA[Vandy Berten]]></dc:creator>
		<pubDate>Wed, 15 Jul 2015 07:36:19 +0000</pubDate>
				<category><![CDATA[Blog post]]></category>
		<category><![CDATA[analytics]]></category>
		<category><![CDATA[big data]]></category>
		<category><![CDATA[Information management]]></category>
		<category><![CDATA[statistics]]></category>
		<category><![CDATA[visualization]]></category>
		<guid isPermaLink="false">/?p=8701</guid>

					<description><![CDATA[Lorsqu&#8217;il s&#8217;agit de communiquer des chiffres, qu&#8217;ils soient financiers, électoraux, démographiques, sportifs, scientifiques ou bien d&#8217;autres choses encore, tout le monde s&#8217;accordera pour dire qu&#8217;il n&#8217;y a rien de mieux qu&#8217;un graphique. Il est aujourd&#8217;hui difficile de trouver un journal qui ne contienne pas au moins une infographie ou un rapport d&#8217;activité quelconque qui ne [&#8230;]]]></description>
										<content:encoded><![CDATA[<p style="text-align: justify;">Lorsqu&#8217;il s&#8217;agit de communiquer des chiffres, qu&#8217;ils soient financiers, électoraux, démographiques, sportifs, scientifiques ou bien d&#8217;autres choses encore, tout le monde s&#8217;accordera pour dire qu&#8217;il n&#8217;y a rien de mieux qu&#8217;un graphique. Il est aujourd&#8217;hui difficile de trouver un journal qui ne contienne pas au moins une infographie ou un rapport d&#8217;activité quelconque qui ne soit pas truffé d&#8217;histogrammes et autres graphiques en &#8220;tarte&#8221; (<em>pie chart</em> en anglais). Et bien que la plupart des graphiques choisis soient particulièrement élémentaires &#8211; on trouve rarement autre chose qu&#8217;un graphique en ligne, un histogramme ou un graphique en tarte -, ils sont souvent mal utilisés. On voit souvent un graphique en ligne là où on aurait du voir un histogramme, certes, mais ça n&#8217;est pas le sujet de cet article. Très souvent, la réalité est tronquée, par malhonnêteté ou par ignorance, induisant une perception exagérée de ce que l&#8217;auteur veut mettre en avant. Voici quelques exemples glanés au fil de nos recherches, illustrant comment l&#8217;on essaye chaque jour de nous tromper.</p>
<h2 style="text-align: justify;">Lie factor</h2>
<p style="text-align: justify;">De façon à pouvoir mesurer de façon formelle à quel point un graphique est une distorsion de la réalité (ou en tout cas des valeurs numériques que le graphique tente d&#8217;illustrer), Edward Tufte, auteur majeur dans le domaine de la visualisation de l&#8217;information (&#8220;<a href="https://www.edwardtufte.com/tufte/books_vdqi" target="_blank" rel="noopener noreferrer">The Visual Display of Quantative Information</a>&#8220;), a défini le concept de &#8220;<em>lie factor</em>&#8221; (que l&#8217;on pourrait traduire par facteur de mensonge) de la façon suivante&nbsp;:</p>
<p style="text-align: center;">$$\text{lie factor} = \frac{\text{taille de l&#8217;effet dans le graphique}}{\text{taille de l&#8217;effet dans les donnees}}$$</p>
<p style="text-align: left;">où</p>
<p style="text-align: center;">$$\text{taille de l&#8217;effet} = \frac{| \text{seconde valeur} &#8211; \text{premiere valeur}|}{\text{premiere valeur}}$$</p>
<p style="text-align: justify;">Un &#8220;lie factor&#8221; de 1 indique donc qu&#8217;il n&#8217;y a pas de distorsion. Tufte estime que ce facteur doit rester entre 0.95 et 1.05 pour assurer l&#8217;intégrité de la visualisation.<sup><a href="#note1">1</a></sup></p>
<p style="text-align: justify;">Par exemple, supposons que l&#8217;on veut indiquer dans un diagramme en bâtons (<em>bar chart) </em>qu&#8217;un produit A a été deux fois plus vendu qu&#8217;un produit B, il faut que la barre représentant A soit deux fois plus longue que celle représentant B. Cela peut paraître naturel&#8230; nous verrons dans les exemples qui suivent que c&#8217;est loin d&#8217;être toujours le cas&nbsp;!</p>
<h2 style="text-align: justify;">Tronquer l&#8217;axe des ordonnées</h2>
<p style="text-align: justify;">Un des exemples de distorsion les plus fréquents est l&#8217;utilisation de diagramme en bâtons (<em>bar chart) </em>ou en ligne (<em>line chart)</em>, représentant en ordonnée des quantités, et démarrant l&#8217;axe à une autre valeur que zéro.<br />
<a href="/wp-content/uploads/2015/06/SNCB.png"><img decoding="async" class="alignright wp-image-8703 size-medium" src="/wp-content/uploads/2015/06/SNCB-secu-300x97.png" alt="SNCB-secu" width="300" height="97" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/06/SNCB-secu-300x97.png 300w, https://www.smalsresearch.be/wp-content/uploads/2015/06/SNCB-secu.png 360w" sizes="(max-width: 300px) 100vw, 300px" /></a>Prenons par exemple l&#8217;illustration ci-contre, issue d&#8217;une infographie de la SNCB, parue dans le journal Métro du mercredi 10 juin 2015. On y montre la baisse du nombre de dépassements de signaux entre 2010 et 2014. Ils sont passés de 110 à 64, soit une baisse de <strong>41.8 %</strong> ((110-64)/110). Par contre, visuellement, grâce au/à cause du fait que l&#8217;axe vertical démarre à 40 et non en zéro, la baisse est de 70 (110-40) à 24, soit <strong>65.7 %</strong>. Notre cerveau enregistre une baisse drastique de quasiment un facteur 3. On a donc un <em>lie factor </em>de 65.7/41.8, soit <strong>1.54</strong>. L&#8217;effet visuel est dès lors 54% plus important que les données à représenter <sup><a href="#note2">2</a></sup>. <a href="/wp-content/uploads/2015/06/SNCB-secu-corr.png"><img decoding="async" class=" size-medium wp-image-8704 alignleft" src="/wp-content/uploads/2015/06/SNCB-secu-corr-300x104.png" alt="SNCB-secu-corr" width="300" height="104" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/06/SNCB-secu-corr-300x104.png 300w, https://www.smalsresearch.be/wp-content/uploads/2015/06/SNCB-secu-corr.png 358w" sizes="(max-width: 300px) 100vw, 300px" /></a>Une version &#8220;corrigée&#8221; du graphique vous est présentée ci-contre. La diminution semble nettement moins impressionnante&nbsp;!</p>
<p style="text-align: justify;">En cliquant sur l&#8217;illustration ci-dessus, vous apercevrez dans la même infographie trois diagrammes utilisant le même stratagème pour vanter la société, dont un avec un <em>lie factor</em> de 20.6 !</p>
<p style="text-align: justify;">L&#8217;exemple suivant a été emprunté <a href="https://www.parti-socialiste.fr/articles/la-droite-est-responsable-de-lexplosion-de-la-dette-publique" target="_blank" rel="noopener noreferrer">au parti socialiste français</a>. <a href="/wp-content/uploads/2015/06/PS-dette.png"><img fetchpriority="high" decoding="async" class="alignright wp-image-8706" src="/wp-content/uploads/2015/06/PS-dette-300x225.png" alt="PS-dette" width="400" height="300" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/06/PS-dette-300x225.png 300w, https://www.smalsresearch.be/wp-content/uploads/2015/06/PS-dette.png 640w" sizes="(max-width: 400px) 100vw, 400px" /></a>Il met en avant une épouvantable évolution de la dette lorsque la droite s&#8217;est trouvée au pouvoir entre 2002 et 2009. Première chose intéressante à constater&nbsp;: alors qu&#8217;en général on représente la base d&#8217;un diagramme en bâtons en bas, les &#8220;communicants&#8221; du PS ont choisi ici de l&#8217;inverser. On observe donc une &#8220;montée&#8221; (quelque chose d&#8217;intuitivement positif) pour la gauche, et une &#8220;baisse&#8221; pour la droite (intuitivement négative).</p>
<p style="text-align: justify;">Mais ce qui est plus important est de remarquer que l&#8217;axe vertical débute à 50 %. Alors que visuellement la dette semble avoir enregistré une progression de 317% entre la fin de la dernière valeur associée à la gauche et la dernière de la droite, elle n&#8217;a en fait crû que de +/- 57 % à 75 %, soit une progression de 33.9% (18% = 33.9% de 57%), et donc un <em>lie factor</em> de 317/33.9 = <strong>9.3</strong>. On a donc une progression visuelle plus de neuf fois plus importante que la réalité&nbsp;! Ce facteur serait plus bas si l&#8217;on considérait plutôt les valeurs moyennes de partie gauche et droite (au lieu, comme nous l&#8217;avons fait, du minimum pour l&#8217;un et du maximum pour l&#8217;autre), mais il en restera largement supérieur à 1.</p>
<p style="text-align: justify;">Notons que cette règle, unanimement reconnue par la communauté scientifique s&#8217;intéressant à la visualisation de l&#8217;information et voulant que l&#8217;axe vertical d&#8217;un graphique doit toujours commencer à zéro, s&#8217;applique uniquement pour des valeurs pour lesquelles le zéro à une valeur intrinsèque, et signifie l&#8217;absence de quantité. Ce sont des valeurs pour lesquelles dire &#8220;deux fois plus grand&#8221; a un sens&nbsp;: 10 €, c&#8217;est bien deux fois plus que 5 €, 50 articles (identiques), c&#8217;est bien la moitié de 100 articles. Par ailleurs, cela ne dépend pas des unités utilisées&nbsp;: deux fois plus cher, c&#8217;est la même chose en euros ou en dollars, deux fois plus long, ça ne change rien que l&#8217;on s&#8217;exprime en mètres ou en pieds.</p>
<p style="text-align: justify;">Il n&#8217;en ira pas de même lorsque la mesure que l&#8217;on considère a un zéro tout à fait arbitraire, comme ça l&#8217;est pour la température ou l&#8217;heure. On ne peut pas dire que quand il fait 20 °C, c&#8217;est deux fois plus chaud que 10 °C, ni que 10 heures du matin, c&#8217;est deux fois plus tard que 5 heures (on parle ici bien d&#8217;heure, et pas de durée). Minuit, ou 0 °C, ça n&#8217;est en rien l&#8217;absence d&#8217;heure ou de température ; ces valeurs sont choisies de façon conventionnelle. Minuit à Bruxelles ne correspond pas à minuit à New-York et 0 °C n&#8217;est pas la même température que 0 °F ou 0 °K. Étant donné qu&#8217;un graphique représentant une température au cours du temps ne représentera jamais un ratio ou une variation relative (qui ne serait par ailleurs pas la même si l&#8217;on s&#8217;exprimait en degrés Centigrades ou Fahrenheit) mais bien une variation absolue, l&#8217;origine de l&#8217;axe n&#8217;a pas d&#8217;importance. On évitera alors l&#8217;utilisation de diagrammes en bâtons (mettant en avant des longueurs) pour préférer une graphique en ligne (mettant en avant des positions).</p>
<h2 style="text-align: justify;">Confondre surface et taille</h2>
<p style="text-align: justify;">Visuellement parlant, notre cerveau considère qu&#8217;un cercle (ou tout autre forme) est deux fois plus grand qu&#8217;un autre si sa <strong>surface</strong> est deux fois supérieure (et non son diamètre). Or on voit souvent des infographies dans lesquelles les diamètres sont proportionnels aux valeurs à représenter. Ce qui implique une relation quadratique entre ce que l&#8217;on voit et ce que l&#8217;on devrait voir&nbsp;: un ratio de 3 impliquera une surface 9 fois plus importante. Par ailleurs, il a été montré que le cerveau humain (entre autre par Jacques Bertin, dans son ouvrage &#8220;<a href="https://fr.wikipedia.org/wiki/S%C3%A9miologie_graphique">Sémiologie Graphique</a>&#8220;, ou par Stanley Smith Stevens, dans sa &#8220;<a href="https://en.wikipedia.org/wiki/Stevens'_power_law">Psychophysical Power Law</a>&#8220;) distingue moins précisément une différence entre deux surfaces qu&#8217;entre deux longueurs.</p>
<p style="text-align: justify;"><a href="/wp-content/uploads/2015/06/SundayStarTimes.png"><img loading="lazy" decoding="async" class="alignleft wp-image-8707" src="/wp-content/uploads/2015/06/SundayStarTimes.png" alt="SundayStarTimes" width="350" height="407" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/06/SundayStarTimes.png 500w, https://www.smalsresearch.be/wp-content/uploads/2015/06/SundayStarTimes-258x300.png 258w" sizes="auto, (max-width: 350px) 100vw, 350px" /></a>Lorsque l&#8217;on mélange ces deux sources de confusions, on arrive à une infographie telle que celle présentée dans le &#8220;Sunday Star Times&#8221; du 12 février 2012 (reprise sur <a href="https://www.statschat.org.nz/2012/02/13/more-bubble-charts-your-feedback-please/" target="_blank" rel="noopener noreferrer">www.statschart.org.nz</a>). Outre le fait qu&#8217;il existe des façons plus adaptées de représenter l&#8217;évolution de deux mesures dans le temps, on voit par exemple que le petit cercle orange de 2009 (14 %) a une surface 5.5 plus petite que le cercle dans lequel il est inscrit (33 %), soit une augmentation de surface de 450%, pour représenter en réalité une augmentation de 135% (14% -&gt; 33%). Cela nous donne donc un <em>lie factor</em> de <strong>3.32</strong>. Étant la relation quadratique entre diamètre et surface d&#8217;un cercle, le <em>lie factor</em> sera en fait différent pour chacun des graphiques (et d&#8217;autant plus important que le ratio dans les données est important). Le fait qu&#8217;un cercle soit placé devant l&#8217;autre est également trompeur&nbsp;: dans le premier item de la seconde infographie, la partie rouge est à peine visible, alors qu&#8217;elle représente une quantité supérieure à la partie bleue.</p>
<h2 style="text-align: justify;">Jouer avec les perspectives</h2>
<p style="text-align: justify;">Un outil comme Excel vous permet &#8211; pour ne pas dire vous y incite &#8211; de rajouter des effets de perspective à vos graphiques. Si le résultat peut être visuellement élégant, il sera bon de s&#8217;en servir avec parcimonie, car il est particulièrement trompeur. <a href="/wp-content/uploads/2015/06/Apple.jpg"><img loading="lazy" decoding="async" class="alignright size-medium wp-image-8708" src="/wp-content/uploads/2015/06/Apple-300x199.jpg" alt="Apple" width="300" height="199" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/06/Apple-300x199.jpg 300w, https://www.smalsresearch.be/wp-content/uploads/2015/06/Apple.jpg 440w" sizes="auto, (max-width: 300px) 100vw, 300px" /></a>Prenons l&#8217;exemple d&#8217;un graphique en tarte&nbsp;: non seulement les segments qui apparaîtront du côté du lecteur seront augmentés d&#8217;une &#8220;tranche&#8221; que n&#8217;auront pas les segments opposés, mais par ailleurs la perspective diminuera la surface les segments les plus éloignés. Dans l&#8217;exemple ci-contre, on peut voir Steve Jobs, en pleine &#8220;Keynote&#8221;, présentant la répartition du marché des principaux vendeurs de smartphones. Apple (19.5 %), en vert, occupe une surface à l&#8217;écran 1.8 fois supérieure à celle occupée par le segment &#8220;Autres&#8221; (21.2 %), en violet&nbsp;!<a href="/wp-content/uploads/2015/06/Apple2.jpg"><img loading="lazy" decoding="async" class=" size-full wp-image-8709 alignleft" src="/wp-content/uploads/2015/06/Apple2.jpg" alt="Apple2" width="191" height="179" /></a> On a donc, pour la comparaison entre ces deux éléments, un <em>lie factor</em> proche de 10 ! Pour mieux visualiser la &#8220;tromperie&#8221;, voici ci-contre une version du graphique dans lequel on superpose le segment violet des 21.2 % à celui, vert, des 19.5 %. En théorie, le vert devrait donc avoir complètement disparu. Jugez-en par vous-même&#8230;</p>
<h2 style="text-align: justify;">Ignorer les conventions</h2>
<p style="text-align: justify;">Les graphiques standards se basent en général sur certaines conventions tacites, en principe naturelles. Par exemple, la somme des segments d&#8217;un graphique en tarte doit atteindre 100 %. <a href="/wp-content/uploads/2015/06/PresidentialRun.png"><img loading="lazy" decoding="async" class="alignright size-medium wp-image-8711" src="/wp-content/uploads/2015/06/PresidentialRun-300x225.png" alt="PresidentialRun" width="300" height="225" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/06/PresidentialRun-300x225.png 300w, https://www.smalsresearch.be/wp-content/uploads/2015/06/PresidentialRun.png 636w" sizes="auto, (max-width: 300px) 100vw, 300px" /></a>Ce n&#8217;est pas exactement ce qu&#8217;a choisi de faire la chaîne américaine Fox pour diffuser ce graphique au moment des présidentielles américaines de 2012. Outre le fait que, dû à l&#8217;effet de perspective détaillé ci-dessus, le segment de Romney (60 %) est largement plus grand que celui de Palin (70 %), engendrant un <em>lie factor</em> de 3.7, la somme des segments monte à 193 %&nbsp;!  Il est probable qu&#8217;en l&#8217;occurrence, les sondés pouvaient donner deux choix, mais il faut reconnaître que ce graphique peut laisser perplexe&nbsp;!</p>
<h2 style="text-align: justify;">Utiliser des valeurs cumulatives</h2>
<p style="text-align: justify;">Une excellente façon de masquer une baisse des ventes ou des revenus est d&#8217;utiliser des valeurs <em>cumulatives</em>. <a href="/wp-content/uploads/2015/06/iphone-sales.jpg"><img loading="lazy" decoding="async" class="alignright size-medium wp-image-8712" src="/wp-content/uploads/2015/06/iphone-sales-300x200.jpg" alt="iphone-sales" width="300" height="200" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/06/iphone-sales-300x200.jpg 300w, https://www.smalsresearch.be/wp-content/uploads/2015/06/iphone-sales-768x512.jpg 768w, https://www.smalsresearch.be/wp-content/uploads/2015/06/iphone-sales.jpg 1020w" sizes="auto, (max-width: 300px) 100vw, 300px" /></a>Elles ont l&#8217;avantage d&#8217;être, par définition, toujours croissantes. C&#8217;est par exemple ce qu&#8217;a choisi de faire Tim Cook lors de la Keynote de présentation de l&#8217;iPhone 5S. Il est en effet difficile de voir si, par exemple, la pente (c&#8217;est-à-dire le nombre d&#8217;unités vendues par quadrimestre) est plus forte début 2011 ou fin 2013 avec le graphique présenté ci-contre (sans compter sur le fait qu&#8217;on semble avoir &#8220;oublié&#8221; de préciser l&#8217;échelle de l&#8217;axe vertical). Sur la seconde image, <a href="https://qz.com/122921/the-chart-tim-cook-doesnt-want-you-to-see/" target="_blank" rel="noopener noreferrer">David Yanofsky a réintroduit dans le graphique les données non cumulées.</a> <a href="/wp-content/uploads/2015/06/iphone-sales2.png"><img loading="lazy" decoding="async" class="alignleft wp-image-8713" src="/wp-content/uploads/2015/06/iphone-sales2-300x182.png" alt="iphone-sales2" width="400" height="243" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/06/iphone-sales2-300x182.png 300w, https://www.smalsresearch.be/wp-content/uploads/2015/06/iphone-sales2-768x467.png 768w, https://www.smalsresearch.be/wp-content/uploads/2015/06/iphone-sales2.png 1020w" sizes="auto, (max-width: 400px) 100vw, 400px" /></a>Et là, surprise&nbsp;: alors que le graphique de Tim Cook suggère une augmentation explosive et continue, on s&#8217;aperçoit que les résultats ont plutôt tendance à se tasser.</p>
<h2 style="text-align: justify;">Tromper les intuitions</h2>
<p style="text-align: justify;"><a href="/wp-content/uploads/2015/06/Obamasbikini.png"><img loading="lazy" decoding="async" class="alignright wp-image-8714" src="/wp-content/uploads/2015/06/Obamasbikini-300x175.png" alt="Obamasbikini" width="400" height="233" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/06/Obamasbikini-300x175.png 300w, https://www.smalsresearch.be/wp-content/uploads/2015/06/Obamasbikini-768x448.png 768w, https://www.smalsresearch.be/wp-content/uploads/2015/06/Obamasbikini.png 900w" sizes="auto, (max-width: 400px) 100vw, 400px" /></a>Lorsque l&#8217;on voit un diagramme, on pense en général intuitivement qu&#8217;il représente une quantité (en fonction du temps, d&#8217;une catégorie&#8230;). Mais il peut aussi représenter une <em>variation</em>. C&#8217;est cette source de confusion qui a été utilisée par l&#8217;équipe d&#8217;Obama lors de sa seconde campagne en 2010, où on représente les &#8220;job loss&#8221; sous Bush (en rouge) puis sous Obama (en bleu). On a donc affaire à un problème exactement inverse à celui présenté juste ci-dessus.</p>
<p style="text-align: justify;">On peut d&#8217;abord remarquer trois stratagèmes simples utilisés dans ce graphique pour accentuer le point de vue de l&#8217;auteur. Le premier a déjà été présenté avec l&#8217;exemple du parti socialiste français ci-dessus, et consiste à &#8220;retourner&#8221; le diagramme en bâton. On a donc quelque chose en décroissance sous l&#8217;administration Bush, qui accentue l&#8217;aspect dramatique, et en croissance sous celle d&#8217;Obama, pour accentuer le sentiment de progrès et de rétablissement. Par ailleurs, on voit un bleu clair, lumineux, pour la partie d&#8217;Obama et un rouge foncé, sombre pour celle de Bush. Ce n&#8217;est certainement pas innocent. Enfin, la légende indique le graphique va de 2007 à 2010. Si l&#8217;on ne fait pas attention aux mois, on pourrait penser que le graphique couvre 3, voire 4 ans, et qu&#8217;il s&#8217;agit donc d&#8217;une progression durable. Or le graphique concerne essentiellement 2008 et 2009 (décembre 2007-janvier 2010), soit à peine plus de deux ans.</p>
<p style="text-align: justify;">Si l&#8217;on regarde ce graphique, qui concerne l&#8217;emploi aux États-Unis, on a l&#8217;impression d&#8217;une situation qui s&#8217;est terriblement détériorée durant le mandat de Bush, et qu&#8217;Obama est parvenu à rétablir. <a href="/wp-content/uploads/2015/06/Obamasbikini-2.png"><img loading="lazy" decoding="async" class="alignleft wp-image-8715 size-medium" src="/wp-content/uploads/2015/06/Obamasbikini-2-300x243.png" alt="Obamasbikini-2" width="300" height="243" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/06/Obamasbikini-2-300x243.png 300w, https://www.smalsresearch.be/wp-content/uploads/2015/06/Obamasbikini-2.png 559w" sizes="auto, (max-width: 300px) 100vw, 300px" /></a>Or le graphique ne représente pas le nombre de sans-emplois, mais bien le nombre de <em>pertes d&#8217;emploi</em> par semestre, soit la variation du nombre de sans-emplois. En regardant donc le graphique de plus près, on voit donc que le nombre de sans-emplois augmente moins vite, certes, mais ne diminue pas ou peu. Ce qui est en soi déjà un résultat important, mais qui est largement accentué avec ce graphique.</p>
<p style="text-align: justify;">Le graphique ci-contre, généré par <em><a href="https://soquelbythecreek.blogspot.be/2010/02/what-does-obama-job-chart-really-mean.html" target="_blank" rel="noopener noreferrer">Soquel by de Creek</a></em>, montre cette fois-ci le nombre total de sans-emplois (c&#8217;est-à-dire avec les valeurs cumulées). Il est nettement moins vendeur auprès des électeurs &#8230;</p>
<h2 style="text-align: justify;">Mais encore&#8230;</h2>
<p style="text-align: justify;">Il existe de nombreuses autres façons de tromper le lecteur. Voici quelques exemples&nbsp;:</p>
<ul style="text-align: justify;">
<li style="text-align: justify;">Ignorer l&#8217;inflation quand on compare des budgets sur longues périodes. Comparer le budget Défense de Kennedy et d&#8217;Obama n&#8217;a par exemple pas de sens si l&#8217;on ne tient pas compte de la différence de la valeur du dollar entre les deux époques.</li>
<li style="text-align: justify;">Présenter des histogrammes dont les &#8220;bases&#8221; ne sont pas homogènes. Si l&#8217;on présente le total des ventes de chaque année mais que la dernière année représentée est toujours en cours, il faut ajuster les données pour ne pas donner l&#8217;impression d&#8217;une brusque baisse.</li>
<li style="text-align: justify;">Pour réaliser un effet de perspective, ne pas aligner la base des barres d&#8217;un histogramme, rendant très difficile la comparaison (<a href="https://visual.ly/asian-private-banks-digital-odyssey" target="_blank" rel="noopener noreferrer">exemple</a>).</li>
<li style="text-align: justify;">Utiliser une échelle logarithmique lorsque ça ne se justifie pas, pour réduire visuellement l&#8217;écart entre deux valeurs.</li>
</ul>
<p style="text-align: justify;">Avoir ces quelques éléments en tête pourra être très utile, à la fois comme &#8220;consommateur&#8221;, pour éviter d&#8217;être leurré par une visualisation un peu trop vendeuse, mais également comme &#8220;producteur&#8221;, de façon à réaliser des graphiques les plus intègres possibles.</p>
<p style="text-align: justify;">De très nombreuses illustrations de visualisations trompeuses ou mal conçues sont données sur le site <a href="https://wtfviz.net" target="_blank" rel="noopener noreferrer">wtfviz.net</a>. Le manque de bon sens de certains est parfois surprenant&#8230;</p>
<hr />
<h2>Notes</h2>
<ol>
<li style="text-align: justify;"><a id="note1"></a>Notons que la définition de Tufte peut prêter à confusion et est parfois contestée. En effet, lorsque l&#8217;on compare deux valeurs, on peut choisir arbitrairement quelle est la première et quelle est la seconde. Le choix impactera potentiellement fortement le calcul.<br />
Par ailleurs, si une augmentation de 10 % dans les données est traduite par une diminution visuelle de 5%, cela engendrera le même <em>lie factor</em> que si elle est traduite par une augmentation de 5%, étant donné l&#8217;utilisation de la valeur absolue.<br />
Certains préféreront une autre définition dans laquelle l&#8217;effet est calculé en effectuant le ratio entre les deux valeurs (première valeur/seconde valeur). Le choix des valeurs n&#8217;aura alors plus d&#8217;impact sur le <em>lie factor</em>, le choix étant bien entendu le même pour les données et pour le graphique.</li>
<li style="text-align: justify;"><a id="note2"></a>Si on avait, comme précisé dans la note ci-dessus, inversé les première et seconde valeurs, on aurait eu un effet dans le graphique de 191.7 % ((70-24)/24), pour un effet dans les données de 71.9%, soit un <em>lie factor</em> de 2.66</li>
</ol>
<p style="text-align: justify;"><span style="color: #808080;">Le titre de cet article est librement inspiré de nombreuses publications reprenant un nom très proche&nbsp;: How to lie with maps (Mark Monmonier, 1991), How to lie with statistics (Darrel Huff, 1954), How to lie with charts (Gerald Everett Jones, 2006)&#8230;</span></p>
]]></content:encoded>
					
					<wfw:commentRss>https://www.smalsresearch.be/comment-mentir-avec-un-graphique/feed/</wfw:commentRss>
			<slash:comments>4</slash:comments>
		
		
			</item>
		<item>
		<title>(bijna) 40 jaar R  &#8211; Hype of succes verhaal&#160;?</title>
		<link>https://www.smalsresearch.be/bijna-40-jaar-r-hype-of-succes-verhaal/</link>
		
		<dc:creator><![CDATA[Lieven Desmet]]></dc:creator>
		<pubDate>Wed, 22 Apr 2015 09:00:38 +0000</pubDate>
				<category><![CDATA[Blog post]]></category>
		<category><![CDATA[analytics]]></category>
		<category><![CDATA[big data]]></category>
		<category><![CDATA[Open Source]]></category>
		<category><![CDATA[statistics]]></category>
		<category><![CDATA[visualization]]></category>
		<guid isPermaLink="false">/?p=8349</guid>

					<description><![CDATA[In IT kringen is de programmeertaal  C en zijn varianten al jaren een begrip. Wat weinig mensen weten is dat in de jaren 70 in hetzelfde Bell labs een andere programmeertaal het levenslicht zag. Deze taal was niet bedoeld als all-purpose programmeertaal maar eerder als interactieve toolkit voor statistische data-analyse,  met nadrukkelijke aandacht voor grafische visualisatie [&#8230;]]]></description>
										<content:encoded><![CDATA[<p>In I<img loading="lazy" decoding="async" class=" wp-image-8350 size-full alignleft" src="/wp-content/uploads/2015/04/Rlogo.jpg" alt="Rlogo" width="100" height="76" />T kringen is de programmeertaal  C en zijn varianten al jaren een begrip. Wat weinig mensen weten is dat in de jaren 70 in hetzelfde Bell labs een andere programmeertaal het levenslicht zag. Deze taal was niet bedoeld als all-purpose programmeertaal maar eerder als interactieve toolkit voor statistische data-analyse,  met nadrukkelijke aandacht voor grafische visualisatie naast een groot aantal specifiek ontworpen en gedocumenteerde functies voor statistische verwerking. In  hoofdzaak ontwikkeld door John Chambers en <a title="S" href="https://en.wikipedia.org/wiki/S_%28programming_language%29">S</a> gedoopt kan deze taal gezien worden als een voorloper van R. Om precies te zijn, <a href="https://www.r-project.org/nosvn/conferences/useR-2006/Slides/Chambers.pdf">Chambers</a> situeert de eerste gesprekken over S in mei 1976, zodat we nog ruim een jaar de tijd hebben voor de voorbereiding van 40 jaar R.</p>
<h1>New S en S PLUS</h1>
<p>De huidige versie van R is in grote lijnen gebaseerd op een gewijzigde versie van S die eind de jaren tachtig ingevoerd is. Belangrijke keuzes waren het gebruik van C in de plaats van FORTRAN als onderliggende taal, een consistent gebruik van functies  en een meer  uitgebreid object-georiënteerd model.</p>
<p>Begin de jaren  90 wordt S-PLUS gecommercialiseerd als statistische data analyse tool. Versies voor de belangrijke platformen worden ontwikkeld en de statistische toolkit werd sterk uitgebreid, in lijn met ontwikkelingen in het domein. De strategische keuze om een gratis studentenversie te lanceren (2002) zal zeker bijdragen tot de bekendheid van het systeem onder statistici.</p>
<h1>En daar is R …</h1>
<p>In 1993 komt een nieuwe groep rond John Chambers (Ross Ihaka en R Gentleman) met een open source versie van de <em>new S</em> programmeertaal. Verschillen tussen deze implementatie en de S-PLUS implementatie zijn beperkt zodat gebruikers van de ene gemakkelijk met de andere van start kunnen. Qua filosofie is er echter een wereld van verschil omdat R een GNU project is.  Dit betekent dat de code open source is  en dus vrij beschikbaar voor gebruikers om ze uit te breiden en te verbeteren. Bovendien zijn er geen beperkingen om R te verdelen onder het grote publiek. Deze filosofie is heel erg aangeslagen in de academische wereld waar het gebruikelijk is dat nieuwe ontwikkelingen gedeeld en gepubliceerd worden.  Heel  veel packages zijn het resultaat van wetenschappelijk onderzoek waar naast het publiceren van de theoretische resultaten nu ook de methoden meer en meer gepubliceerd worden als bijproduct.  Men kan terecht spreken van een community, waar een deel van de gebruikers actief betrokken zijn bij het verder ontwikkelen  en documenteren van het project. Tegelijk worden bijeenkomsten georganiseerd voor gebruikers, en zijn er ontzettend veel initiatieven om het gebruik van R te verbeteren via mailing lijsten en cursussen, zoals bijvoorbeeld <a href="https://www.statmethods.net/">Quick-R</a> en  het recente belgische initiatief <a href="https://www.tijd.be/detail.art?a=9558973&amp;n=3127&amp;ckc=1">Datacamp</a>.</p>
<p>Hoewel  het ontwikkelen van R packages zich vooral afspeelt in linux omgevingen en met C code zijn er versies voor alle operating systemen en in het bijzonder voor windows. In combinatie met  R  zijn er bovendien een aantal grafische omgevingen voor handen die gebruikersvriendelijker zijn dan de standaard console, zoals bijvoorbeeld de veel gebruikte <a href="https://www.rstudio.com/">RStudio</a> die beschikbaar is in gratis standalone en server versies maar ook in betalende professionele versies met support. <a href="https://www.openanalytics.eu/">OpenAnalytics</a> is een belgisch bedrijf dat onder meer een freeware server platform aanbiedt (Architect) en systemen die toelaten R verwerking te integreren in de business of labo-workflow (R service bus).</p>
<h1>Van het labo naar het bedrijf</h1>
<p>Ondertussen hebben meerdere generaties enthousiaste studenten hun weg gevonden naar bedrijven en instellingen. Zo is R beetje bij beetje geïntroduceerd in verschillende sectoren, waarvan de biomedische en financiële vooralsnog het meest prominent zijn.</p>
<p><a href="/wp-content/uploads/2015/04/ggplotdensity.png"><img loading="lazy" decoding="async" class="  wp-image-8351 alignleft" src="/wp-content/uploads/2015/04/ggplotdensity-300x300.png" alt="ggplotdensity" width="253" height="253" srcset="https://www.smalsresearch.be/wp-content/uploads/2015/04/ggplotdensity-300x300.png 300w, https://www.smalsresearch.be/wp-content/uploads/2015/04/ggplotdensity-768x767.png 768w, https://www.smalsresearch.be/wp-content/uploads/2015/04/ggplotdensity-150x150.png 150w, https://www.smalsresearch.be/wp-content/uploads/2015/04/ggplotdensity.png 839w" sizes="auto, (max-width: 253px) 100vw, 253px" /></a>Het feit dat R in een handomdraai gedownload en geïnstalleerd kan worden laat toe dat R gemakkelijk kan ingezet worden. Hoewel de focus van R nog altijd interactieve data-analyse is, worden de grafische mogelijkheden van R ook erg geapprecieerd. Door de ontwikkelingen in een aantal wetenschappelijke disciplines zoals de bio-informatica worden steeds zwaardere eisen gesteld aan de verwerkingscapaciteiten van het R systeem. R volgt dus de ontwikkelingen qua high performance computing op de voet, en heeft ondertussen ook alle functionaliteiten die nodig zijn voor data management.</p>
<p>&nbsp;</p>
<p>Dit alles maakt R natuurlijk ook bijzonder interessant voor big data analytics.</p>
<h1>Of toch een beetje gehyped&nbsp;?</h1>
<p>Voor vele R gebruikers van het eerste uur is het feit dat R gehyped zou zijn een nogal vreemd idee. Immers, zij gebruiken en ontwikkelen als specialisten een tool die precies  gericht is op de problemen waar zij mee bezig zijn. De hype ontstaat dus als het grote publiek, dat niet noodzakelijk ervaring heeft met data-analyse, voorgespiegeld wordt dat met deze nieuwe tool een hele resem aan complexe problemen kunnen opgelost worden, zonder dat je daarvoor specialist hoeft te zijn.</p>
<p>Het feit dat nu meer gebruikersvriendelijke visuele omgevingen beschikbaar zijn verhult enigszins dat werken in R traditioneel neerkomt op code schrijven. Het feit dat een functie of voorbeeldscript bestaat voor wat je wil doen betekent nog niet dat je deze meteen op je data aan de praat krijgt. Uiteraard is documentatie beschikbaar maar deze kan al eens cryptisch zijn en is niet geschreven voor een groot publiek. Bovendien lijkt het moeilijk de gebruiker volledig af te schermen van technische aspecten van de installatie en object-georiënteerde modellen … en zit er vaak nog een grote performantie winst in het programmeren  van C subroutines voor bepaalde intensieve deeltaken.</p>
<p>De steile leercurve kan natuurlijk altijd verzacht worden door het gebruik van visuele omgevingen (zo bijvoorbeeld RStudio&#8217;s <a href="https://shiny.rstudio.com/">Shiny</a> voor het ontwikkelen van web applicaties)  en het voorzien van de nodige omkadering voor support en coaching. De eindgebruiker zal dan ongetwijfeld ervaren dat investeren in R snel vruchten afwerpt (en hierbij wordt al eens vergeten dat het vertrouwd raken met software zoals Excel ook veel tijd gekost heeft).</p>
<h1>Besluit</h1>
<p>Op zijn bijna 40<sup>ste</sup> is R springlevend en heeft het zeker zijn plaats verdiend naast de grote commerciële oplossingen voor statistiek en analytics. Men kan terecht spreken van een <em>lingua franca</em> programmeertaal voor data-analyse en statistical learning. Door het open source karakter zijn er geen beperkingen op de verspreiding van R maar de inzetbaarheid van R voor het grote publiek hangt af van het soort gebruik. De kracht van R en het voordeel van de packages zit vooral in het gevorderd gebruik maar mits de nodige coaching en omkadering kunnen minder gevorderde eindgebruikers ook  met R aan de slag. In dat geval moeten  bedrijven en instellingen rekening houden met kosten voor training en kunnen beschikken over specialisten die het systeem kunnen opzetten en onderhouden. In 2006 vermeldde John Chambers nog de integratie van R in andere systemen als één van de grote uitdagingen voor de toekomst. Ondertussen zien we R meer en meer opduiken als component in de geïntegreerde systemen voor analytics die vendors aanbieden.</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Sparklines: trends in tabellen</title>
		<link>https://www.smalsresearch.be/sparklines-trends-in-tabellen/</link>
		
		<dc:creator><![CDATA[Jan Meskens]]></dc:creator>
		<pubDate>Mon, 22 Sep 2014 07:44:13 +0000</pubDate>
				<category><![CDATA[Blog post]]></category>
		<category><![CDATA[analytics]]></category>
		<category><![CDATA[big data]]></category>
		<category><![CDATA[sparklines]]></category>
		<category><![CDATA[visualization]]></category>
		<guid isPermaLink="false">/?p=7420</guid>

					<description><![CDATA[Om goede data-analyses te maken is het cruciaal dat men data op een goede, begrijpbare, manier voorstelt. Dit leidt tot betere inzichten en op termijn dus ook tot betere data-driven business beslissingen. In deze blogpost staan we stil bij het belang van het correct presenteren van data en bekijken we een populaire visualisatietechniek: de sparklines! Data analyse &#38; [&#8230;]]]></description>
										<content:encoded><![CDATA[<p>Om goede data-analyses te maken is het cruciaal dat men data op een goede, begrijpbare, manier voorstelt. Dit leidt tot betere inzichten en op termijn dus ook tot betere data-driven business beslissingen. In deze blogpost staan we stil bij het belang van het correct presenteren van data en bekijken we een populaire visualisatietechniek: <strong>de sparklines</strong>!</p>
<p><strong>Data analyse &amp; aggregaten</strong></p>
<p>In de rol van <strong>data-analist</strong> (of <strong>data scientist</strong>) krijgt man vaak de vraag om data op een zodanige manier te manipuleren en transformeren zodat men een beter inzicht in de onderliggende gegevens verkrijgt. Om dit inzicht te verkrijgen gaat de data-analist vaak <strong>aggregaten</strong> bouwen op één of meerdere niveaus. Zo kan men bij het analyseren van klantengegevens een aggregaat bouwen op het niveau van bv. de individuele klant om inzicht te krijgen in de producten die elke klant koopt. Maar evengoed kan men een aggregaat bouwen op het niveau van de klant&#8217;s woonplaats om te weten welk productsegment populair is in welk gebied en hoeveel klanten terug te vinden zijn in elk geografisch gebied. Vaak worden de aggregaten iteratief verfijnd in samenwerking met de klanten/opdrachtgevers om zo de <strong>businessvraagstukken</strong> beter te begrijpen en het resultaat tijdig bij te sturen waar nodig.</p>
<p>Eens men een aggregaat van gegevens heeft gebouwd kan men dit door middel van verscheidene artefacten presenteren. De drie populairste vormen om aggregaten te presenteren zijn:</p>
<ol>
<li><strong>Visualisaties</strong>, waar men de bekomen data visueel gaat voorstellen door middel van een grafische component (histogram, trendlijn, &#8230;). Zo kan men op een snelle manier een globaal beeld krijgen van de onderliggende data. Het nadeel van visualisaties is dat men vaak de details over de onderliggende informatie niet meer ziet.</li>
<li><strong>Tabellen</strong>, waar men textueel in verschillende kolommen weergeeft hoe de data zich gedraagt per rij. Dit geeft goed de details van de data weer, maar het is moeilijker om via een tabel een globaal zicht op de data te krijgen. Ook is het moeilijker om trends in een tabelstructuur weer te geven.</li>
<li><strong>Interactieve dashboards</strong>, waar men door eenvoudige manipulaties doorheen data kan navigeren en parameters kan aanpassen. Dit is een sterke presentatietechniek, maar niet altijd even eenvoudig te bouwen (hoewel er de laatste jaren een enorme evolutie is ontstaan in de dashboarding tools).</li>
</ol>
<h1>Sparklines: een vernieuwde presentatievorm</h1>
<p>Naast de drie traditionele vormen om aggregaten voor te stellen, is er de laatste jaren in de (academische) informatie visualisatie community gewerkt aan nieuwe &#8211; betere &#8211; voorstellingen van geaggregeerde data. Een van die nieuwe technieken is <strong>sparklines</strong>, een zeer kleine lijngrafiek zonder assen of coordinaten. Dit laat toe om op een heel kleine ruimte een verloop of trend aan te tonen. Zo kunnen sparklines perfect binnen een tabel of tekst geplaatst worden om het verloop van een parameter aan te geven. Onderstaand ziet men een voorbeeld van een sparkline die de aandelenkoers weergeeft (Bron: Wikipedia).</p>
<p><a href="/wp-content/uploads/2014/08/sparkline_wikipedia.png"><img loading="lazy" decoding="async" class="alignnone wp-image-7421 size-medium" src="/wp-content/uploads/2014/08/sparkline_wikipedia-300x95.png" alt="sparkline_wikipedia" width="300" height="95" srcset="https://www.smalsresearch.be/wp-content/uploads/2014/08/sparkline_wikipedia-300x95.png 300w, https://www.smalsresearch.be/wp-content/uploads/2014/08/sparkline_wikipedia.png 341w" sizes="auto, (max-width: 300px) 100vw, 300px" /></a></p>
<h1>De democratisering van Sparklines: integratie in populaire data-analyse tools</h1>
<p><img loading="lazy" decoding="async" class="alignleft size-medium wp-image-7422" src="/wp-content/uploads/2014/08/sparkline_alc-185x300.png" alt="sparkline_alc" width="185" height="300" srcset="https://www.smalsresearch.be/wp-content/uploads/2014/08/sparkline_alc-185x300.png 185w, https://www.smalsresearch.be/wp-content/uploads/2014/08/sparkline_alc.png 314w" sizes="auto, (max-width: 185px) 100vw, 185px" />De laatste tijd worden sparklines steeds populairder buiten het academische milieu. Een belangrijke drijfveer is hiervoor ongetwijfeld de integratie van sparklines in populaire analyse tools zoals onder andere Excel. Met enkele eenvoudige klikken kan je de rijen van je tabel uitbereiden met kleine lijn- of bargrafiekjes. Zo hebben wij in een project voor een klant onlangs sparklines gebruikt om trends aan te tonen voor bepaalde parameters (zie screenshot links). De klant was overigens zeer tevreden over deze presentatievorm.</p>
<p><strong>Conclusie</strong></p>
<p>Als data-scientist grijpen we vaak terug naar de traditionele methodes om data en bijhorende aggregaten voor te stellen. Toch blijft het belangrijk om ook de nieuwe visualisatietrends te volgen. Dit laat toe om data nog begrijpbaarder voor te stellen. Een voorbeeld hiervan is sparklines, dewelke de laatste jaren ook in de standaard analyse tools zijn ingebakken.</p>
<p>&nbsp;</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>OpenCPU: een platform om R-code als webservice te hergebruiken</title>
		<link>https://www.smalsresearch.be/opencpu-een-platform-om-r-code-als-webservice-te-hergebruiken/</link>
		
		<dc:creator><![CDATA[Jan Meskens]]></dc:creator>
		<pubDate>Thu, 11 Oct 2012 10:50:22 +0000</pubDate>
				<category><![CDATA[Blog post]]></category>
		<category><![CDATA[analytics]]></category>
		<category><![CDATA[Open Source]]></category>
		<category><![CDATA[OpenCPU]]></category>
		<category><![CDATA[Productivity]]></category>
		<category><![CDATA[R language]]></category>
		<category><![CDATA[rest]]></category>
		<category><![CDATA[saas]]></category>
		<category><![CDATA[social]]></category>
		<category><![CDATA[software engineering]]></category>
		<category><![CDATA[visualization]]></category>
		<guid isPermaLink="false">/?p=4599</guid>

					<description><![CDATA[Om (complexe) statistische en wiskundige berekeningen te implementeren is het vaak aangewezen om specifieke programmeertalen en bijhorende omgevingen te gebruiken  zoals bv Matlab, R, SAS of Mathematica. Elk van deze omgeving laat toe om in een beperkt aantal lijnen code berekeningen uit te voeren die moeilijk te realiseren zouden zijn in meer generieke programmeertalen.  Onze eigen [&#8230;]]]></description>
										<content:encoded><![CDATA[<p>Om (complexe) statistische en wiskundige berekeningen te implementeren is het vaak aangewezen om specifieke programmeertalen en bijhorende omgevingen te gebruiken  zoals bv <a href="https://en.wikipedia.org/wiki/MATLAB">Matlab</a>, <a href="https://en.wikipedia.org/wiki/R_(programming_language)">R</a>, <a href="https://en.wikipedia.org/wiki/SAS_(software)">SAS </a>of <a href="https://en.wikipedia.org/wiki/Mathematica">Mathematica</a>. Elk van deze omgeving laat toe om in een beperkt aantal lijnen code berekeningen uit te voeren die moeilijk te realiseren zouden zijn in meer generieke programmeertalen.  Onze eigen ervaringen met verscheidene geavanceerde analyses in <a href="https://en.wikipedia.org/wiki/R_(programming_language)">R</a> &#8211; een open-source programmeertaal en software omgeving voor statistische berekeningen en grafieken &#8211; bevestigen dit.</p>
<p>Het gebruiken van specifieke programmeeromgevingen heeft echter ook enkele vervelende nadelen:</p>
<ul>
<li>De output van de berekeningen uitgevoerd in deze programmeeromgevingen dienen vaak gebruikt te worden als input voor een nieuw programma, rapport, webapplicatie, &#8230; .  Dit is vaak een complex gegeven waarbij heel wat configuratie en integratie komt kijken;</li>
<li>Analyses en berekeningen kunnen vaak nuttig zijn voor meerdere personen, instellingen, onderzoekers&#8230;  Het is weinig flexibel om analyses te delen met de requirement om een hele software stack te installeren.</li>
</ul>
<p>Om code afkomstig van specifieke programmeeromgevingen makkelijker te delen en te integreren introduceert doctoraatsonderzoeker<a href="https://www.stat.ucla.edu/~jeroen/"> Jeroen Ooms</a> &#8216;<a href="https://public.opencpu.org/pages/">OpenCPU</a>&#8216;. <strong>OpenCPU</strong> is een centraal platform waarop men R-scripts kan plaatsen. De scripts die men op OpenCPU plaatst worden vervolgens automatisch beschikbaar als <a href="https://en.wikipedia.org/wiki/Representational_state_transfer">REST</a>-services.  Deze services kan men makkelijk integreren in andere programmas/webapplicaties. Belangrijk is ook te vermelden dat OpenCPU een open-source platform is. Dit maakt het mogelijk om intern een eigen OpenCPU-server op te zetten (met de nodige beveiligingen) en indien nodig te koppelen aan interne achterliggende databases.</p>
<p><span id="more-4599"></span></p>
<p><span style="text-decoration: underline;"><strong>OpenCPU Tutorial</strong></span></p>
<p>Bij wijze van proof-of-concept hebben we getest hoe men OpenCPU kan gebruiken om een <em>bar-chart analyse</em> te genereren in een web-applicatie. De stappen die we hierbij ondernomen hebben staan hieronder opgesomd.</p>
<p><strong>Stap 1: Verzamel en upload de nodige data</strong></p>
<p>In deze proof-of-concept analyseren we het klantenbestand van bedrijf X. Elke klant heeft een bepaalde Importance code van 1 tot 9 (1=een klant met weinig opbrengst, 9 een klant met heel veel opbrengst). Per klant houdt men ook bij of  hij makkelijk beschikbaar is voor een telefonische enquete (Y=yes,N=no). Onderstaande tabel geeft deze twee dimensies weer, gekoppeld aan het aantal klanten (Frequency) die in deze categoriëen kunnen ondergebracht worden.</p>
<table>
<thead>
<tr>
<th>Importance</th>
<th>Available</th>
<th>Frequency</th>
</tr>
</thead>
<tbody>
<tr>
<td>1</td>
<td>N</td>
<td>557238</td>
</tr>
<tr>
<td>2</td>
<td>N</td>
<td>53354</td>
</tr>
<tr>
<td>3</td>
<td>N</td>
<td>27857</td>
</tr>
<tr>
<td>4</td>
<td>N</td>
<td>18746</td>
</tr>
<tr>
<td>5</td>
<td>N</td>
<td>5575</td>
</tr>
<tr>
<td>6</td>
<td>N</td>
<td>2717</td>
</tr>
<tr>
<td>7</td>
<td>N</td>
<td>1702</td>
</tr>
<tr>
<td>8</td>
<td>N</td>
<td>547</td>
</tr>
<tr>
<td>9</td>
<td>N</td>
<td>504</td>
</tr>
<tr>
<td>1</td>
<td>Y</td>
<td>132551</td>
</tr>
<tr>
<td>2</td>
<td>Y</td>
<td>19218</td>
</tr>
<tr>
<td>3</td>
<td>Y</td>
<td>10332</td>
</tr>
<tr>
<td>4</td>
<td>Y</td>
<td>5881</td>
</tr>
<tr>
<td>5</td>
<td>Y</td>
<td>1469</td>
</tr>
<tr>
<td>6</td>
<td>Y</td>
<td>478</td>
</tr>
<tr>
<td>7</td>
<td>Y</td>
<td>142</td>
</tr>
<tr>
<td>8</td>
<td>Y</td>
<td>26</td>
</tr>
<tr>
<td>9</td>
<td>Y</td>
<td>5</td>
</tr>
</tbody>
</table>
<p>Bovenstaande data kan men uploaden als CSV-file (of ander formaat) op de OpenCPU server via volgende <a href="https://public.opencpu.org/userapps/jun9/opencpu.demo/uploadfile/">link</a>. Eens de data geupload is krijgt men een <strong>unieke ID</strong> terug waar de data te vinden is.</p>
<p><strong>Stap 2: Creëer en save het R-script</strong></p>
<p><strong></strong>In een volgende stap willen we een barchart genereren die per Importance-code weergeeft hoeveel klanten er zijn, en elke bar inkleurt in twee vlakken: een vlak makkelijk beschikbare klanten en een vlak met moeilijk beschikbare. Deze grafiek genereren we met de<a href="https://cran.r-project.org/web/packages/ggplot2/index.html"> ggplot2</a> library. Onderstaande code omvat het complete R-script:</p>
<pre><em>#Include ggplot 2 library</em>
<strong>library("ggplot2"); </strong>
<em>#Haal de geuploade data op (zie stap1, de DATAID is dezelfde als uit deze stap) </em>
<strong>myTable &lt;- read.csv("http://public.opencpu.org/R/tmp/<em>DATAID</em>/csv?");</strong>
<em>#Plot en print te barchart</em>
<strong>pl &lt;- ggplot(myTable, aes(x = Importance, y = Frequency,fill=Available) ) + geom_bar(stat="identity");</strong>
<strong>print(pl);</strong></pre>
<p>Dit script zetten we op de OpenCPU-server via volgende <a href="https://public.opencpu.org/userapps/jun9/opencpu.demo/runcode/">link</a>, we kiezen voor de optie &#8216;save to store&#8217;. Deze code krijgt ook een<strong> unieke ID</strong>, dewelke we later kunnen gebruiken om de code uit te voeren via een REST-service.</p>
<p><strong>Stap 3: Maak de web-applicate met de REST service</strong></p>
<p>De bar-chart die we gemaakt hebben in het R-script willen we nu tonen in een web-applicatie. Dit doen we via een eenvoudige Javascript applicatie die de OpenCPU-REST webservice aanroept. OpenCPU biedt verscheidene webservices aan om een plot te laden: als pdf, png, svg, R-file, &#8230; Wij hebben hier gekozen om de plot in te laten als SVG. Onderstaand is de source-code  en een screenshot van de webapplicatie weergegeven (de status na het klikken op de &#8220;calculate graph&#8221; button).</p>
<p style="text-align: center;"><img loading="lazy" decoding="async" class="size-full wp-image-4633 aligncenter" title="openCPU-webappresult" src="/wp-content/uploads/2012/09/openCPU-webappresult1.png" alt="" width="688" height="517" srcset="https://www.smalsresearch.be/wp-content/uploads/2012/09/openCPU-webappresult1.png 1114w, https://www.smalsresearch.be/wp-content/uploads/2012/09/openCPU-webappresult1-300x225.png 300w, https://www.smalsresearch.be/wp-content/uploads/2012/09/openCPU-webappresult1-1024x768.png 1024w, https://www.smalsresearch.be/wp-content/uploads/2012/09/openCPU-webappresult1-768x576.png 768w" sizes="auto, (max-width: 688px) 100vw, 688px" /></p>
<p>&nbsp;</p>
<pre>&lt;html&gt;
 &lt;head&gt;
 &lt;script src="//ajax.googleapis.com/ajax/libs/jquery/1.8.0/jquery.min.js"  type="text/javascript"&gt;
 &lt;/script&gt;
 <strong>
 &lt;script type="text/javascript"&gt; 
     $(document).ready(function() { 
          $("button").click( 
                 function(){ 
                      $("#svg").load("http://public.opencpu.org/R/tmp/SCRIPTOPENCPUID/svg", function() {});
                 } 
          );
     }); 
 &lt;/script&gt;
 </strong>
 &lt;/head&gt;
 &lt;body&gt;
   <strong>
   &lt;button&gt;Calculate graph&lt;/button&gt; 
   &lt;div id="svg"&gt; &lt;/div&gt;
   </strong>
 &lt;/body&gt;
 &lt;/html&gt;</pre>
<p>&nbsp;</p>
<p><span style="text-decoration: underline;"><strong>Besluit</strong></span></p>
<p>Specifieke softwarepakketten en programmeertalen zijn handig om in enkele lijnen code complexe berekeningen uit te voeren. Het is echter moeilijk om deze scripts te koppelen met bestaande code en te delen met verschillende mensen. Als oplossing voor dit probleem kunnen we OpenCPU gebruiken, een opensource server waar R-code op gepusht kan worden en vervolgens kan aangeroepen worden als REST-service. In een tutorial toonden we aan hoe deze aanpak werkt.  Er zijn ook nog 2 blogposts die deze aanpak beschrijven: <a href="https://blog.opencpu.org/2011/08/embedding-a-plot-in-your-website/">embedding a plot in your website</a> en <a href="https://blog.opencpu.org/2012/01/running-a-block-of-r-code-in-opencpu/">running a block of R-code in OpenCPU</a>.</p>
<p>&nbsp;</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Kosten besparen in de Cloud?</title>
		<link>https://www.smalsresearch.be/kosten-besparen-in-de-cloud/</link>
					<comments>https://www.smalsresearch.be/kosten-besparen-in-de-cloud/#comments</comments>
		
		<dc:creator><![CDATA[Johan Loeckx]]></dc:creator>
		<pubDate>Mon, 27 Sep 2010 09:14:48 +0000</pubDate>
				<category><![CDATA[Blog post]]></category>
		<category><![CDATA[cloud computing]]></category>
		<category><![CDATA[cost cutting]]></category>
		<category><![CDATA[hosting]]></category>
		<category><![CDATA[kostenbesparing]]></category>
		<category><![CDATA[Managing IT costs]]></category>
		<category><![CDATA[social]]></category>
		<category><![CDATA[virtualizatie]]></category>
		<category><![CDATA[visualization]]></category>
		<guid isPermaLink="false">http://blogs.smals-mvm.be/research/?p=1321</guid>

					<description><![CDATA[Het besparen van kosten wordt vaak vernoemd als hét grote voordeel van Cloud Computing.  Enige nuancering is echter op zijn plaats! Waarom public clouds goedkoper zijn Het is een feit dat leveranciers van public cloud services goedkoper kunnen zijn per feature, omdat: ze korting krijgen op hardware, elektriciteit, etc&#8230; door de grote afname; ze doorgedreven [&#8230;]]]></description>
										<content:encoded><![CDATA[<p style="text-align: justify;">Het besparen van kosten wordt vaak vernoemd als hét grote voordeel van Cloud Computing.  Enige nuancering is echter op zijn plaats!</p>
<h2>Waarom public clouds goedkoper zijn</h2>
<p style="text-align: justify;">Het is een feit dat leveranciers van public cloud services goedkoper kunnen zijn per feature, omdat:</p>
<ul>
<li>ze korting krijgen op hardware, elektriciteit, etc&#8230; door de grote afname;</li>
<li>ze doorgedreven automatiseren &amp; standaardiseren;</li>
<li>ze de vraag statistisch kunnen uitmiddelen door het grote aantal klanten;</li>
<li>de kost per feature (bij SaaS) lager is ten gevolge de multi-tenancy;</li>
<li>ze hun portfolio extreem efficiënt beheren: de cloud leverancier bepaalt het aanbod, niet de klant.</li>
</ul>
<p style="text-align: justify;"><span style="color: #000000;"><strong>Dit betekent daarom echter niet dat <em>het gebruik</em> van cloud computing steeds voordelig uitkomt!</strong></span></p>
<h2>&#8220;Amazon is zo goedkoop&#8221;: leugen!</h2>
<p style="text-align: justify;"><span id="more-1321"></span>Bij het beschouwen van de kostenbesparing door cloud computing, moet goed gekeken worden waar de <strong>werkelijke kosten</strong> liggen. Vaak wordt verwezen naar Amazon EC2, waarbij de vraag gesteld wordt waarom interne servers zo duur zijn en traag geprovisioneerd worden, als dat bij Amazon veel sneller goedkoper kan. Deze vergelijking gaat echter niet op, omdat appels met peren vergeleken worden. Amazon biedt virtuele servers aan met <strong>beperkte performantie,</strong> en bovendien zijn</p>
<ul>
<li>bandbreedte,</li>
<li>support,</li>
<li>monitoring,</li>
<li>maintenance en</li>
<li>beheer</li>
</ul>
<p style="text-align: justify;">niet inbegrepen in de prijs. Ter illustratie hebben we een vergelijking gemaakt van prijzen voor een virtuele server (incl. support, monitoring, maintenance) met een bepaalde rekenkracht waarbij een bepaalde bandbreedte (4000 Gb) wordt gebruikt. De vergelijking staat in onderstaande tabel:</p>
<table class="MsoTableColumns1" style="border: medium none; border-collapse: collapse; height: 229px;" border="1" cellspacing="0" cellpadding="0" width="407">
<tbody>
<tr style="height: 18.75pt; text-align: left;">
<td style="padding: 0cm 5.4pt; width: 71.7pt; height: 18.75pt;" width="96" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><span lang="NL-BE"> </span></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% white; width: 83.4pt; height: 18.75pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt; text-align: center;"><strong><span lang="NL-BE">CLOUD</span></strong></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 162.9pt; height: 18.75pt;" colspan="2" width="217" valign="top">
<p class="MsoNormal" style="margin-top: 6pt; text-align: center;"><strong><span lang="NL-BE">TRADITIONAL   HOSTING</span></strong></p>
</td>
</tr>
<tr style="height: 18.75pt;">
<td style="padding: 0cm 5.4pt; width: 71.7pt; height: 18.75pt;" width="96" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><span lang="NL-BE"> </span></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% white; width: 83.4pt; height: 18.75pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt; text-align: left;"><span lang="NL-BE">Amazon</span></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 83.45pt; height: 18.75pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><span lang="NL-BE">Hostway</span></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 79.45pt; height: 18.75pt;" width="106" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><span lang="NL-BE">Combell</span></p>
</td>
</tr>
<tr style="height: 20.25pt;">
<td style="padding: 0cm 5.4pt; width: 71.7pt; height: 20.25pt;" width="96" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="NL-BE">Location</span></strong><span lang="NL-BE"> </span></p>
</td>
<td style="border: medium none; padding: 0cm 5.4pt; background: none repeat scroll 0% 0% white; width: 83.4pt; height: 20.25pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="NL-BE">USA/Europe</span></strong></p>
</td>
<td style="border: medium none; padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 83.45pt; height: 20.25pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">USA</span></strong><strong> </strong></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 79.45pt; height: 20.25pt;" width="106" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">Belgium</span></strong><strong> </strong></p>
</td>
</tr>
<tr style="height: 20.25pt;">
<td style="padding: 0cm 5.4pt; width: 71.7pt; height: 20.25pt;" width="96" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">Availability</span></strong></p>
</td>
<td style="border: medium none; padding: 0cm 5.4pt; background: none repeat scroll 0% 0% white; width: 83.4pt; height: 20.25pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">99.9%</span></strong><strong> </strong></p>
</td>
<td style="border: medium none; padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 83.45pt; height: 20.25pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">99.9%</span></strong><strong> </strong></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 79.45pt; height: 20.25pt;" width="106" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">99.9%</span></strong><strong> </strong></p>
</td>
</tr>
<tr style="height: 20.25pt;">
<td style="padding: 0cm 5.4pt; width: 71.7pt; height: 20.25pt;" width="96" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">Traffic</span></strong></p>
</td>
<td style="border: medium none; padding: 0cm 5.4pt; background: none repeat scroll 0% 0% white; width: 83.4pt; height: 20.25pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">4 Tb.</span></strong><strong> </strong></p>
</td>
<td style="border: medium none; padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 83.45pt; height: 20.25pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">4 Tb</span></strong><strong> </strong></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 79.45pt; height: 20.25pt;" width="106" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">4 Tb</span></strong><strong> </strong></p>
</td>
</tr>
<tr style="height: 30.75pt;">
<td style="padding: 0cm 5.4pt; width: 71.7pt; height: 30.75pt;" width="96" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">Delivery   time</span></strong></p>
</td>
<td style="border: medium none; padding: 0cm 5.4pt; background: none repeat scroll 0% 0% white; width: 83.4pt; height: 30.75pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong>Minutes</strong></p>
</td>
<td style="border: medium none; padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 83.45pt; height: 30.75pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong>Hours</strong></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 79.45pt; height: 30.75pt;" width="106" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong>24 hours</strong></p>
</td>
</tr>
<tr style="height: 30.75pt;">
<td style="padding: 0cm 5.4pt; width: 71.7pt; height: 30.75pt;" width="96" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">Price</span></strong></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% white; width: 83.4pt; height: 30.75pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">€660 / month</span></strong></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 83.45pt; height: 30.75pt;" width="111" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">€280 / month</span></strong></p>
</td>
<td style="padding: 0cm 5.4pt; background: none repeat scroll 0% 0% #e0e0e0; width: 79.45pt; height: 30.75pt;" width="106" valign="top">
<p class="MsoNormal" style="margin-top: 6pt;"><strong><span lang="FR">€369 / month</span></strong></p>
</td>
</tr>
</tbody>
</table>
<p class="MsoBodyText" style="text-align: justify;"><span lang="NL-BE">Hierbij komt meteen naar voren dat traditionele hosting pakketten zoals Hostway tot &gt;50% goedkoper zijn. <strong>Het grote voordeel aan Amazon is dan ook niet de rauwe prijs, maar de flexibele provisionering</strong>, het starten &amp; stoppen van een server aan de hand van een webservice call. </span></p>
<p class="MsoBodyText" style="text-align: justify;"><span lang="NL-BE"><br />
</span></p>
<h2>Waarom de Cloud niet altijd goedkoper is</h2>
<p style="text-align: justify;">Bij elk business proces komen <strong>&#8220;verborgen kosten&#8221;</strong> kijken &#8212; of het nu zelf uitgevoerd, geoutsourced wordt of naar de cloud uitbesteed.  Algemeen geldt dat <strong>hoe “hoger” de abstractie</strong> <strong>van de cloud is (SaaS &gt; PaaS &gt; IaaS), hoe groter de mogelijke kostenbesparingen </strong>zijn, omdat er steeds minder interne processen vereist zijn.  Typische “administratieve”  processen zijn aankoop, monitoring, maintenance en support.</p>
<h3>Integratie</h3>
<p style="text-align: justify;">Een belangrijke kost vindt zijn oorsprong in de integratie in de huidige processen.  Public cloud providers bieden immers standaard-oplossingen aan die weliswaar gecustomiseerd kunnen worden maar er is weinig tot geen ruimte voor contractonderhandelingen om de integratie te vereenvoudigen.  Typisch zal de provider een (vaste) API / SOA-interface aanbieden waarmee alle communicatie zal moeten verlopen.</p>
<p style="text-align: justify;">Behalve pure programmatorische integratie, zijn er natuurlijk nog “hogere orde” processen die geïntegreerd moeten worden, denken we bv. aan user access management (UAM), Data Integration, Single-Sign on,&#8230;.   Daarom moeten policies opgesteld worden die de hele keten omvatten.</p>
<p style="text-align: justify;">Ook op vlak van processen moeten de nodige stappen gezet worden: de huidige organisatie moet zo afgesteld zijn dat bepaalde stappen in het proces nu volledig elektronisch en automatisch gebeuren.  Een significante kost en mentaliteitswijziging kan komen kijken bij deze integratie.</p>
<h3 style="text-align: justify;">Migratie</h3>
<p style="text-align: justify;">Zoals bij elke technologische verandering, kan de migratie erg risicovol en duur zijn.  Dit is zeker het geval bij cloud computing daar de gegevens niet meer intern beheerd, verwerkt of bezit worden.  Verder is er veel minder ruimte tot onderhandeling met de leverancier daar de (publieke) cloud standaardoplossingen aanbiedt.  Ook moet (op voorhand!!!) afgevraagd worden hoe gemakkelijk de gegevens uit de cloud kunnen gehaald worden en aan welke kost.</p>
<h3 style="text-align: justify;">Licenties</h3>
<p style="text-align: justify;">De kost van het beheer en aankoop van licenties mag ook niet vergeten worden.  Zeker bij automatisch schalende applicaties moet deze problematiek vanaf het begin opgenomen worden in de algemene Software Asset Management strategie.</p>
<h2>Hoe kostenbesparen in de Cloud</h2>
<p>Er zijn 3 fundamentele manieren om kosten te besparen met Cloud Computing.</p>
<h3>1. Beter inspelen op de markt</h3>
<p style="text-align: justify;">Een nieuw deel van de markt kan ontgind worden of het marktaandeel vergroot door de nieuwe mogelijkheden van cloud computing technologie (bv. de schaalbaarheid) aan te wenden.  Bovendien laat de flexibiliteit van cloud computing toe om de marktvraag beter te volgen (bv. er wordt vermeden dat een onverwachte vraag niet gevolgd kan worden door een tekort aan middelen).</p>
<h3 style="text-align: justify;">2. De efficiëntie verhogen</h3>
<p style="text-align: justify;">De flexibiliteit laat toe om efficiënt gebruik te maken van resources, bv. door het vermijden van overprovisionering.  Beschouw het voorbeeld in onderstaande figuur. In een traditionele omgeving wordt infrastructuur statisch gereserveerd op basis van de piekvraag; in een cloud architectuur worden de resources geschaald evenredig met de vraag.</p>
<p style="text-align: justify;"><a href="/wp-content/uploads/2010/09/overcapacity.png"><img loading="lazy" decoding="async" class="aligncenter size-full wp-image-1326" title="Overcapacity" src="/wp-content/uploads/2010/09/overcapacity.png" alt="" width="405" height="210" srcset="https://www.smalsresearch.be/wp-content/uploads/2010/09/overcapacity.png 405w, https://www.smalsresearch.be/wp-content/uploads/2010/09/overcapacity-300x155.png 300w" sizes="auto, (max-width: 405px) 100vw, 405px" /></a>Bovendien worden de doorlooptijden worden verminderd door de snelle provisioning en kan de administratieve en support kost worden verminderd doordat deze kost nu bij de leverancier ligt.  SaaS gebruikt meestal de nieuwste Web 2.0 technologieën. Zo kan de samenwerking binnen het bedrijf verhoogd worden door geïntegreerde collaboratie-tools (bv. Google Apps).  Last but not least kan het gebruik van “cloud” technieken (vooral op vlak van governance) de efficiëntie van de huidige processen verhogen.</p>
<h3 style="text-align: justify;">3. Focus op de kernactiviteiten</h3>
<p style="text-align: justify;">Doordat bijkomstige activiteiten naar de cloud verschoven worden (bv. enquêtes ontwerpen met SurveyMonkey), kan de organisatie kan beter gestroomlijnd worden doordat ze eenvoudiger wordt.</p>
<p style="text-align: justify;">
<h2 style="text-align: justify;">Conclusie</h2>
<p style="text-align: justify;">Cloud Computing biedt enorm interessante mogelijkheden, zowel op functioneel als op kostenvlak.  Op huidig moment echter, is het business model van de cloud en van de enterprise wereld nog niet goed op elkaar afgesteld.  Onthoud dat:</p>
<ul>
<li>vooral de <strong>flexibiliteit</strong> van de cloud interessant is;</li>
<li><strong>SaaS</strong> over het algemeen <strong>meer besparing oplevert dan PaaS en Iaas</strong>, maar ook meer aanpassing vereist;</li>
<li>de <strong>verborgen kosten</strong> goed in rekening gebracht moeten worden.</li>
</ul>
<p style="text-align: justify;">
<div id="_mcePaste" style="overflow: hidden; position: absolute; left: -10000px; top: 0px; width: 1px; height: 1px;">
<p><!--[if gte mso 9]><xml> <w:WordDocument> <w:View>Normal</w:View> <w:Zoom>0</w:Zoom> <w:Compatibility> <w:BreakWrappedTables /> <w:SnapToGridInCell /> <w:WrapTextWithPunct /> <w:UseAsianBreakRules /> </w:Compatibility> <w:BrowserLevel>MicrosoftInternetExplorer4</w:BrowserLevel> </w:WordDocument> </xml><![endif]--><!--[if gte mso 10]> <mce:style><!   /* Style Definitions */  table.MsoNormalTable 	{mso-style-name:"Table Normal"; 	mso-tstyle-rowband-size:0; 	mso-tstyle-colband-size:0; 	mso-style-noshow:yes; 	mso-style-parent:""; 	mso-padding-alt:0cm 5.4pt 0cm 5.4pt; 	mso-para-margin:0cm; 	mso-para-margin-bottom:.0001pt; 	mso-pagination:widow-orphan; 	font-size:10.0pt; 	font-family:"Times New Roman";} --> <!--[endif]--></p>
<p class="MsoBodyText" style="margin-left: 181.05pt; text-indent: -18pt;"><span style="font-family: Symbol;" lang="NL-BE">·<span style="font-family: &amp;amp;amp; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;"> </span></span><span lang="NL-BE">ze korting krijgen op hardware, elektriciteit, bandbreedte, software, etc… door de grote afname;</span></p>
<p class="MsoBodyText" style="margin-left: 181.05pt; text-indent: -18pt;"><span style="font-family: Symbol;" lang="NL-BE">·<span style="font-family: &amp;amp;amp; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;"> </span></span><span lang="NL-BE">doorgedreven hebben geautomatiseerd, gestandaardiseerd &amp; geconsolideerd en manuele maintenance geminimiseerd;</span></p>
<p class="MsoBodyText" style="margin-left: 181.05pt; text-indent: -18pt;"><span style="font-family: Symbol;" lang="NL-BE">·<span style="font-family: &amp;amp;amp; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;"> </span></span><span lang="NL-BE">ze hun resources centraal beheren (bv. horizontale upgrades van software);</span></p>
<p class="MsoBodyText" style="margin-left: 181.05pt; text-indent: -18pt;"><span style="font-family: Symbol;" lang="NL-BE">·<span style="font-family: &amp;amp;amp; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;"> </span></span><span lang="NL-BE">commodity hardware &amp; software gebruiken ipv. dure hardware of aangepaste software;</span></p>
<p class="MsoBodyText" style="margin-left: 181.05pt; text-indent: -18pt;"><span style="font-family: Symbol;" lang="NL-BE">·<span style="font-family: &amp;amp;amp; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;"> </span></span><span lang="NL-BE">ze gebruik kunnen maken van statistische uitmiddeling van de vraag door het grote aantal klanten;</span></p>
<p class="MsoBodyText" style="margin-left: 181.05pt; text-indent: -18pt;"><span style="font-family: Symbol;" lang="NL-BE">·<span style="font-family: &amp;amp;amp; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;"> </span></span><span lang="NL-BE">de kost per feature (bij SaaS) lager is ten gevolge de multi-tenancy;</span></p>
<p class="MsoBodyText" style="margin-left: 181.05pt; text-indent: -18pt;"><span style="font-family: Symbol;" lang="NL-BE">·<span style="font-family: &amp;amp;amp; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;"> </span></span><span lang="NL-BE">ze hun portfolio extreem efficiënt beheren: de cloud leverancier bepaalt het aanbod, niet de klant.</span></p>
</div>
]]></content:encoded>
					
					<wfw:commentRss>https://www.smalsresearch.be/kosten-besparen-in-de-cloud/feed/</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
	</channel>
</rss>
