Výuka a školení Excelu Výuka a školení Excelu Výuka a školení Excelu
Výuka a školení Excelu Výuka a školení Excelu

středa 12. prosince 2012

Korelace v Excelu

Příklad

Potřebuji posoudit, jestli dvě veličiny mají mezi sebou vztah. Chci například zjistit, jestli:
  • Čerpání lepšího paliva ovlivňuje spotřebu auta
  • Počet prodavačů v prodejně ovlivňuje tržby
  • Počet snědených dortů ovlivňuje objem pasu :)
V našem případě chci zjistit, jestli inzerce v rádiu ovlivňuje tržby mé prodejny. A pokud ano, tak ve kterém rádiu ze dvou zkoumaných je tato závislost větší.
Mám za jednotlivé měsíce informace o tom, kolik jsem zaplatil za reklamu ve dvou rádiích a o tom, kolik jsem (možná i díky reklamě) utržil.

Návod

Spočítám takzvaný korelační koeficient. Koeficient se počítá pro dvě skupiny dat a nabývá hodnoty od -1 do 1.
  • Pokud je korelační koeficient kolem -1, znamená to, že závislost je silná, ale nepřímá. Například vztah výkonnosti počítače a času, za který počítač zpracuje úlohu. Tedy čím vyšší výkon, tím kratší čas.
  • Pokud je korelační koeficient kolem 0, znamená to, že závislost není skoro žádná. Například výkon počítače a jeho barva.
  • Pokud je korelační koeficient kolem 1, znamená to, že závislost je silná a přímá. Například vztah výkonu počítače a počtu úloh, které vyřeší za hodinu. Čím vyšší výkon, tím více úloh.
Je ale třeba si uvědomit, že korelace neříká, že jeden zkoumaný parametr musí nutně ovlivňovat druhý. Mohou být oba ovlivněné něčím jiným. Například prodej zmrzliny se vzájemně neovlivňuje s prodejem slunečníků - obojí je vyvolané teplým počasím - ale korelace by se zřejmě objevila.
V našem případě, sledování reklamy, použiji funkci CORREL. Do té stačí pouze zadat dvě oblasti s daty, u kterých chci zjistit vzájemné závislosti. Výsledkem je korelační koeficient.
V mém případě vyšel korelační koeficient pro jedno rádio 0,783914584 a pro druhé 0,397223044. 
Co to znamená?
Reklama v prvním rádiu zlepšuje mé prodeje více. Možná toto rádio poslouchá moje cílová skupina zákazníků a je pro mě zřejmě výhodnější v něm inzerovat.
Nicméně pozitivně se na prodejích projevuje i rádio číslo dva - proto se možná vyplatí inzerovat v obou.

Kritické meze korelačního koeficientu

Když posuzuji, jestli mezi proměnnými závislost existuje nebo ne, musím zohlednit to, jestli mám dostatek dat. V našem případě si mohu spočítat nebo najít v tabulce
Pokud chci pracovat s devadesátipětiprocentní pravděpodobností a mám 31 hodnot, potřebuji korelační koeficient kolem 36%. Obě moje rádia tento limit překročila (i když druhé jen tak tak). Proto si mohu na 95% být jistý tím, že obě rádia ovlivňují prodeje v mé prodejně.

Žádné komentáře:

Okomentovat