Výuka a školení Excelu Výuka a školení Excelu Výuka a školení Excelu
Výuka a školení Excelu Výuka a školení Excelu

neděle 3. listopadu 2013

Data mining - vysledování závislostí - doplňování dat do tabulky podle vzoru

V tomto článku popisuji jednu hodně zajímavou funkci Excelu - doplňování dat podle určitých zákonitostí.
Jedná se o funkci založenou na dataminingovém doplňku Excelu. Informace o něm a o jeho instalaci jsou uvedené v tomto článku, který popisuje jinou jeho funkci - analýzu nákupního košíku.
Teď tedy předpokládám, že doplněk je správně nainstalovaný a připravený k použití.

Příklad

Firma nabídla zboží dvaceti zákazníkům. Někteří si jej koupili, někteří ne. Teď má dalších 80 potenciálních zákazníků, a chce odhadnout, jestli si zboží koupí nebo ne.
U všech zákazníků, současných i budoucích, firma sleduje tři charakteristiky - pohlaví, věk a velikost bydliště zákazníka. Předpokládám, že tyto charakteristiky mohou, ale nemusí, mít vliv na rozhodování zákazníka o nákupu.
Skuteční i potenciální zákazníci jsou v jedné tabulce, která vypadá takto. Tedy rozhodnutí o nákupu znám pouze u některých zákazníků.
Tabulku k vyzkoušení si můžete stáhnout zde.

Řešení

Označím celou tabulku a jdu na Vložit / Tabulku. 
Jdu kamkoliv do tabulky. Jdu na kartu Nástroje tabulky / Analyze. Pokud tato karta není k dispozici, nemám zřejmě nainstalovaný dataminingový doplněk, který obsahuje kromě dataminingu i nástroje pro analýzu tabulky.
V kartě Analyze kliknu na Fill from examples.

V následujícím dialogu vyberu, který sloupec obsahuje částečně hodnoty, které chci doplnit. Bere se to tak, že ostatní sloupce obsahují informace, které mohou ovlivnit výsledek. 

Excel se připojí na Analysis Services a chvilku data chroustá. Výpočty, které v tuto chvíli probíhají, jsou vnitřně docela složité - nás ale zajímá jen výsledek.

Výsledky jsou dva. Na novém listu je znázorněné, jak moc který parametr ovlivňuje výsledek.

















  • V našem případě Excel zjistil, že na nákupní rozhodování má vliv pouze pohlaví a věk - bydliště vůbec.
  • Nejvýraznějším faktorem pro nákup je ženské pohlaví zákazníka, a trochu slabší vliv má věk mezi 15 a 28 lety.
  • Faktorem pro odmítnutí nákupu je mužské pohlaví zákazníka.
  • Ideálním zákazníkem, který zřejmě koupí náš produkt, je tedy žena ve mezi patnácti a osmadvaceti.
Kromě toho v původní tabulce přibyl nový sloupec. V něm jsou jednak zopakované hodnoty od zákazníků, kde už byly uvedené, ale kromě toho, a to je hlavní, dopočítané hodnoty u těch zákazníků, kde jsme informaci neměli. Jsou dopočtené podle logiky, kterou měla už známá data - tedy v našem případě je "Koupil" uvedeno hlavně u mladších žen.

A to je celé. 



Žádné komentáře:

Okomentovat