Když si kupujete něco v eshopu, často se Vám stane, že e-shop nabídne ještě další zboží, které by se Vám mohlo hodit. Když si například chcete koupit notebook, nabídne Vám e-shop ještě tašku na notebook, klávesnici, myš... Často je to zboží, které se Vám hodí a vy si jej často koupíte - což je samozřejmě to, čeho chce e-shop dosáhnout.
Systém e-shopu totiž dobře pozná, které zboží by Vás mohlo zajímat. Pozná to podle toho, co si kupovali lidé před Vámi. Tedy když si lidé před vámi kupovali k notebooku tašku na notebook, nabídne to systém i Vám.
Takové nabídky zboží jsou velmi efektivní - protože pravděpodobnost, že si takto nabídnuté zboží koupíte, je mnohokrát větší než při náhodném výběru.
Pojďme si takovýto odhad udělat v Excelu. Je to překvapivě jednoduché - systém po uživateli nechce, aby znal logiku výpočtu, stačí zadat data a pochopit výsledky.
Pro výpočet potřebuji dataminingový doplněk v Excelu.
V příkladu použiji demodata dodávaná s doplňkem.
Jedná se o tabulku s objednávkami zákazníků. Zajímá nás v zásadě jen první a třetí sloupec. V prvním je číslo objednávky a ve třetím nakoupené zboží. Všimneme si, že hodnoty v prvním sloupci (čísla objednávky) se opakují - je to logické, protože v rámci jedné objednávky zákazníci nakoupili více druhů zboží.
V menu doplňku kliknu na Associate.
První obrazovka je jen informativní a mohu ji s klidem přeskočit.
V další tabulce pak vybírám z tabulky správné sloupce k analýze. Pro Transaction ID vyberu první sloupec Order Number a pro Item vyberu Product. Tedy v Transaction ID vybírám údaj, který definuje skupinu, do které položka patří, a v Item vyberu to, co vlastně chci analyzovat.
Na další obrazovce nemusím nic měnit, jen kliknu na Dokončit a tím se spustí výpočet, který de facto probíhá ne v Excelu, ale na SQL Serveru (což nám ale může být jedno).
Takto vypadá výsledek:
Než se nad výsledkem zamyslím, přepnu si v Show Show attribute name and value na Show attribute name only. Tím se zbavím slova Exists u všech položek a výsledky jsou přehlednější.
Co mí tedy říká tabulka? Např. Probability 100%, Importance 0,96 a Rule "Classic Vest, HL Road Tire "šipka" Road Tire Tube mi říká, že ten, kdo si koupil současně "Classic Vest" a "HL Road Tire", si s nejvyšší možnou pravděpodobností koupí i "Road Tire Tube". Význam toho pravidla je 0,96, což vychází z toho, kolikrát se tato skutečnost v datech opakuje. Čím vícekrát a číslo je vyšší, tím je toto pravidlo samozřejmě prověřenější a dá se na něj více spoléhat.
Tabulku si mohu vyexportovat do Excelu pro snadnější použití při řízení marketingových kampaní.
Pro jiný pohled na souvislosti se ještě lze podívat do karty Dependency Network - interpretaci výsledků asi není třeba popisovat....
Tabulku si mohu vyexportovat do Excelu pro snadnější použití při řízení marketingových kampaní.
Pro jiný pohled na souvislosti se ještě lze podívat do karty Dependency Network - interpretaci výsledků asi není třeba popisovat....
Musím uznat, že toto jsou informace, které se opravdu hodí znát. Mockrát díky za článek a vlastně za celý váš blog. Už delší dobu totiž plánuji rozjet si vlastní internetový obchod. Jediný problém je v tom, že vytovření e-shopu je něco, co asi prostě sama nezvládnu, takže si na to budu muset někoho najít.
OdpovědětVymazat