Data mining, czyli jak wiedzieć więcej
Data mining stanowi jeden z etapów odkrywania wiedzy w bazach danych. Pozwala on wychwycić za pomocą komputera statystycznych zależności i schematów występujących w dużych zbiorach danych. Dzięki wykorzystaniu data miningu można określić np. jakie produkty najczęściej są kupowane razem w danym sklepie.
Data mining (eksploracja danych) to innowacyjna technologia, która pozwala na pozyskanie wielu cennych informacji. Dane, które znajdują się w bazach danych mogą okazać się przydatne w celu ustalenia dalszego kierunku kształtowania sprzedaży. W bazach danych mogą znajdować się informacje o:
- strukturze sprzedaży;
- cechach klientów;
- działalności przedsiębiorstwa.
Wiedza, która jest ukryta, a którą można wykorzystać
Klasycznym przykładem zastosowania data mining stanowi zagadnienie koszyka zakupów. Analiza koszyka zakupów odnosi się do baz danych, w których gromadzone są zapisy dotyczące zakupów klientów danego sklepu. Dla każdego pojedynczej transakcji zakupu zapisane są wszystkie wybrane produkty. Analiza koszyka zakupów ma za zadanie wskazanie w bazie danych zbiorów produktów kupowanych wspólnie. Wiedza taka może być wykorzystana w praktyce np. w celu planowania rozmieszczenia produktów, przeprowadzenia skutecznych kampanii reklamowych czy zwiększenia sprzedaży danego produktu.
Odkryte zależności statystyczne i schematy są przedstawianiu w formie:
- reguł logicznych;
- drzew decyzyjnych;
- sieci neuronowych.
Jak odkryć wiedzę?
Proces odkrywania wiedzy w bazach danych polega na wykorzystaniu wybranych metod uczenia się w celu ujawnienia zachodzącej regularności w danych. Ich jakość ocenia się za pomocą metod statystycznych. Metody odkrywania wiedzy można podzielić w odpowiedzi na rodzaje wiedzy, które odkrywają. Do metod odkrywania wiedzy zalicza się m.in.:
- klasyfikacje – określa stosunek między przynależnością do danej kategorii a ilością i wartością atrybutów;
- zależności przyczynowe – wykazuje zależności przyczynowe między rożnymi atrybutami;
- zależności funkcyjne – wskazuje na to, jakimi wzorcami najlepiej wyrażają się zależności pomiędzy atrybutami o wartościach liczbowych;
- asocjacje – pokazuje wartości atrybutów, które często występują razem w analizowanym zbiorze rekordów.
Data mining pozwala patrzeć bezpiecznie w przyszłość
Data mining wpływa na poprawę jakości produkcji oraz podnosi poziom zysków. Jest to rozwiązanie, któremu warto poświęcić swoją uwagę. Głównym celem data miningu jest wydobycie ukrytej wiedzy z baz danych, co pozwala na tworzenie dalszych realnych planów biznesowych.