Podstawą sukcesu w biznesie jest informacja. Takiej dostarcza na przykład baza aptek. Czy baza danych to tylko zgrupowanie informacji? Często tak, ale współczesna statystyka pozwala nam na wyciągnięcie znacznie bogatszej informacji. Przykładowo wykorzystuje się techniki grupowania.
Z możliwości, jakie niesie ze sobą zastosowanie technik grupowania, korzysta przede wszystkim medycyna i biostatystyka oraz przemysł.Techniki grupowania były stosowane w wielu różnych dziedzinach badawczych. Często stosuje je ogólnie pojęta biostatystyka. Na przykład grupowanie chorób, metod leczenia lub symptomów chorób może prowadzić do wielu użytecznych klasyfikacji. W psychiatrii poprawna diagnoza wiązek symptomów takich jak paranoja, schizofrenia itd. jest konieczna do udanej terapii. Mówiąc ogólnie, zawsze gdy potrzebujemy poklasyfikować duży zasób informacji w sensowne grupy, analiza skupień okaże się wartościowym narzędziem.
Przez skupienie rozumie się na ogół zbiór obserwacji „podobnych" do siebie, przy czym obserwacje należące do dwóch różnych skupie ń powinny różnić się między sobą w sposób istotny. Celem analizy skupie ń (ang. cluster analysis) jest organizowanie obserwowanych danych w sensowne struktury lub grupy poprzez analizę podobieństw w obszarach poddanych badaniu. Podobieństwa pomiędzy obiektami zostają wyznaczone na podstawie odpowiedniego wskaźnika lub miary podobieństwa czy też odległości. Alternatywną i bardziej zaawansowaną metodą klasyfikacji wielocechowej jest analiza drzew klasyfikacyjnych. Są to metody służące grupowaniu i klasyfikacji obiektów. Ich celem jest poszukiwanie (eksploracja) "ukrytej" informacji zawartej w danych, której badacz nie ma często świadomości istnienia.