Uczenie maszynowe – co to?
Uczenie maszynowe – poddziedzina sztucznej inteligencji – polega na nauczaniu komputerów jak rozpoznawać prawidłowości zachowań na podstawie dostępnych danych, które następnie analizują wyniki i formułują prognozy. Program otrzymuje konkretne informacje i wzory, a następnie nabywa umiejętność analizy nowych danych bez konieczności udziału człowieka w tym procesie.
Koncepcja uczenia maszynowego rozumiana jako odkrywanie wzorców i prognozowania na podstawie danych nie jest nowa, sięga końca lat 50, gdy wynaleziony został perceptron, czyli najprostsza sztuczna sieć neuronowa, która potrafi wskazać przynależność parametrów wejściowych do jednej z dwóch klas, poprzez określenie czy coś należy - czy nie do klasy pierwszej.
Wykorzystywane są tu elementy informatyki, robotyki, matematyki, statystyki i marketingu, a im więcej danych otrzyma maszyna – tym lepsze będą wyniki. Big data oznacza ogromne zbiory różnorodnych i zmiennych danych, które zostają przetwarzane w celu efektywnego wykorzystania zdobytych w ten sposób informacji na dany temat. W IT i marketingu wykorzystanie big data pomaga zrozumieć potrzeby klienta i prawidłowości jego zachowań.
W przeszłości decyzje operacyjne często podejmowane były na podstawie wyników osiągniętych w przeszłości. Uczenie maszynowe wykorzystuje głęboką analitykę do przewidywania tego, co się stanie, dzięki czemu przedsiębiorstwa są w stanie podejmować bardziej perspektywiczne decyzje zamiast wyłącznie polegać na historycznych danych. Na przykład na polu naftowym modele uczenia maszynowego mogą wykrywać sprzęt, który jest zagrożony awarią w najbliższej przyszłości, a następnie powiadamiać o tym ekipy konserwacyjne. Nie tylko zmniejsza to ryzyko dla pracowników, ale też maksymalizuje produktywność i wydajność.
Uczenie maszynowe – wyzwania i zagrożenia
Program, wykorzystując techniki algorytmiczne, może na przykład podpowiedzieć klientowi produkt w oparciu o jego preferencje, ale nie będzie w stanie wytłumaczyć motywacji danej decyzji. Zrozumienie preferencji i zachowań klientów jest niezbędne przede wszystkim dla firm z branży handlu elektronicznego, choć oczywiście ma również zastosowanie w wielu innych branżach. Oznacza to jednak konieczność przetworzenia ogromnej liczby danych, które nie zawsze są uzyskiwane w sposób legalny. Dlatego tak ważne jest dbanie o bezpieczeństwo w Internecie.
Dane wyłudzane są na przykład poprzez obietnicę przesłania darmowej próbki produktu – który tak naprawdę wcale nie jest darmowy, gdyż informacje osobiste podane w formularzu zgłoszeniowym są sprzedawane. Szczególnie uważać należy podczas konieczności skorzystania z publicznych sieci WiFi – podczas logowania do banku lub na Facebooka lepiej skorzystać z transmisji danych komórkowych lub ewentualnie aktywować usługę VPN i zmienić adres IP urządzenia.
Największą zaletą uczenia maszynowego jest możliwość wykorzystania algorytmów do przewidywania wyników. Największa trudność – poza uzyskaniem dostępu do big data – jest zatem dobór lub stworzenie odpowiednich algorytmów. Obecnie istnieją dwa główne typy algorytmów uczenia maszynowego: uczenie nadzorowane i uczenie nienadzorowane.
W przypadku uczenia nadzorowanego ludzki czynnik, czyli analityk danych, działa jako nauczyciel, który uczy maszynę jaki rodzaj wniosków powinien wyciągnąć z otrzymanych informacji. W uczeniu nienadzorowanym komputer uczy się identyfikować procesy i wzorce poprzez obserwację bez ścisłego nadzoru ani jasnych wyznaczników, jakie konkretnie cele powinien osiągnąć.