Dlaczego za dużymi danymi przyszłość i ogromne pieniądze

<

Kiedy szukałem interesującego dodatkowego dochodu, który mógłby później stać się głównym, wybór był oczywisty - rynek IT. Dla początkujących jedyną szansą na pokonanie jest czas na wskoczenie do odjeżdżającego pociągu. Stosunkowo nowa i szybko rozwijająca się branża, która wielu z nich przewiduje szczęśliwą przyszłość, to duże dane lub duże zbiory danych. Jak nauczyć się z nimi pracować, dlaczego jest ona w ogóle potrzebna i jakie obietnice - dziś podzielę się z Wami moim doświadczeniem.

Teraz to nie lata dziewięćdziesiąte, a nawet początek zera, kiedy w IT można było wybrać dowolny zawód i osiągnąć sukces. Rynek jest przesycony specjalistami i nie ma powodu, by zaczynać od oczywistej utraty pozycji nadrabiania zaległości. Po kilku godzinach spędzonych w Internecie i dokładnym przyjrzeniu się wszystkim pojawiającym się trendom IT postanowiłem skoncentrować się na dużych danych. Jest to dość młoda technologia, która jest uważana za bardzo obiecującą i popytową w przyszłości, a co najważniejsze - dopiero zaczyna nabierać tempa. Z myślą "Tak, oto jest!". Poszedłem zrozumieć, o co w tym wszystkim chodzi.

Co to są duże dane

Wyrażenie "duże dane" zostało usłyszane przez wszystkich, ale tylko nieliczni włożyli w to odpowiednie znaczenie. W rzeczywistości pojęcie dużych zbiorów łączy nie tylko ilość informacji, ale także technologię jej przetwarzania, a także metody analityczne, dla których wszystko się zaczyna.

Ważną kwestią jest to, że nie ma tylko wielu informacji: jego objętość stale i bardzo szybko rośnie, a dane często są niestrukturalne i heterogeniczne. Należą do nich teksty, obrazy, najróżniejsze statystyki: od odczytów nadających się do noszenia gadżetów i nagrań kamer monitorujących wideo po akcje użytkowników w sieciach społecznościowych. W zasadzie dane mogą być dowolne.

Z przepływu informacji, które na pierwszy rzut oka są zupełnie bez znaczenia, można nie tylko uzyskać przydatne informacje, ale także przewidzieć przyszłe zdarzenia lub zmiany zachowań na ich podstawie. To właśnie jest uważane za główny atut dużych zbiorów danych, dzięki czemu można je stosować w dowolnych obszarach naszego życia.

Jako przykłady możemy przypomnieć badania Google, które w 2009 r. Próbowały przewidzieć rozprzestrzenianie się pandemii grypy w historii zapytań użytkowników oraz Microsoft, który w 2013 r. Był w stanie zidentyfikować skutki uboczne narkotyków przed odpowiednimi autorytetami medycznymi.

Kto potrzebuje dużych danych i dlaczego

Medycyna i nauka są pierwszymi, które przychodzą na myśl, jeśli chodzi o wykorzystanie dużych ilości danych, ale nierealne jest, aby osoba z ulicy mogła wziąć udział w dowolnym projekcie badawczym, co oznacza, że ​​trzeba szukać bardziej masywnych i korzystnych pod względem komercyjnym obszarów. Na szczęście w biznesie i marketingu potrzeba dużych danych nie jest mniejsza. Są bezpośrednio związane z zyskiem, a bardzo dobre pieniądze opłacają ich analizę.

Zdolność przewidywania ludzkich zdarzeń lub zachowań za pomocą dużych danych jest świętym graalem marketingu.

Nie wiedząc o tym, konsumenci generują wiele informacji, które przy odpowiednim przetwarzaniu i analizie stają się potężnym narzędziem wpływu. Właściciele firm mogą w ten sposób zaoszczędzić na reklamie, adresując ją tylko do docelowych odbiorców, media mogą zaoferować użytkownikom interesujące ich treści, a sklepy zwiększą sprzedaż, skłaniając nabywców do pokrewnych produktów.

Jak dotąd tylko nieliczni do tego doszli. Paradoks polega na tym, że ilości danych już zostały zgromadzone i stale rosną, ale jest niewielu specjalistów, którzy mogliby je przeanalizować i wyciągnąć cenne informacje z nieuporządkowanej masy. To gra w nasze ręce, ponieważ można nauczyć się analizowania dużych ilości danych.

Jak zostać specjalistą od dużych danych

Jeśli nie masz sześciu wolnych lat na studia na uniwersytecie (a ja ich nie mam), to jest tylko jedno wyjście: intensywne kursy. Wydanie Google z prośbą o "szkolenie big data w Moskwie" zaprowadziło mnie na stronę projektu edukacyjnego New Professions Lab, gdzie piąty zestaw kursu Big Data Specialist jest już w toku.

Nie lubię teorii i zawsze czekam na praktyczne lekcje, więc pociąga mnie niestandardowy program szkoleniowy, którego celem jest przeniesienie na praktykę. Zgadzam się, o wiele przyjemniej jest rozwiązywać rzeczywiste problemy, a nie nudne przykłady podręczników.

Czego się uczyć

Przez trzy miesiące nauczyciele, którzy mają doświadczenie w dużych firmach, wykorzystają przykłady z życia wzięte, aby nauczyć nas rozwiązywania najczęstszych zadań w świecie wielkich zbiorów danych. Szkolenie podzielone jest na dwa etapy: praca z danymi i praca z systemami rekomendacji.

Pierwszy moduł szczegółowo omawia algorytmy śledzenia zdarzeń i zachowań ludzi w Internecie. Okazuje się, że za ich pomocą można monitorować około 2000 cech, wśród których obok banalnej płci i wieku są osobiste interesy, stan cywilny i wiele więcej.

Drugi moduł przeznaczony jest dla systemów rekomendujących, które są ważną częścią dużych zbiorów danych. Nie zauważamy, ale otaczają nas wszędzie. Sieci społecznościowe oferują znajomych, sklepy internetowe doradzają podobne produkty, a serwisy muzyczne oferują nowych artystów. Prawdziwa korzyść dla ludzi, która wygląda jak magia z zewnątrz, jest w rzeczywistości wynikiem ciężkiej pracy i uczenia maszynowego.

Pełny program kursu z opisem wszystkich lekcji jest nieco onieśmielający dla jego objętości: w końcu będziesz musiał nauczyć się bardzo, bardzo dużo. Jednak biorąc pod uwagę fakt, że teorii towarzyszy wiele praktycznych ćwiczeń, wszystko nie jest takie straszne.

W ciągu zaledwie trzech miesięcy musimy wykonać 12 prac laboratoryjnych, z których każda opiera się na prawdziwych zadaniach.

Od prostych do złożonych nauczycieli nauczą wszystkiego, co może być potrzebne w pracy, a przy pomocy pracy domowej sprawdzą, jak dobrze materiał się uczy.

Wystarczy, że dostroisz się do poważnej pracy. Zaangażowany w trzy razy w tygodniu przez trzy godziny. Dodatkowo musisz znaleźć czas na wykonanie pracy w laboratorium i powtórzenie materiału. Intensywny jest przeznaczony zarówno do zajęć offline, jak i online, więc jest dostępny nie tylko dla Moskali.

Dla mnie ważne jest, aby nie były to dwutygodniowe kursy z przypisaniem bezużytecznego certyfikatu. Program intensywny opracowany jest w taki sposób, aby absolwenci mieli podstawowe doświadczenie w rozwiązywaniu różnorodnych zadań i dostarczaniu wiedzy, która pomoże radzić sobie z pojawiającymi się problemami i rozwijać umiejętności.

Jak zacząć i czego potrzebujesz, aby być w stanie

Następny kurs rozpocznie się 5 października, ale możesz teraz zapisać się. Pozostały czas może posłużyć do zwiększenia wiedzy, ponieważ widz potrzebuje trochę doświadczenia z IT.

Pamiętaj, aby znać Python lub inny język programowania wysokiego poziomu, móc pracować z SQL i nawigować po systemie Linux. Zrozumienie statystyk i teorii prawdopodobieństwa również jest mile widziane. Dla tych, którzy potrzebują tylko odświeżyć tę wiedzę, przed rozpoczęciem kursu głównego będą intensywnie prowadzone na Pythonie, Linuksie i statystykach matematycznych.

Jeśli ty, tak jak ja, nie jesteście w tym wszystkim zbyt silni, lepiej od razu usiąść, aby studiować, ponieważ po rozpoczęciu kursu najprawdopodobniej nie będziecie mieli czasu wolnego, a bez znajomości podstaw nauka nie będzie działać. O tym w Laboratorium Nowych Profesji szczerze ostrzegam natychmiast.


Na pierwszy rzut oka duże dane mogą wydawać się skomplikowane, a proces uczenia się jest czasochłonny, ale gra warta jest kłopotów. To świetna okazja, aby stać się poszukiwanym specjalistą na zyskownym i jak dotąd niezamieszkanym rynku. Czy muszę powiedzieć, że grzech nie może tego użyć?

Cóż, chociaż odświeżam wiedzę Pythona w mojej pamięci, studiuję statystyki i czekam na jesień.

Złóż wniosek o uczestnictwo w intensywnym

<

Popularne Wiadomości