Ano ang Eksaktong Ay 'Big Data'?

At Bakit Mahalaga Ito?

'Big data' ay ang bagong agham ng pag-unawa at panghuhula ng pag-uugali ng tao sa pamamagitan ng pag-aaral ng mga malalaking volume ng hindi natukoy na data. Ang malaking data ay kilala rin bilang 'predictive analytics'.

Ang pagsusuri sa mga post sa Twitter, mga feed sa Facebook, mga paghahanap sa eBay, GPS tracker, at ATM machine ay ilang mga malaking data na halimbawa. Ang pag-aaral ng mga video ng seguridad, data ng trapiko, mga pattern ng panahon, pagdating ng paglipad, mga tala ng cell phone tower, at mga tracker ng rate ng puso ay iba pang mga anyo. Ang malaking data ay isang magulong bagong agham na nagbabago linggu-linggo, at ilan lamang sa mga eksperto ang nauunawaan ang lahat ng ito.

Ano ang ilang mga halimbawa ng malaking data sa regular na buhay?

screenshot http://project.wnyc.org/transit-time

Habang ang karamihan sa mga proyektong malaking data ay napakaliit, may mga matagumpay na halimbawa ng malaking data na nakakaapekto sa pang-araw-araw na buhay ng mga indibidwal, kumpanya, at pamahalaan:

Sa pag -aaral ng data sa socio-pampulitika, klima at klima, at data ng ospital / klinikal, ang mga siyentipiko na ito ay hinuhulaan na ngayon ang dengue fever outbreak na may 4 linggo paunang abiso.

Homicide Watch: ang mga proyektong ito sa proyektong proyektong ito ay mga biktima ng pagpatay, suspek, at mga kriminal sa Washington, DC. Parehong bilang isang paraan upang igalang ang namatay at bilang mapagkukunan ng kamalayan para sa mga tao, ang malaking proyekto ng data na ito ay kamangha-manghang.

Pagpaplano ng Transit sa Paglalakbay, NYC: Ang programmer ng radio ng WNYC na si Steve Melendez na pinagsama ang iskedyul ng online na subway na may travel itinerary software. Ang kanyang paglikha ay nagbibigay-daan sa mga taga-New York na mag-click sa kanilang lokasyon sa mapa, at ang hula ng oras ng paglalakbay para sa mga tren at subway ay lilitaw.

Ang Xerox ay nagbawas ng kanilang pagkawala ng trabaho: ang trabaho sa call center ay emosyonal na nakakapagod. Ang Xerox ay nag-aral ng mga reams ng data sa tulong ng mga propesyonal na analyst, at ngayon maaari nilang mahuhulaan kung aling call center ang mga hires ay malamang na manatili sa kumpanya ang pinakamahabang.

Pagsuporta sa kontra-terorismo: sa pamamagitan ng pag-aaral sa social media, mga rekord sa pananalapi, pagpapareserba sa paglipad, at data ng seguridad, ang tagapagpatupad ng batas ay maaaring mahuhulaan at makahanap ng mga suspect ng terorista bago nila gawin ang kanilang masasamang gawa.

Pagsasaayos ng tatak sa pagmemerkado batay sa mga review ng social media : ang mga tao ay bluntly at mabilis na nagbabahagi ng kanilang mga online na saloobin sa isang pub, restaurant, o fitness club. Posibleng pag-aralan ang mga milyun-milyong post ng social media at magbigay ng feedback sa kumpanya sa kung ano ang iniisip ng mga tao sa kanilang mga serbisyo.

Sino ang Gumagamit ng Big Data? Ano ang Ginagawa Nila Nito?

Maraming mga monolitikong korporasyon ang gumagamit ng malaking data upang ayusin ang kanilang mga handog at mga presyo upang mapakinabangan ang kasiyahan ng customer.

Bakit Napakalaking Deal ang Big Data?

4 na bagay ang gumawa ng malaking data na makabuluhang:

1. Ang data ay napakalaking. Hindi ito magkasya sa isang solong hard drive , mas mababa ang USB stick . Ang dami ng data ay lumampas sa kung ano ang maaaring isipin ng isip ng tao (isipin ang isang bilyong bilyong megabytes, at pagkatapos ay i-multiply na sa pamamagitan ng mas maraming bilyon).

2. Ang data ay marumi at walang kapintasan. 50% hanggang 80% ng malaking data ng trabaho ay nagko-convert at nililinis ang impormasyon nang sa gayon ay mahahanap at mababasa. Lamang ng ilang libong eksperto sa ating planeta ang lubos na nakakaalam kung paano gawin ang paglilinis ng data na ito. Ang mga eksperto ay kailangan din ng mga espesyal na tool, tulad ng HPE at Hadoop, upang gawin ang kanilang mga craft. Marahil sa loob ng 10 taon, ang mga dami ng mga eksperto sa data ay magiging isang dosenang isang dosenang, ngunit sa ngayon, ang mga ito ay isang napakabihirang uri ng analyst at ang kanilang gawain ay napakaliit at nakakapagod.

3. Ang data ay naging isang kalakal ** na maaaring ibenta at binili. May mga marketplaces ng data kung saan maaaring bumili ng mga kumpanya at indibidwal ang terabytes ng social media at iba pang data. Karamihan sa data ay batay sa ulap, dahil ito ay masyadong malaki upang magkasya sa anumang solong hard disk. Karaniwang nagsasangkot ang pagbili ng data ng isang bayad sa subscription kung saan ka nag-plug sa isang server ng cloud server.

** Ang mga lider ng malaking mga tool at ideya ng data ay Amazon, Google, Facebook, at Yahoo. Dahil ang mga kumpanyang ito ay nagsisilbi ng maraming milyun-milyong tao sa kanilang mga serbisyong online, makatuwiran na magiging ang puntong pangongolekta at ang mga visionary sa likod ng malaking analytics ng data.

4. Ang mga posibilidad ng malaking data ay walang hanggan. Marahil ang mga doktor ay magtuturo sa isang araw ng mga atake sa puso at mga stroke para sa mga indibidwal na linggo bago sila mangyari. Maaaring mabawasan ang pag-crash ng eroplano at sasakyan sa pamamagitan ng mga predictive na pag-aaral ng kanilang mekanikal na data at trapiko at mga pattern ng panahon. Maaaring mapabuti ang online na pakikipag-date sa pamamagitan ng pagkakaroon ng mga malaking prediktor ng data kung sino ang mga katugmang personalidad para sa iyo. Ang mga musikero ay maaaring makakuha ng pananaw sa kung anong komposisyon ng musika ang pinaka-kasiya-siya sa pagbabago ng mga kagustuhan ng mga target audience. Maaaring mahulaan ng mga nutrisyonista kung aling kumbinasyon ng mga pagkain na binibili ng tindahan ay magpapalubha o makakatulong sa mga kondisyong medikal ng isang tao. Ang ibabaw ay lamang na scratched, at discoveries sa malaking data na mangyayari sa bawat linggo.

Malaking Data ay Maraming

Monty Rakusen / Getty

Ang malaking data ay predictive analytics: ang pag-convert ng napakalaking unstructured data sa isang bagay na nahahanap at sortable. Ito ay isang kalat at magulong space na nangangailangan ng isang espesyal na uri ng kaalaman at pasensya.

Kuning halimbawa ang serbisyo ng paghahatid ng monolitikang UPS. Ang mga programmer sa UPS pag-aaral ng data mula sa kanilang mga driver ng GPS at smartphone upang pag-aralan ang pinaka mahusay na paraan upang umangkop sa kasikipan ng trapiko. Ang GPS at smartphone data na ito ay napakalaking, at hindi awtomatikong handa para sa pagtatasa. Nagbubuhos ang data na ito mula sa iba't ibang mga database ng GPS at mapa, sa pamamagitan ng iba't ibang mga smartphone hardware device. Ang mga analyst ng UPS ay gumugol ng mga buwan na nagko-convert ang lahat ng data na iyon sa isang format na maaaring madaling hanapin at pinagsunod-sunod. Gayunpaman, sulit ang pagsisikap na ito. Sa ngayon, na-save na ng UPS ang higit sa 8 milyong gallons ng gasolina dahil sinimulan nilang gamitin ang malaking analytics ng data.

Dahil ang malaking data ay marumi at nangangailangan ng labis na pagsisikap sa paglilinis at maghanda para sa paggamit, ang mga siyentipiko ng data ay naging palayaw na 'data janitors' para sa lahat ng nakakapagod na gawain na ginagawa nila. Gg

Ang agham ng malaking data at predictive analytics ay pagpapabuti sa bawat linggo, bagaman. Inaasahan ang malaking data upang maging madaling ma-access sa lahat sa taong 2025.

Hindi ba Big Data Isang Mapang-insulto Banta sa Privacy?

Feingersh / Getty

Oo, kung hindi maingat na pinamamahalaan ang aming mga batas at indibidwal na panlaban sa privacy, ang malaking data ay nakakaapekto sa personal na privacy. Tulad ng ibig sabihin nito, sinusubaybayan ng Google at YouTube at Facebook ang iyong pang-araw-araw na online na mga gawi . Ang iyong smartphone at buhay ng computing ay nag-iiwan ng mga digital footprints araw-araw, at ang mga sopistikadong kumpanya ay nag-aaral sa mga yapak.

Ang mga batas sa paligid ng malaking data ay umuusbong. Ang pagiging pribado ay isang estado ng pagiging dapat mong gawin ngayon ang personal na responsibilidad para sa, dahil hindi mo na ito asahan bilang isang default na karapatan.

Ano ang maaari mong gawin upang protektahan ang iyong privacy:

Ang pinakamalaking solong hakbang na maaari mong gawin ay ang balabal ang iyong pang-araw-araw na mga gawi gamit ang isang koneksyon sa network ng VPN . Ang isang serbisyo ng VPN ay mag-aagawan ng iyong signal upang ang iyong pagkakakilanlan at lokasyon ay hindi bababa sa bahagyang lihim mula sa mga tracker. Hindi ito gagawin sa iyo ng 100% anonymous, ngunit isang VPN ay kalahatan bawasan kung magkano ang mundo ay maaaring obserbahan ang iyong mga online na mga gawi.

Saan ako Makatututo ng Higit Pa Tungkol sa Malaking Data?

Monty Raskusen / Getty

Ang malaking data ay isang kamangha-manghang bagay para sa mga taong may mga analytic mind at isang pag-ibig para sa tech. Kung ganoon ka, pagkatapos ay talagang bisitahin ang pahinang ito ng mga kagiliw-giliw na malaking proyekto ng data.