Ano ang Pagmimina ng Data?

Malalaman ang mga malalaking kumpanya tungkol sa iyo kaysa sa maaari mong isipin - narito kung paano

Ang pagmimina ng data ay ang pagtatasa ng malalaking data upang matuklasan ang mga pattern at kaalaman. Sa katunayan, ang data mining ay kilala rin bilang pagtuklas ng data o pagtuklas ng kaalaman.

Ang pagmimina ng data ay gumagamit ng mga istatistika, mga prinsipyo ng pag-aaral sa makina (ML), artipisyal na katalinuhan (AI), at malawak na dami ng data (kadalasan mula sa mga database o hanay ng data) upang makilala ang mga pattern sa isang paraan na bilang awtomatiko at kapaki-pakinabang hangga't maaari.

Ano ang Pagganap ng Pagmimina?

Ang pagmimina ng data ay may dalawang pangunahing layunin: paglalarawan at hula. Una, ang data mining ay naglalarawan ng mga pananaw at kaalaman na nakuha mula sa pag-aaral ng mga pattern sa data. Pangalawa, ang data mining ay gumagamit ng mga paglalarawan ng mga kinikilalang data pattern upang mahulaan ang mga pattern sa hinaharap.

Halimbawa, kung ginugol mo ang oras sa pagbabasa sa isang shopping website para sa mga libro tungkol sa kung paano makilala ang iba't ibang uri ng mga halaman, ang mga serbisyo ng pagmimina ng data na nagtatrabaho sa likod ng mga eksena sa website na nag-log ng isang paglalarawan ng iyong mga paghahanap na may kaugnayan sa iyong profile. Kapag nag-log in muli ng dalawang linggo mamaya, ginagamit ng mga serbisyo ng pagmimina ng data ng website ang mga paglalarawan ng iyong mga nakaraang paghahanap upang mahulaan ang iyong mga kasalukuyang interes at nag-aalok ng mga personalized na rekomendasyon sa pamimili na kasama ang mga libro tungkol sa pagtukoy ng mga halaman.

Paano Gumagana ang Pagmimina ng Data

Gumagana ang pagmimina ng data gamit ang mga algorithm, mga hanay ng mga tagubilin na nagsasabi sa isang computer o proseso kung paano gumawa ng isang gawain, upang matuklasan ang iba't ibang uri ng mga pattern sa loob ng data. Ang ilan sa iba't ibang paraan ng pagkilala sa pattern na ginagamit sa pagmimina ng datos ay kinabibilangan ng cluster analysis, anomaly detection, asosasyon sa pag-aaral, mga dependency ng datos, mga puno ng desisyon, mga modelo ng pagbabalik, mga klasipikasyon, di-nakikitang detection, at mga neural network.

Habang ginagamit ang data mining upang ilarawan at hulaan ang mga pattern sa lahat ng iba't ibang uri ng data, ang paggamit ng maraming mga tao na nakatagpo ng madalas, kahit na hindi nila napagtanto ito, ay upang ilarawan ang mga pattern sa iyong mga pagpipilian sa pagbili at pag-uugali upang mahulaan ang malamang pagbili sa hinaharap mga desisyon.

Bilang halimbawa, naisip mo ba kung paano laging alam ng Facebook kung ano ang iyong hinahanap sa online at nagpapakita sa iyo ng mga ad sa iyong newsfeed na may kaugnayan sa iba pang mga site na iyong binisita o sa iyong mga paghahanap sa web? Ang pagmimina ng data sa Facebook ay gumagamit ng impormasyon na nakaimbak sa iyong browser na sumusubaybay sa iyong mga aktibidad, tulad ng mga cookies , kasama ang sarili nitong kaalaman sa iyong mga pattern batay sa iyong nakaraang paggamit ng serbisyo ng Facebook upang matuklasan at mahuhulaan ang mga produkto o mga handog na maaaring interesado ka.

Anong Uri ng Data ang Maaaring Mawalan?

Depende sa serbisyo o tindahan (mga pisikal na tindahan ay gumagamit din ng pagmimina ng data), ang isang kamangha-manghang dami ng data tungkol sa iyo at sa iyong mga pattern ay maaaring mina. Maaaring kasama sa datos na nakolekta tungkol sa iyo kung anong uri ng sasakyan ang iyong pinapalakad, kung saan ka nakatira, mga lugar na iyong nilakbay, mga magasin at mga pahayagan na iyong ina-subscribe, at kung ikaw ay hindi kasal. Maaari din itong matukoy kung mayroon o wala kang mga anak, kung ano ang iyong mga libangan, kung saan ang banda na gusto mo, ang iyong mga pampulitikang leanings, kung ano ang iyong binili sa online, kung ano ang iyong binibili sa mga pisikal na tindahan (kadalasan sa pamamagitan ng mga card ng gantimpala ng loyalty ng customer), at anumang mga detalye na iyong ibinabahagi tungkol sa iyong buhay sa social media.

Halimbawa, ang mga nagtitingi at mga pahayagan na nakabatay sa fashion na naka-target sa mga tinedyer ay gumagamit ng mga pananaw mula sa mga larawan ng pagmimina ng data sa mga serbisyo ng social media tulad ng Instagram at Facebook upang mahulaan ang mga uso sa fashion na makukuha sa mga mamimili ng mga mamimili o mga mambabasa. Ang mga pananaw na natuklasan sa pamamagitan ng pagmimina ng data ay maaaring maging tumpak na ang ilang mga tagatingi ay maaaring hulaan kung ang isang babae ay maaaring buntis, batay sa mga tiyak na mga pagbabago sa kanyang mga pagpipilian sa pagbili. Ang retailer, Target, ay iniulat na tumpak sa predicting pagbubuntis batay sa mga pattern sa pagbili ng kasaysayan na nagpapadala ng mga kupon para sa mga produkto ng sanggol sa isang batang babae, na nagbigay ng lihim ng pagbubuntis bago niya sinabi sa kanyang pamilya.

Gayunpaman, ang pagmimina ng data sa lahat ng dako, gayunpaman, ang karamihan sa mga impormasyon na natuklasan at pinag-aralan tungkol sa aming mga gawi sa pagbili, mga personal na kagustuhan, pagpipilian, pondo, at mga online na aktibidad ay ginagamit ng mga tindahan at serbisyo na may intensyong mapahusay ang karanasan ng kostumer.