Agham

Ano ang pagmimina ng data? »Ang kahulugan at kahulugan nito

Anonim

Ang data mining o data mining ay ang proseso ng pag-uuri sa pamamagitan ng malalaking set ng data upang makilala ang mga pattern at magtatag ng mga ugnayan upang malutas ang mga problema sa pamamagitan ng data analysis. Pinapayagan ng mga tool sa pagmimina ng data ang mga kumpanya na mahulaan ang mga uso sa hinaharap.

Sa pagmimina ng data, ang mga patakaran ng asosasyon ay nilikha sa pamamagitan ng pag-aaral ng data para sa madalas na mga pattern, gamit ang pamantayan ng suporta at kumpiyansa upang mahanap ang pinakamahalagang mga ugnayan sa loob ng data. Ang suporta ay ang dalas kung saan lilitaw ang mga item sa database, habang ang kumpiyansa ay ang bilang ng mga beses na eksaktong ang mga pahayag.

Kasama sa iba pang mga parameter ng pagmimina ng data ang Pagsunud-sunod ng Pagsunud-sunod o Ruta, Pag-uuri, Pag-cluster, at Pagtataya. Ang mga parameter ng Pagsunud-sunod ng Sequence o Path ay naghahanap ng mga pattern kung saan humantong ang isang kaganapan sa isa pang kasunod na kaganapan. Ang pagkakasunud-sunod ay isang order na listahan ng mga hanay ng item at isang pangkaraniwang uri ng istraktura ng data na matatagpuan sa maraming mga database. Ang isang parameter ng pag-uuri ay naghahanap ng mga bagong pattern at maaaring magresulta sa isang pagbabago sa paraan ng pag-oayos ng data. Ang mga algorithm ng pag-uuri ay hinuhulaan ang mga variable batay sa iba pang mga kadahilanan sa loob ng database.

Ang mga parameter ng pagpapangkat ay biswal na hanapin at idokumento ang mga pangkat ng dati nang hindi kilalang mga katotohanan. Pinangkat ng pangkat ang isang hanay ng mga bagay at pinagsasama-sama ang mga ito batay sa kung gaano sila magkatulad sa bawat isa.

Mayroong iba't ibang mga paraan na maaaring maipalipat ng isang gumagamit ang kumpol, na pinag -iiba ang bawat modelo ng cluster. Ang paghihimok ng mga parameter sa loob ng pagmimina ng data ay maaaring alisan ng takip ng mga pattern sa data na maaaring humantong sa makatuwirang mga hula tungkol sa hinaharap, na kilala rin bilang mahuhulaan na analytics.

Ang mga diskarte sa pagmimina ng data ay ginagamit sa maraming mga lugar ng pagsasaliksik, kabilang ang matematika, cybernetics, genetika, at marketing. Habang ang mga diskarte sa pagmimina ng data ay isang paraan ng paghimok ng kahusayan at hulaan ang pag-uugali ng customer, kung gagamitin nang tama, ang isang negosyo ay maaaring makilala ang sarili mula sa kumpetisyon nito sa pamamagitan ng paggamit ng hula ng analytics.

Ang pagmimina sa web, isang uri ng pagmimina ng data na ginamit sa pamamahala ng ugnayan ng kostumer, isinasama ang impormasyong nakalap ng tradisyunal na mga pamamaraan ng pagmimina ng data at mga diskarte sa web. Nilalayon ng web mining na maunawaan ang pag- uugali ng customer at suriin ang bisa ng isang partikular na website.