Data Mining

Data  Mining :

  • Data  Mining  is  the  process  of  automatically  discovering   useful  information  in  large  data  respositories.
  • Data mining  techniques  are  deployed  to  scour  large  databases  in   order  to  find  novel  and  useful  patterns  that  might  otherwise  remain  unknown.
  • They  also  provide  capabilites  to  predict  the  outcomes  of  a  future  observations, such  as  predicting  whether  a  newly  arrived  customer  will  spend  more  than  $100  at  a  department  store.
  • Not  all  information  discovery  tasks  are  considered  to  be  data  mining.
  • It  is  an  integral  part  of  knowledge  discovery  database (KDD),  which  is  the  overall  process  of  converting  raw data  into  useful  information.
  • The  input  data  can  be  stored  in  a  variety  of  formats  and  may  reside  in  a  centralized  data  repository or  be  distrubuted  across ,multiple  sites.
  • The  purpose  of  preprocessing  is  to  transform  the  raw input  data  into  an appropriate  format  for  subsequent  analysis.
  • Data  preprocessing  is  perhaps  the  most  laborious  and  time-consuming  step  in  the  overall  knowledge  discovery  process.     
Posted on by