Handling Missing Values in Data Mining Submitted By


 Missing values in Monotone Datasets


Download 304.86 Kb.
Pdf ko'rish
bet5/12
Sana05.01.2022
Hajmi304.86 Kb.
#233746
1   2   3   4   5   6   7   8   9   ...   12
Bog'liq
Article by missing data

 

3.2 Missing values in Monotone Datasets

 

The monotonicity property of classification has many features like it provides information about 



attributes arriving from ordered domains. Also it states that a monotone function of independent 

attributes symbolizes a target variable. We discussed the importance of handling missing values 

in the previous section. In [2] the authors of the paper assume that the missing values are present 



Data Cleaning and Preparation 

Term Paper 

Submitted by: Bhavik Doshi 

 

Page | 5  



 

only  in  conditional  attributes.  If  the  value  of  a  decision  attribute  is  missing  that  we  cannot  get 

enough  information  from the object whereas  if the value of a condition  attribute  is  missing  we 

still  can  retrieve  enough  information  from  the  remaining  attributes  along  with  the  decision 

attribute. Thus ignoring objects with missing values is not a suitable approach as it might lead to 

wrong results. The authors  in  [2] propose an extension of  preprocessing  methods  which  makes 

sure  that  the  final  dataset  is  monotonic.  The  algorithm  computes  the  possible  values  of  the 

interval taking  into consideration  only  fully defined objects  using the  formulas stated  in [1]. If 

the calculated interval contains only one value then we assign the object with the missing value. 

Otherwise, we either ignore the value or fill in the value depending on the conditions. The author 

states many other approaches to fill in missing values in the paper. The above algorithm fills the 

missing values and gives the output as a monotone dataset.  

 

In the case of  noisy data with some  monotone  inconsistencies, the above algorithm can still  be 



applied  but  it  might  not  necessary  result  into  a  monotone  dataset.  But  we  might  decrease  the 

monotone  inconsistencies  by  discarding  objects  where  empty  values  are  calculated.  This  will 

improve the degree of monotonicity of the dataset. In [2] the authors conduct two experiments to 

validate  and  prove  their  methods  but  were  successful  to  some  extent  only.  They  suggest  more 

extensive  experiments  so  as  to  predict  the  accuracy  of  the  monotone  classifier.    Thus  filling 

missing  values  in the context of  monotone datasets can  be done using the  suggested algorithm 

complimented by some preprocessing methods. 


Download 304.86 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   12




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling