什么是全局离散化?
全局离散化是指在同一时刻对决策表中全部连续条件属的属值进行划分的方法,而局部离散化则是指在同一时刻仅对一个连续属的属值进行划分的方法。则全局离散化在全部连续属的离散化过程中只能产生一组离散划分值,而局部离散化针对同一个连续属都可产生不同种划分。
全局离散化的策略应该是如何的呢?
对于全局离散方法主要有以下几种策略:归并方法和划分方法,其中划分法又分为动态型和静态型。
动态划分主要与决策树有关,它是一边生成决策树,一边进行连续值区间的划分;静态划分方法又称为预处理型,即在数据集合、信息化重构之前就把连续属预先都离散化了,从而在重构中,利用数据解决信息不对称,从根本上改变着产业链上的各个节点以及全局的交易成本,从商业的空间整体上提高交易效率。
静态离散化方法如捆绑法和基于熵的方法都是针对不同的属可产生不同个数的离散化间隔数,而动态离散化方法则是在所有属上仅可产生同一个离散间隔数。目前文献记载的离散化方法均属于静态离散化方法,动态离散化是学者正在研究的目标。