PG电子【中国】平台网站 - PG SOFT

数据挖掘过程分为哪几个部分?PG平台 电子|PG电子平台
× 快速导航
PG平台资讯
分类
数据挖掘过程分为哪几个部分?PG平台 电子
发布日期:2024-04-28 07:56:50

  伴随着数据库技术的发展和新应用的提出,数据挖掘技术应运而生。数据挖掘是一种能从海量PG电子平台的、随机的、不完整的、复杂的数据中提取出对人们可能潜在和有用的信息和知识的过程,其中涉及到许多技术的处理。

数据挖掘过程分为哪几个部分?PG平台 电子(图1)

  清晰明确的挖掘目标是进行数据挖掘的前提,同时也是能够最大限度地发挥数据挖掘作用的关键。

  针对数据挖掘目标如何选取样本。在选取样本时有三大原则,即时效性、可靠性和相关性。必须保证选择的样本数据是最新的、真实可靠并且与挖掘目标是高度相关的。同时选择数据的简明性,精选数据。

  进一步对数据进行分析探究,为了保证预测质量需要对选取的样本数据进行探索、审核和必要的加工处理是必要的。

  数据探索主要有:相关分析、异常分析、周期性分析、缺失值分析和样本交叉验证。

数据挖掘过程分为哪几个部分?PG平台 电子(图2)

  由于样本数据量一般较为庞大,数据结构较为复杂,样本数据维度过高,有缺PG电子平台失值,重复记录,不一致等等。对样本进行预处理也是必要的。

  数据预处理之后,开始构建挖掘模型,在建模之前要考虑本次的目标是数据挖掘哪方面的应用,针对具体的应用类别选取合适的算法。

  对数据挖掘的结果进行评价,对其中的不足之处以及可取之处进行总结,并不断改进。