PG平台资讯
分类
一站式企业IT培训提供pg电子网站商
发布日期:2024-02-17 11:48:14
数据挖掘(DataMining)是从大量数据中通过数理统计算法搜索隐藏于其中的信息的过程。它通常被视为数据库知识发现中的一个步骤。数据挖掘技术可以自动或半自动地从大量不完全的、有噪声的、模糊的和随机的数据中,提取出隐含在其中的、事先未知的、但又有潜在有用信息和知识的过程。
数据挖掘涉及多个学科,包括统计学、机器学习、模式识别、人工智能、数据库和可视化技术等。它是通过分析型企业中的重要技术,帮助企业调整市场策略、减少风险并做出正确的决策。
数据挖掘的对象可以是任何类型的数据,如结构化数据、半结构化数据和非结构化数据。数据源可以是关系数据库、数据仓库、文本、多媒体数据、空间数据、时序数据、Web数据等。
从数据仓库、数据湖等中提取与分析任务相关的数据,形成数据集,包括训练集、验证集和测试集。