spContent=数据挖掘是近十几年来大数据、人工智能行业飞速发展最重要的驱动技术之一,当前大数据分析几乎都离不开数据挖掘技术,因此掌握数据挖掘的相关知识技能对于学生当下就业和未来深造都有重要意义。 本课程面向计算机、管理科学与工程、系统工程相关专业高年级本科生或低年级研究生,课程深入数据挖掘技术基础,紧跟数据科学pg电子网站前沿,使得学生既能够掌握数据挖掘算法的基本原理、关键技术,又使学生知道如何使用数据。此外,课程引入最新的数据挖掘案例,使得学生掌握如何通过了解数据、数据预处理、数据模式挖掘来解决现实中的数据挖掘案例。教学内容的组织与实施上,使用片段式的教学,每个知识点为一个教学片段,每个片段时长为10-25分钟。教学内容尤其是教学视频的制作上,运用信息技术将教师授课场景、ppt、动画、视频等实现动态最优组合合成,并采用视频交互模式实现,提高视觉效果和学习体验。
1.数据挖掘是近十几年来大数据、人工智能行业飞速发展最重要的驱动技术之一,当前大数据分析几乎都离不开数据挖掘技术,应用广泛,是业界所需;
2.数据挖掘集合了概率统计、机器学习、人工智能、数据可视化、算法等等多门计算机领域核心知识,是信息技术研究的重要领域;
2.注重技术实践,将经典案例融入到数据挖掘课程教学中,提高课程学以致用的效果;
3.重视基础知识,将数据挖掘知识与概率统计、机器学习、算法等底层核心知识融会贯通。
A :课程教材为2022年机械工业出版社最新发布《数据挖掘原理与应用》。
A :课程代码和数据集已上传到9.1.1分类实践任务起点的“实践项目代码及数据”资源中,可以在此下载相关的压缩包资源。
A :课程历年考试试题已上传到9.1.1分类实践任务起点的“课程历年考试试题”资源中,可以在此下载相关的压缩包资源。
A :python学习相关的代码和数据集已上传到9.3.5 KNN 分类实践的“python学习相关资料”资源中,可以在此下载相关的压缩包资源。
A :大数据、深度学习等相关资源已上传到12.2 随机森林分类的“课程其他可参考PPT资源”资源中,可以在此下载相关的压缩包资源。
A :在课程制作过程中,尽可能利于易懂的案例驱动课程讲解,本课程希望同学们能够培养数据科学思维,因此,本课程学习对基础要求不高。但如果同学们后期进一步深入研究数据挖掘,建议同学们学习好高等数学、线性代数、概率统计等数学课程。
Q:第2.认识数据之2.3 pg电子网站数据相似性章节中,4.4 数值属性的近邻性度量中,案例中的欧式距离计算表,表格中的计算有误。
A :欧式距离示意中,为二维数据,该ppt中的结果计算有误,比如第一条数据(1,2),第二条数据(3,5),欧式距离为√[(1-3)^2+(2-5)^2]=3.606。
A :熵越大,说明数据越混乱,分类能力就越差。在构造决策树的时候,尽量把分类能力好的属性做为上层节点,上层节点的熵值较小,所以使得信息增益(原始的熵值减去现在的熵值)较大。所以此处不要把信息增益跟熵值混淆了。
Q:ReLU激活函数为什么会导致神经元死亡呢?降低学习率是如何缓解这个问题的呢?
A :神经网络在接受异于常值输入时易导致反向传播中的大梯度效应,而这往往是学习率过载所致,最终神经元参数陷入无限循环,损失函数常导为0,而解决方法中降低学习率最为可靠,此外,也可通过优化算法策略动态调整学习率或Leaky Relu保证激活函数在小于0时也能实现非0输出。
由高教社联手网易推出,让每一个有提升愿望的用户能够学到中国知名高校的课程,并获得认证。