PG电子【中国】平台网站 - PG SOFT

2024年商业经济行业技能考试-数PG平台 电子据挖掘工程师笔试考试历年真题荟萃含答案docx|PG电子平台
× 快速导航
PG平台资讯
分类
2024年商业经济行业技能考试-数PG平台 电子据挖掘工程师笔试考试历年真题荟萃含答案docx
发布日期:2024-07-06 06:14:06

  1.使用星型模式可以从一定程度上()查询效率。因为星型模式中数据的组织已经经过预处理,主要数据都在庞大的事实表中。

  3.()将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量,它是一种凝聚层次聚类技术。

  5.先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。

  7.在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法有:()。

  9.下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是()。

  11.考虑值集{12,24,33,2,4,55,68,26},其四分位数极差是:()。

  15.从应用的角度看,数据仓库的发展演变可以归纳为5个阶段:以报表为主、()、以预测模型为主、以运营导向为主和以实时数据仓库和自动决策为主。

  18.假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用按箱平均值平滑对以上数据进行平滑,箱的深度为3。解释你的步骤。评论对于给定的数据,该技术的效果。 (b)对于数据平滑,还有哪些其它方法?

  28.如果对属性值的任一组合,R中都存在一条规则加以覆盖,则称规则集R中的规则为()。

  29.数据仓库按照其开发过程,其关键环节包括()、数据存储于管理和数据表现等。

  30.如果规则不满足置信度阈值,则形如的规则一定也不满足置信度阈值,其中是X的子集。

  33.如果允许一条记录触发多条分类规则,把每条被触发规则的后件看作是对相应类的一次投票,然后计票确定测试记录的类标号,称为()。

  36.建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?()

  40.下表中列出了4个点的两个最近邻。使用SNN相似度定义,计算每对点之间的SNN相似度。

  41.对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。

  43.一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,PG电子平台四年级110人。则年级属性的众数是:()。

  44.在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:()。

  45.“实时数据仓库”以为着源数据系统、决策支持服务和仓库仓库之间以一个()的速度交换数据和业务规则。

  46.数据仓库的多维数据模型可以有三种不同的形式,分别是:()、()和()

  49.数据仓库的数据量通常较大,且数据一般很少更新,可以通过设计和优化()结构来提高数据存取性能。

  50.给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。

  A、OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同

  D、OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的

  52.根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。

  53.一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。

  60.在数据挖掘中,常用的聚类算法包括:()、()、()、基于网格的方法和基于模型的方法。

  65.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。

  66.关于数据仓库的设计,四种不同的视图必须考虑,分别是:()、()、()、PG电子平台()

  68.在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法。

  69.以下是哪一个聚类算法的算法流程()。 ①构造k-最近邻图。 ②使用多层图划分算法划分图。 ③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。 ④until:不再有可以合并的簇。

  74.数据仓库就是一个面向主题的、集成的、()、反映历史变化的数据集合。

  1.关于OLAP的特性,下面正确的是:()。 (1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性

  3.在基于图的簇评估度量表里面,如果簇度量为proximity(Ci,C),簇权值为mi,那么它的类型是()。

  4.考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。

  7.什么是用户信息需求表(信息包图法)?它为什么适用于数据仓库的概念模型的设计?

  10.多维分析是指以“维”形式组织起来的数据采取切片、切块、()和旋转等各种分析动作,以求剖析数据,使拥护能从不同角度、不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。

  11.数据仓库数据库常见的存储优化方法包括()、反向规范化引入冗余、表的物理分割。

  12.什么是聚类?简单描述如下的聚类方法:划分方法,层次方法,基于密度的方法,基于模型的方法。为每类方法给出例子。

  2024年医学高级职称-核医学与技术(医学高级)笔试考试历年真题荟萃含答案.docx

  2024年医学高级职称-环境卫生(医学高级)笔试考试历年真题荟萃含答案.docx

  2024年医学高级职称-病案信息技术(医学高级)笔试考试历年真题荟萃含答案.docx

  2024年医学高级职称-神经内科(医学高级)笔试考试历年真题荟萃含答案.docx

  2024年医学高级职称-神经病学(医学高级)笔试考试历年真题荟萃含答案.docx

  2024年医学高级职称-老年医学(医学高级)笔试考试历年真题荟萃含答案.docx

  2024年医学高级职称-营养与食品卫生(医学高级)笔试考试历年真题荟萃含答案.docx

  2024年医学高级职称-超声医学与技术(医学高级)笔试考试历年真题荟萃含答案.docx

  2024年医学高级职称-风湿病(医学高级)笔试考试历年真题荟萃含答案.docx

  2024年医药卫生技能鉴定考试-中药购销员笔试考试历年真题荟萃含答案.docx

  最新人教九年级英语上册《Unit 6 When was it invented(全单元)》精品课件.pptx

  原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者