1.某超市研究销售纪录数据後发現,买啤酒的人很大概率也會购置尿布,這种属于数据挖掘的哪类問題?(A)
3.将原始数据進行集成、变换、维度规约、数值规约是在如下哪個环节的任务?(C)
4.當不懂得数据所带標签時,可以使用哪种技术促使带同类標签的数据与带其他標签的数据相分离?(B)
6.使用交互式的和可视化的技术,對数据進行探索属于数据挖掘的哪一类任务?(A)
7.為数据的总体分布建模;把多维空间划提成组等問題属于数据挖掘的哪一类任务?(B)
8.建立一种模型,通過這個模型根据已知的变量值来预测其他某個变量值属于数据挖掘的哪一类任务?(C)
9.顾客有一种感愛好的模式并且但愿在数据集中找到相似的模式,属于数据挖掘哪一类任务?(A)
12.假设12個销售价格记录组已經排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种措施将它們划提成四個箱。等频(等深)划分時,15在第几种箱子内?(B)
21.熵是為消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是:(B)
22.假设属性income的最大最小值分别是1元和98000元。运用最大最小规范化的措施将属性的值映射到0至1的范围内。對属性income的73600元将被转化為:(D)
23.假定用于分析的数据包括属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題:使用按箱平均值平滑措施對上述数据進行平滑,箱的深度為3。第二個箱子值為:(A)
25.一所大學内的各年龄人数分别為:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:(A)
27.在抽样措施中,當合适的样本容量很难确定期,可以使用的抽样措施是:(D)
D.数据仓库中包括大量的综合数据,這些综合数据會伴随時间的变化不停地進行重新综合.
D.在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式
A.在完毕数据仓库的实行過程中,需要對数据仓库進行多种测试.测试工作中要包括單元测试和系统测试.
C.系统的集成测试需要對数据仓库的所有组件進行大量的功能测试和回归测试.
A.OLAP重要是有关怎样理解汇集的大量不一样的数据.它与OTAP应用程序不一样.
D.OLAP是以数据仓库為基础的,但其最终数据来源与OLTP同样均来自底层的数据库系统,两者面對的顾客是相似的.
36.OLAM技术一般简称為”数据联机分析挖掘”,下面說法對的的是:(D)
A.OLAP和OLAM都基于客户机/服务器模式,只有後者有与顾客的交互性;
D.OLAM服务器通過顾客图形借口接受顾客的分析指令,在元数据的懂得下,對超级立方体作一定的操作.
38.设X={1,2,3}是频繁项集,则可由X产生__(C)__個关联规则。
42.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5個项,采用合并方略,由候选产生過程得到4-项集不包括(C)
49.如下哪些分类措施可以很好地防止样本的不平衡問題,A,KNNB,SVMC,BayesD,神經网络(A)
54.在基于规则分类器的中,根据规则质量的某种度量對规则排序,保证每一种测试记录都是由覆盖它的“最佳的”规格来分类,這种方案称為(B)
56.假如规则集R中不存在两条规则被同一条记录触发,则称规则集R中的规则為(C);
57.假如對属性值的任一组合,R中都存在一条规则加以覆盖,则称规则集R中的规则為(B)
59.假如容許一条记录触发多条分类规则,把每条被触发规则的後件看作是對對应类的一次投票,然後计票确定测试记录的类標号,称為(A)
60.考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主場,而队1取胜的比赛中75%是主場获胜。假如下一場比赛在队1的主場進行队1获胜的概率為(C)
A,神經网络對训练数据中的噪声非常鲁棒B,可以处理冗余特性C,训练ANN是一种很耗時的過程D,至少具有一种隐藏层的多层神經网络
63.简朴地将数据對象集划提成不重叠的子集,使得每個数据對象恰在一种子集中,這种聚类类型称作(B)
64.在基本K均值算法裏,當邻近度函数采用(A)的時候,合适的质心是簇中各點的中位数。
65.(C)是一种观测值,它与其他观测值的差异如此之大,以至于怀疑它是由不一样的机制产生的。
67.检测一元正态分布中的离群點,属于异常检测中的基于(A)的离群點检测。
68.(C)将两個簇的邻近度定义為不一样簇的所有點對的平均逐對邻近度,它是一种凝聚层次聚类技术。
69.(D)将两個簇的邻近度定义為两個簇合并時导致的平方误差的增量,它是一种凝聚层次聚类技术。
71.在基于图的簇评估度量表裏面,假如簇度量為proximity(Ci,C),簇权值為mi,那么它的类型是(C)。
A、基于图的凝聚度B、基于原型的凝聚度C、基于原型的分离度D、基于图的凝聚度和分离度
C、K均值很难处理非球形的簇和不一样大小的簇,DBSCAN可以处理不一样大小和不一样形状的簇。
D、K均值可以发現不是明显分离的簇,即便簇有重叠也可以发現,不過DBSCAN會合并有重叠的簇。
73.如下是哪一种聚类算法的算法流程:①构造k-近来邻图。②使用多层图划分算法划分图。③repeat:合并有关相對互连性和相對靠近性而言,最佳地保持簇的自相似性的簇。④until:不再有可以合并的簇。(C)。
74.考虑這样一种状况:一种對象碰巧与另一种對象相對靠近,但属于不一样的类,由于這两個對象一般不會共享許多近邻,因此应當选择(D)的相似度计算措施。
A、當簇只包括少許数据點,或者数据點近似协线性時,混合模型也能很好地处理。
79.一种對象的离群點得分是该對象周围密度的逆。這是基于(C)的离群點定义。
80.下面有关Jarvis-Patrick(JP)聚类算法的說法不對的的是(D)。
A、JP聚类擅長处理噪声和离群點,并且可以处理不一样大小、形状和密度的簇。
1、数据仓库就是一种面向主題的、集成的、相對稳定的、反应历史变化的数据集合。
2、元数据是描述数据仓库内数据的构造和建立措施的数据,它為访問数据仓库提供了一种信息目录,根据数据用途的不一样可将数据仓库的元数据分為技术元数据和业务元数据两类。
4、多维分析是指以“维”形式组织起来的数据(多维数据集)采用切片、切块、钻取和旋转等多种分析動作,以求剖析数据,使拥护能從不一样角度、不一样侧面观测数据仓库中的数据,從而深入理解多维数据集中的信息。
5、ROLAP是基于关系数据库的OLAP实現,而MOLAP是基于多维数据构造组织的OLAP实現。
6、数据仓库按照其開发過程,其关键环节包括数据抽取、数据存储于管理和数据体現等。
7、数据仓库系统的体系构造根据应用需求的不一样,可以分為如下4种类型:两层架构、独立型数据集合、以来型数据結合和操作型数据存储和逻辑型数据集中和实時数据仓库。
8、操作型数据存储实际上是一种集成的、面向主題的、可更新的、目前值的(不過可“挥发”的)、企业级的、详细的数据库,也叫运行数据存储。
9、“实時数据仓库”认為著源数据系统、决策支持服务和仓库仓库之间以一种靠近实時的速度互换数据和业务规则。
10、從应用的角度看,数据仓库的发展演变可以归纳為5個阶段:以报表為主、以分析為主、以预测模型為主、以运行导向為主和以实時数据仓库和自動决策為主。
2、抽取、转换、加载過程的目的是為决策支持应用提供一种單一的、权威数据源。因此,我們规定ETL過程产生的数据(即调和数据层)是详细的、历史的、规范的、可理解的、即時的和质量可控制的。
3、数据抽取的两個常見类型是静态抽取和增量抽取。静态抽取用于最初填充数据仓库,增量抽取用于進行数据仓库的维护。
4、粒度是對数据仓库中数据的综合程度高下的一种衡量。粒度越小,细节程度越高,综合程度越低,回答查询的种类越多。
5、使用星型模式可以從一定程度上提高查询效率。由于星型模式中数据的组织已經通過预处理,重要数据都在庞大的事实表中。
6、维度表一般又主键、分类层次和描述属性构成。對于主键可以选择两种方式:一种是采用自然键,另一种是采用代理键。
8、数据仓库中存在不一样综合级别的数据。一般把数据提成4個级别:初期细节级、目前细节级、轻度综合级和高度综合级。
1、SQLServerSSAS提供了所有业务数据的同意整合试图,可以作為老式报表、在线分析处理、关键性能指示器记分卡和数据挖掘的基础。
2、数据仓库的概念模型一般采用信息包图法来進行设计,规定将其5個构成部分(包括名称、维度、类别、层次和度量)全面地描述出来。
2024年北京市计从业资财经法规与会计职业道德专项模拟真题练习.doc
中国国家标准 GB/T 4706.30-2024家用和类似用途电器的安全第30部分:厨房机械的特殊要求.pdf
中国国家标准 GB/T 25433-2024密闭式炼胶机炼塑机安全要求.pdf
GB/T 4706.22-2024家用和类似用途电器的安全第22部分:驻立式烤箱灶、灶台、烤箱及类似用途器具的特殊要求.pdf
《GB/T 4706.22-2024家用和类似用途电器的安全第22部分:驻立式烤箱灶、灶台、烤箱及类似用途器具的特殊要求》.pdf
中国国家标准 GB/T 4706.22-2024家用和类似用途电器的安全第22部分:驻立式烤箱灶、灶台、烤箱及类似用途器具的特殊要求.pdf
中国国家标准 GB/T 4706.102-2024家用和类似用途电器的安全第102部分:带嵌装或远置式制冷单元或电动机-压缩机的商用制冷器具和制冰机的特殊要求.pdf
GB/T 4706.43-2024家用和类似用途电器的安全第43部分:投影仪和类似用途器具的特殊要求.pdf
中国国家标准 GB/T 4706.43-2024家用和类似用途电器的安全第43部分:投影仪和类似用途器具的特殊要求.pdf
原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者