根据现有的心脏病患者和非心脏病患者数据来建立模型，基于该模型诊断新的病人是否为心

考试题库2022-08-02 125

问题根据现有的心脏病患者和非心脏病患者数据来建立模型，基于该模型诊断新的病人是否为心脏病患者，不适于用算法（　　）分析。A.ID3B.K最近邻（KNN）C.支持向量机（SVM）D.K均值（K-means）

选项 A.ID3
B.K最近邻（KNN）
C.支持向量机（SVM）
D.K均值（K-means）

答案 D

解析 ID3算法是由Quinlan首先提出的。该算法是以信息论为基础，以信息熵和信息增益度为衡量标准，从而实现对数据的归纳分类；ID3算法计算每个属性的信息增益，并选取具有最高增益的属性作为给定集合的测试属性。对被选取的测试属性创建一个节点，并以该节点的属性标记，对该属性的每个值创建一个分支据此划分样本。
K最近邻（k-Nearest Neighbor，KNN）分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。该方法的思路是：如果一个样本在特征空间中的k个最相似（即特征空间中最邻近）的样本中的大多数属于某一个类别，则该样本也属于这个类别。KNN算法中，所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。KNN方法虽然从原理上也依赖于极限定理，但在类别决策时，只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近的样本，而不是靠判别类域的方法来确定所属类别的，因此对于类域的交叉或重叠较多的待分样本集来说，KNN方法较其他方法更为适合。KNN算法不仅可以用于分类，还可以用于回归。通过找出一个样本的k个最近邻居，将这些邻居的属性的平均值赋给该样本，就可以得到该样本的属性。更有用的方法是将不同距离的邻居对该样本产生的影响给予不同的权值（weight），如权值与距离成正比（组合函数）。
SVM是一种训练机器学习的算法，可以用于解决分类和回归问题，同时还使用了一种称之为kernel trick的技术进行数据的转换，然后再根据这些转换信息，在可能的输出之中找到一个最优的边界。简单来说，就是做一些非常复杂的数据转换工作，然后根据预定义的标签或者输出进而计算出如何分离用户的数据。
k-Means算法是一种cluster analysis的算法，其主要是来计算数据聚集的算法，主要通过不断地取离种子点最近均值的算法。
根据对选项中四种算法的分析，可以得出k-Means不适合该题干的分类要求。

转载请注明原文地址:https://www.tihaiku.com/congyezige/2419734.html

本试题收录于：中级数据库系统工程师题库软件水平考试初中高级分类

中级数据库系统工程师

软件水平考试初中高级

相关试题推荐

随机试题

最新回复(0)

根据现有的心脏病患者和非心脏病患者数据来建立模型，基于该模型诊断新的病人是否为心

中级数据库系统工程师

软件水平考试初中高级

不同VLAN间数据通信，需通过()进行转发A.HUB B.二层交换机 C

在字长为16位、32位、62位或128位的计算机中，字长为（）位的计算机数据运

计算机数据总线的宽度是指（）。A.通过它一次所能传递的字节数 B.通过它一次所

根据《计算机软件保护条例》的规定，当软件（）后，其软件著作权才能得到保护。A

某市场调研公司对品牌商品销售情况进行调查后，得到下图(a)所示的销量统计数据。将

根据《计算机软件保护条例》的规定，当软件（）后，其软件著作权才能得到保护。A.

根据《计算机软件保护条例》的规定，著作权法保护的计算机软件是指（）。A.程序

根据《计算机软件保护条例》的规定，当软件（）后，其软件著作权才能得到保护。A.

FTP建立（）条TCP连接来进行数据传输，默认情况下数据传输使用的端口号是（请

防火墙对数据包进行过滤时，不能进行过滤的是（）。A.源和目的IP地址 B.

[img]2012q2/ct_epem_epelist_0791_20123[/img][br][originaltext]M:Excuseme,co

Bydegreestheshutterswereopened:thewindow-blindsweredrawnup,andpe

[originaltext]M:So,now,youareoutwithyourlatestnovel.It’scalledQueen

InDowntownLosAngeles,youwillhavetheopportunitytoseetheMusicCente

MusicforMedicineWetakealookatthe

设数组a[1..10，5..15]的元素以行为主序存放，每个元素占用4个存储单元

下列叙述中，错误的是（　　）。A.CPU能直接读取硬盘上的数据 B.CPU能直

沃森和克里克提出的DNA螺旋结构模型每旋转一圈的碱基对数是A.8 B.9 C

电站锅炉，蒸发受热面及炉前系统在启动前必须进行化学清洗。化学清洗结束至锅炉启动时

患儿，2岁，发热3天，流涕、流泪、怕光，当日开始耳后、颈部、面部出现充血性红色斑

根据现有的心脏病患者和非心脏病患者数据来建立模型，基于该模型诊断新的病人是否为心

中级 数据库系统工程师

软件水平考试初中高级

不同VLAN间数据通信，需通过()进行转发A.HUB B.二层交换机 C

在字长为16位、32位、62位或128位的计算机中，字长为（）位的计算机数据运

计算机数据总线的宽度是指（）。A.通过它一次所能传递的字节数 B.通过它一次所

根据《计算机软件保护条例》的规定，当软件（）后，其软件著作权才能得到保护。A

某市场调研公司对品牌商品销售情况进行调查后，得到下图(a)所示的销量统计数据。将

根据《计算机软件保护条例》的规定，当软件（）后，其软件著作权才能得到保护。A.

根据《计算机软件保护条例》的规定，著作权法保护的计算机软件是指（）。A.程序

根据《计算机软件保护条例》的规定，当软件（）后，其软件著作权才能得到保护。A.

FTP建立（）条TCP连接来进行数据传输，默认情况下数据传输使用的端口号是（请

防火墙对数据包进行过滤时，不能进行过滤的是（）。A.源和目的IP地址 B.

[img]2012q2/ct_epem_epelist_0791_20123[/img][br][originaltext]M:Excuseme,co

Bydegreestheshutterswereopened:thewindow-blindsweredrawnup,andpe

[originaltext]M:So,now,youareoutwithyourlatestnovel.It’scalledQueen

InDowntownLosAngeles,youwillhavetheopportunitytoseetheMusicCente

MusicforMedicineWetakealookatthe

设数组a[1..10，5..15]的元素以行为主序存放，每个元素占用4个存储单元

下列叙述中，错误的是（ ）。A.CPU能直接读取硬盘上的数据 B.CPU能直

沃森和克里克提出的DNA螺旋结构模型每旋转一圈的碱基对数是A.8 B.9 C

电站锅炉，蒸发受热面及炉前系统在启动前必须进行化学清洗。化学清洗结束至锅炉启动时

患儿，2岁，发热3天，流涕、流泪、怕光，当日开始耳后、颈部、面部出现充血性红色斑

中级数据库系统工程师

下列叙述中，错误的是（　　）。A.CPU能直接读取硬盘上的数据 B.CPU能直