Sql server 2008数据挖掘功能有什么特性?
Sql server2008发布八年,市场占有一直稳定,这不仅归功于2008的方便易用,还有极高的性价比和2008所特有的功能。那今天小编来说说Sql server 2008数据挖掘这个功能的一些特性。
筛选模型事例:现在,可以将筛选器附加到挖掘模型,并在定型和测试期间应用筛选器。对模型应用筛选器,可以控制用于给模型定型的数据,也更容易评估出模型对数据子集的准确情况。
例如,用户可能想要知道目标邮件模型对于某种收入水平的客户的准确性。可以在创建提升图时对挖掘模型的 Income 列应用筛选器,并仅查看该人口统计的结果。Business Intelligence Development Studio 还提供了新的筛选器编辑器,可帮助生成适用于事例表和嵌套表的复杂条件。
多个挖掘模型的交叉验证:
交叉验证是用于评估数据挖掘模型的准确性的既定方法。在交叉验证中,可反复将挖掘结构数据分为多个子集,生成子集的模型,然后衡量每个分区的模型的准确性。通过查看返回的统计信息,可以确定挖掘模型的可靠程度,并且可以更容易地对比基于相同结构的模型。
数据挖掘设计器的“挖掘准确性图表”视图中可以使用交叉验证。您也可以使用 Analysis Services 存储过程对挖掘结构分区,测试多个挖掘模型,以及生成分析。
若要在 SQL Server 2008 中生成交叉验证报表,请指定挖掘结构和可预测属性,然后指定用于分割事例数据的折叠数。
Analysis Services 将返回一个表,报告各个分区的可能性或均方根误差,以及聚合模型的所有度量值的平均偏差和标准偏差等统计信息。