首先提出了给定相关数据集后,挖掘关联规则就是产生支持度和置信度分别大于用户给定的最小支持度和最小置信度的关联规则算法。文献<21>讨论了一种不产生候选的快速频繁模式挖掘算法。在此基础上本文提出了一种基于标准SQL的改进的Apriori算法。
产生频繁项目集在事务数据库中,项的集合称为项集,包含k个项的项集称为候选k项集,即Ck.如果项集满足最小支持度,则称它为频繁项集,即Lk.对事务数据库(此处采用access数据库)改进Apriori算法的步骤(1)由事务数据库得到项目数据表item及tranadd表。创建L1.(2)利用Hash技术产生频繁2项目集L2.(3)当Lk为空时转到(6),否则令k=k+1,由Lk-1产生候选k项集Ck.(4)如果Ck为空则转到(6),否则产生频繁项目集Lk=CREATE-频繁项集(k)。(5)转到(3)。(6)生成强关联规则。
应用关联规则的数据挖掘算法修正权重修正前机组的竞争能力机组是电力市场短期交易中的供给方,其竞争指标能够评价其在市场环境中的竞争能力大小。本文建议采用市场需求水平等10种因素做为机组竞争指标,如所示。对于各机组竞争能力的评价可分为“很强”等7个等级,各等级可被视为一个模糊向量,其中包括从“3”到“+3”的7种评语,如示。
对不合理的权重进行重新设置的算法步骤为:(1)运行改进的Apriori算法,发现最大频繁项目集。(2)把所有最大频繁项目集L分为L1和L2,且满足L1∪L2=L,L1∩L2=φ。其中:L1为当前合理的最大频繁项目集;L2为不合理的最大频繁项目集。一般情况下,L1远远大于L2.(3)参照L1重新设置L2的权重值,直到L2=φ。重新调整权重后,对6台机组重新进行评判的结果如所示。比较和可知,的结果更具有科学性且更符合实际。
结论本文提出了一种基于改进的数据挖掘关联规则修正的模糊综合评判方法,并将其应用于评估电力市场中的发电机组竞争能力。该方法在制定交易计划及评估发电机组潜在的市场力时充分考虑了市场环境下的机组特征,因此是一种可行、有效的模糊综合评判方法。
本文虽然仅以评判发电机组的竞争力为例说明所提出的方法,但该方法可推广应用于任何通过权重设置进行多因素评判的决策问题。后续的研究工作将考虑市场环境下的多种更实际的因素,并将基于数据挖掘的模糊综合评判方法和风险评估方法相结合,建立一套评估市场参与各方竞争能力特征的新体系。