数据挖掘论文 (优选10篇)

时间:2024-12-17 22:57:58
数据挖掘论文 (优选10篇)[此文共26536字]

数据挖掘论文 (优选10篇) 由会员“zhangjun”整理投稿精心推荐,小编希望对你的学习工作能带来参考借鉴作用。

【目录】篇1:数据挖掘论文篇2:数据挖掘论文篇3:数据挖掘论文篇4:数据挖掘论文篇5:数据挖掘论文篇6:数据挖掘论文篇7:数据挖掘论文篇8:数据挖掘论文篇9:数据挖掘论文篇10:数据挖掘论文【正文】

篇1:数据挖掘论文

题目:档案信息管理系统中的计算机数据挖掘技术探讨

摘要:伴随着计算机技术的不断进步和发展,数据挖掘技术成为数据处理工作中的重点技术,能借助相关算法搜索相关信息,在节省人力资本的同时,提高数据检索的实际效率,基于此,被广泛应用在数据密集型行业中。笔者简要分析了计算机数据挖掘技术,并集中阐释了档案信息管理系统计算机数据仓库的建立和技术实现过程,以供参考。

关键词:档案信息管理系统;计算机;数据挖掘技术;

1数据挖掘技术概述

数据挖掘技术就是指在超多随机数据中提取隐含信息,并且将其整合后应用在知识处理体系的技术过程。若是从技术层面判定数据挖掘技术,则需要将其划分在商业数据处理技术中,整合商业数据提取和转化机制,并且建构更加系统化的分析模型和处理机制,从根本上优化商业决策。借助数据挖掘技术能建构完整的数据仓库,满足集成性、时变性以及非易失性等需求,整和数据处理和冗余参数,确保技术框架结构的完整性。

目前,数据挖掘技术常用的工具,如SAS企业的EnterpriseMiner、IBM企业的IntellientMiner以及SPSS企业的Clementine等应用都十分广泛。企业在实际工作过程中,往往会利用数据源和数据预处理工具进行数据定型和更新管理,并且应用聚类分析模块、决策树分析模块以及关联分析算法等,借助数据挖掘技术对相关数据进行处理。

2档案信息管理系统计算机数据仓库的建立

2.1客户需求单元

为了充分发挥档案信息管理系统的优势,要结合客户的实际需求建立完整的处理框架体系。在数据库体系建立中,要适应迭代式处理特征,并且从用户需求出发整合数据模型,保证其建立过程能按照整体规划有序进行,且能按照目标和分析框架参数完成操作。首先,要确立基础性的数据仓库对象,由于是档案信息管理,因此,要集中划分档案数据分析的主题,并且有效录入档案信息,确保满足档案的数据分析需求。其次,要对日常工作中的用户数据进行集中的挖掘处理,从根本上提高数据仓库分析的完整性。

(1)确定数据仓库的基础性用户,其中,主要包括档案工作人员和使用人员,结合不同人员的工作需求建立相应的数据仓库。

(2)档案工作要利用数据分析和档案用户特征分析进行分类描述。

(3)确定档案的基础性分类主题,一般而言,要将文书档案归档状况、卷数等基础性信息作为分类依据。

2.2数据库设计单元

在设计过程中,要针对不同维度建立相应的参数体系和组成结构,并且有效整合组成事实表的主键项目,建立框架结构。

第一,建立事实表。事实表是数据模型的核心单元,主要是记录相关业务和统计数据的表,能整合数据仓库中的信息单元,并且提升多维空间处理效果,确保数据储存过程切实有效。(1)档案管理中文书档案目录卷数事实表:事实表主键,字段类型Int,字段为Id;文书归档年份,字段类型Int,字段为Gdyear_key;文书归档类型,字段类型Int,字段为Ajtm_key;文书归档单位,字段类型Int,字段为Gddw_key;文书档案生成年份,字段类型Int,字段为Ajscsj_key,以及文书档案包括的文件数目。(2)档案管理中文书档案卷数事实表:事实表主键,字段类型Int,字段为Id;文书归档利用日期,字段类型Int,字段为Date_key;文书归档利用单位,字段类型Int,字段为Dw_key;文书归档利用类别,字段类型Int,字段为Dalb_key;文书归档利用年份,字段类型Int,字段为Dayear_key等[1]。

第二,建立维度表,在实际数据仓库建立和运维工作中,提高数据管理效果和水平,确保建立循环和反馈的系统框架体系,并且处理增长过程和完善过程,有效实现数据库模型设计以及相关维护操作。首先,要对模式的基础性维度进行分析并且制作相应的表,主要包括档案年度维表、利用方式维表等。其次,要建构数据库星型模型体系。最后,要集中判定数据库工具,保证数据库平台在客户管理工作方面具备必须的优势,集中制订商务智能解决方案,保证集成环境的稳定性和数据仓库建模的效果,真正提高数据抽取以及转换工作的实际水平。需要注意的是,在全面整合和分析处理数据的过程中,要分离文书档案中的数据,相关操作如下:

deletefromdaggdtemp//删除临时表中的数据

Chcount=dag1.importfile(dbo.uwswj)//将文书目录中数据导出到数据窗口

Dag1.update()//将数据窗口中的数据保存到临时表

相关技术人员要对数据进行有效处理,以保证相关数据合并操作、连接操作以及条件性拆分操作等都能按照数据预处理管理要求合理化进行,从根本上维护数据处理效果。

2.3多维数据模型建立单元

在档案多维数据模型建立的过程中,相关技术人员要判定联机分析处理项目和数据挖掘方案,整合信息系统中的数据源、数据视图、维度参数以及属性参数等,保证具体单元能发挥其实际作用,并且真正发挥档案维表的稳定性、安全性优势。

第一,档案事实表中的数据稳定,事实表是加载和处理档案数据的基本模块,按照档案目录数据表和档案利用状况表分析和判定其类别和归档时间,从而提高数据独立分析水平。一方面,能追加有效的数据,保证数据仓库信息的基本质量,也能追加时间判定标准,能在实际操作中减少扫描整个表浪费的时间,从根本上提高实际效率。另一方面,能删除数据,实现数据更新,检索相关关键词即可。并且也能同时修改数据,维护档案撤出和档案追加的动态化处理效果。

第二,档案维表的安全性。在维表管理工作中,档案参数和数据的安全稳定性十分关键,由于其不会随着时间的推移出现变化,因此,要对其进行合理的处理和协调。维表本身的存储空间较小,尽管结构发生变化的概率不大,但仍会对代表的对象产生影响,这就会使得数据出现动态的变化。对于这种改变,需要借助新维生成的方式进行处理,从而保证不同维表能有效连接,整合正确数据的同时,也能对事实表外键进行分析[2]。

3档案信息管理系统计算机数据仓库的实现

3.1描述需求

随着互联网技术和数据库技术不断进步,要提高档案数字化水平以及完善信息化整合机制,加快数据库管控体系的更新,确保设备存储以及网络环境一体化水平能满足需求,尤其是在档案资源重组和预测项目中,只有从根本上落实数据挖掘体系,才能为后续 ……此处隐藏23512个字……涵和分类

在信息技术的发展下,我国数据库库存容量急剧扩张,在庞大的数据信息中怎样获取有效的数据信息成为相关人员重点思考的问题。数据挖掘能够从技术层面来分析、处理这些数据信息,透过各种分析工具的利用来找到数据信息和模型构建之间的关联,为相关领域的发展带给重要决策支持。在信息挖掘技术的发展下,出现了不同类型的数据挖掘技术和方法。

1.2关联规则挖掘

关联规则挖掘是数据挖掘的重要分支,是常见的数据挖掘方法,主要是对超多数据之间关联问题的发现和分析,在找到数据联系之后决定哪些事件能够一齐发生。数据库中的关联规则描述如下所示:假设I={i1、i2......im}是由m个不同项目组合构成的集合,项的集合是项集,包括k个项集,给定事务D(交易数据库),事务(交易)T从属于数据项(I),T是唯一的标示符。在X属于T的时候,交易T则是包含项集X,关联规则X=Y在交易数据库中成立。

2电力调度自动化系统概述

2.1内涵

电力调度自动化系统能够为电网系统安全、稳定运行带给重要支持,并为相关电力人员工作、决策带给有力信息的支持。电力调度自动化系统的组成如下所示:第一,前置机。前置机能够从RTU从完成数据信息的收集整理工作,并能够结合实际对系统的指令进行接收、解释。第二,主备用服务器。主备泳服务器包括数据库和实时库服务器,是电力调度系统的重要组成部件,能够对系统各个工作站的运行进行监督。第三,网络服务器。网络服务器主要是对数据信息分布和数据表整理工作的监督。第四,卫星钟。卫星钟系统将全球定位时间作为系统时间。第五,物理隔离开关。物理隔离开关能够解决数据的隔离应用问题。

2.2电力调度自动化系统对数据挖掘技术的需求

电力导调度自动化系统对数据挖掘技术的需求具体表此刻以下几个方面:第一,透过数据挖掘技术减少电力调度自动化系统的工作时间,提高工作效率。第二,数据挖掘能够提高数据挖掘技术的管理应用水平,减少外界因素对电力调度自动化的干扰。第三,能够从不同角度对数据信息进行定量、定性分析。第四,为电网报告的分析和制定带给辅助支持。第五,实现了对数据信息的及时查询,为电力调度自动化工作带给了支持。

3基于蚁群算法的周期性关联规则数据挖掘

3.1周期关联规则

周期性关联规则挖掘是时态约束关联规则的一种,适用于对周期性关联的发现层面,比如每年夏季城市居民用电量的均值比其他季节高,城市居民周末用电量平均值比其他周末时间高等。

3.2蚁群算法

蚂蚁的群体行为表现出一种信息正反馈现象,蚁群算法由转移规则和信息素更新规则组成,具体能够描述成:假设平面上有n个城市,n个城市的TSP问题来找到n个城市的最短路径。假设蚁群系统中蚂蚁的数量是m、d(i,j=1,2,…,n),代表的是城市i到城市j之间的距离,b(t)表示t时刻位于城市i的蚂蚁个数。在初始阶段,各个线路上的信息量是对等的,假设τij(0)=c,蚂蚁k在运动的过程中根据信息量来选取下一步所走的方向,t时刻蚂蚁k由城市i转移到城市j的概率表示如(1)所示。

3.3基于蚁群算法的周期性关联规则

假设T1、T2,Tmin为系统时间定义单位组成的时间表达式,都比零大,假设T1<T2,差的绝对值比极小时间值的小,称作T1在T2之前发生。如果T1=T2,差的绝对值和极小时间值相等,则是说明T1和T2同时发生。假设T1,T2是系统时间定义单位组成的时间表达式,都比零大,int=[T1、T2]是T1到T2的时间隔。基于蚁群算法的周期性关联规则操作首先需要对数据集进行分类整理,在时间差表满足数据库要求的状况下将数据集按照时间分成多个分块,并按照时态属性进行升序排列,结合每个类别进行周期性关联规则挖掘,构成多个数据集。其次,对各个分类数据集进行周期性数据挖掘分析、改善。最后,对周期性数据集挖掘的改善。对数据信息进行排列整理,如果两个周期性序列相交,以周期小的为主,在数据的时间跨度内对数据的子集进行截取。

4数据挖掘在电力调度自动化系统中的应用

4.1基于周期性关联规则挖掘的数据分析系统平台

在社会经济的发展下,电力调度自动化系统从原先的实时性监控报表查询系统转变为智能调度自动化系统,高级应用软件的应用促进了电力调度系统朝着智能化的方向发展。基于周期性关联规则挖掘的数据分析系统平台选取微软的平台,在该平台的支持下为电力调度系统运行带给了丰富数据资源的支持,且具备强大的数据库访问潜力。

4.2基于数据桥的数据集成模块设计

在电力调度自动化系统的应用中存在多个标准,这些标准对分布式电力系统发展起到了重要作用,但是在各个数据集成规约不同的影响下,电力企业发展容易出现信息混乱的现象。为了避免这种现象的发生,在数据集成模块中需要进行数据清洗操作。

4.3数据分析功能模块设计

第一,同期数据分析模块。同期数据分析模块一般被人们用在调度自动化数据系统的横纵向比较,透过对同期数据的比对分析能够为电力调度系统数据评估带给更多便利。同期比较分析模块应用了动态生成查询语句,能够对数据信息进行动态化的查询和分析整理。第二,周期性数据分析。周期性数据分析主要是在数据库系统中挖掘具有周期性特点的数据集,从而对数据波动状况进行清晰的反应。在周期性数据分析模块挖掘算法中存在一个最小时间的误差参数,这参数是周期数据集的基础数据,影响周期性数据分析的精确度。第三,数据预警分析。数据预警主要是结合现有的调度自动化系统报警信息和数据挖掘周期数据集来对关联数据进行分析,数据分析系统采取了有限权值分配的方法,预警列表按照预警信息的大小进行有序排列,具体包含报警周期性数据集、预警信息周期性数据集大小、预警模式等资料。

5结束语

综上所述,文章在阐述数据挖掘内涵和电力调度自动化系统内涵的基础上研究了周期性关联规则的数据挖掘算法知识,并将其应用到电力调度自动化系统中,取得了良好的效果。周期性关联规则算法是数据挖掘技术的主流发展方向,在从历史数据中寻找规律的同时能够为电力调度自动化系统运行带给支持,需要引起相关人员的重视。

参考文献:

[1]肖福明.浅析数据挖掘在电力调度自动化系统中的应用[J].通讯世界,2014(17):58-59.

[2]李阳.数据挖掘在电力调度自动化系统中的应用[D].华北电力大学(河北),2009.

[3]朱维佳,曹坚.电力调度自动化系统中数据挖掘技术的应用[J].电气时代,2015(07):108-111.

[4]于存水.基于智能电网调度系统的调度监控平台的设计与实现[D].吉林大学,2013.

[5]李艳.关于数据挖掘中关联规则算法的相关问题研究[J].科技创新与应用,2017(33):161+163.

【小编简评】

数据挖掘论文 (优选10篇)如果还不能满足你的要求,请在搜索更多其他数据挖掘论文范文。

【网友评价】

对实际工作具有指导意义。

《数据挖掘论文 (优选10篇)[此文共26536字].doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式