数据挖掘课程设计论文(精选5篇)

  • 数据挖掘课程设计论文(精选5篇)已关闭评论
  • A+
所属分类:文学
摘要

1 引言 数据挖掘总是让人觉得就是“高大上”、“深不可测”,而该领域当前主要是博士生、硕士生所研究的,另外,也只在一些研究生或重点大学的高年级的本科生中开设数据挖掘课程,在应用型本科院校中很少开设 [1]。 数据挖掘技术应用很广,应用较好的领域、…

数据挖掘课程设计论文(精选5篇)

数据挖掘课程设计论文范文第1篇

关键词:数据挖掘技术;应用型本科;理论教学;实验教学

中图分类号:G642 文献标识码:A 文章编号:1009-3044(2016)22-0148-02

1 引言

数据挖掘总是让人觉得就是“高大上”、“深不可测”,而该领域当前主要是博士生、硕士生所研究的,另外,也只在一些研究生或重点大学的高年级的本科生中开设数据挖掘课程,在应用型本科院校中很少开设 [1]。

数据挖掘技术应用很广,应用较好的领域、行业有:金融保险业、电信、市场营销分析、医学、体育、生物信息学(Bioinformatics)等方面[2]。在商业领域中,主要应用如:客户细分、客户获得、公司风险管理、企业危机管理、欺诈行为检测和异常模式的发现等;在计算机领域中,主要应用如:信息安全(入侵检测,垃圾邮件的过滤)、互联网信息挖掘、自动问答系统、网络游戏(网络游戏外挂检测、免费用户到付费用户的转化)等[3]。这一技术的广泛应用,必然在相关的企业中迫切需求掌握这一技术的人才。所以,开设数据挖掘技术课程对于应用型本科来说是很有必要的。

但对于应用型本科来说,若是像重点本科院校或研究生课程那样,在教学中以研究型为主,会导致学生的培养要求与教学内容的深度和广度不适应,学生会感觉到学习得很吃力,而且他们今后工作中的需求与所学到的知识相差也较大。对于应用型本科的数据挖掘技术课程的内容的安排,不仅要反映出数据挖掘技术的特点及前沿,还应该结合学生的学习能力及兴趣,也还需要综合考虑本校该课程的学时分配、教学条件等,要具针对性,突出应用这一重点,目的是使学生能够“学以致用”。

本文从应用型本科的实际出发,讨论了数据挖掘课程的理论教学内容及方法、实验教学内容及方法,使学生能够掌握和应用所学的知识。

2 先导课程及课程的基本要求

先导课程有:程序设计语言、数据结构、数据库技术、Web技术、概率论等[4]。必须深入学习一门程序设计语言,从计算机发展和应用角度,推荐学习C/C++和Java;对于“数据结构”课程,掌握树的知识,数据挖掘中的很多算法都涉及树的应用;对于“数据库技术”课程,掌握数据库操作和应用,因为数据挖掘的主要对象是数据库中的数据;对于“Web技术”,因为Web已经存在于我们生活方方面面,对于Web挖掘相当重要,而且还具有巨大的应用价值;对于“概率统计”课程,要能够熟练掌握其中的思维方式、条件概率以及各种分布,在数据挖掘中的关联规则、分类预测等,都会涉及概率统计中的思维和方法。

课程的基本要求:①了解数据挖掘的重要性,了解国内外的发展的状况及未来发展的方向;②掌握数据挖掘中的一些基本概念、经典算法及相关技术;③对于实际应用问题,能熟练地运用数据挖掘技术及工具解决;④为以后进一步深造或进行高级应用开发打下基础。[5,6]

3 理论教学及方法

对于应用型本科生数据挖掘技术课程的教学,本人认为重要的是普及经典算法,若有多余时间,可以补充一些较难的算法。对于经典算法原理的讲解,采取的是一步步地对小数据集案例进行算法演练,以具体化比较抽象的算法,对于算法的优缺点,采取课堂讨论的方式,可以加深学生对算法的理解和吸收。本校的数据挖掘技术课程的理论教学是32个学时,课程的理论教学内容主要包括:

(1)绪论(4学时):①先举几个数据挖掘中有意思的例子。第一个:超市货架的组织―“啤酒与尿布”;第二个:基于拐点变化的股票趋势预测;第三个:网上购物―“定向营销”;第四个:农夫山泉用大数据卖矿泉水;第五个:阿迪达斯的“黄金罗盘”;第六个:网易的“花田”―定制爱情。通过例子让学生对数据挖掘有一个大致的认识,可以提起学生对学习本课程的兴趣,也让学生了解到目前的数据挖掘已经发展到何种程度。②讲解KDD与数据挖掘相关概念。③数据挖掘对象:关系数据库、数据仓库、事务数据库、空间数据库、时态和时间序列数据库、文本数据、万维网数据、流数据等等。④数据挖掘的方法与相关领域:分类预测型和描述型,通过例子简单介绍聚类、关联规则、分类算法的概念、应用领域等,使学生对要学习的算法有大致的认识。⑤数据挖掘软件与应用系统:介绍数据挖掘软件:IBM Intelligent Miner、SPSS Clementine、Microsoft SQL Server 2008 Data Mining、Weka;数据挖掘应用系统:介绍在商业领域和计算机领域的应用。

(2)数据预处理(2学时):先对数据进行概述,包括:数据集的三个特性:维度、稀疏性和分辨率,它们对数据挖掘技术具有重要影响;数据挖掘中一些很常见的数据集的类型:记录数据、基于图形的数据和有序的数据。然后分别详细介绍数据预处理的主要任务:①数据清理;②数据集成;③数据变换;④数据归约;⑤数据概念分层与离散化。每一项任务举例讲解。

(3)关联规则(6学时):主要介绍关联规则的相关概念、关联规则的经典算法Apriori及它的改进算法FP_Tree、规则的产生,简单介绍多级关联规则和多维关联规则、非二元属性的关联规则、关联规则的评估(提升度(lift) /兴趣因子的计算)等。

(4)聚类(6学时):主要介绍聚类的概念及距离的计算(欧氏距离、曼哈顿距离、明可夫斯基距离)、基于划分的聚类算法(基本K-means聚类算法及其拓展、PAM算法)、层次聚类算法(凝聚的层次聚类算法AGNES、分裂的层次聚类算法DIANA)、基于密度的聚类算法(DBSCAN);简单介绍层次聚类方法的改进―BIRCH算法、CURE算法以及聚类算法评价。

(5)分类和预测(10学时):①决策树(4学时):主要讲解决策树的概念、信息论、ID3算法和C4.5算法。②贝叶斯分类(2学时):主要讲解贝叶斯定理及朴素贝叶斯分类算法。③人工神经网络(4学时):主要介绍人工神经网络的概念及单感知器模型,简单介绍BP神经网络。

(6)数据挖掘模型的评估(2学时):简单介绍模型的过拟合、没有天生优越的分类器、模型选择和模型评估、评估分类器或预测器的准确率――简单划分和交叉验证、数据挖掘模型评估的错误观念。

对于9个需主要介绍的经典算法的讲解,如Apriori算法,先介绍算法的流程,然后通过超市购物篮的一个小数据集一步步地进行算法的演练,得出频繁项集,如下图所示:

又如决策树算法和朴素贝叶斯分类算法,通过如下所示的关于动物的数据集,一步步地进行相关算法的演练,通过建立决策树或计算概率问题,判断一个未知的动物X={1,0,0,1,?}是否会生蛋。

对于算法的优缺点,在讲解完算法的过程之后,采取课堂讨论的方式,与学生共同分析总结算法好在哪里,不足又在哪里,学生通过参与,可以加深对算法的理解与掌握。

4 实验教学及方法

对于应用型本科的学生来说,采用Weka进行算法编写是不切实际的,实验教学工具建议采用目前一些主流的数据挖掘软件,如 SPSS Clementine或 Microsoft SQL Server 2008 Data Mining等[7]。这些软件都具有必需的数据预处理工具及预设的挖掘算法,学生可以把注意力放在要挖掘的数据及要相关需求上,设定挖掘的主题,然后采用这些软件完成相关主题的数据挖掘过程,这样也可以积累一定的处理实际挖掘问题的实战经验,今后碰到项目时也可知道从何处下手。

本校的数据挖掘技术课程的实验教学是8个学时,共两次上机,采用Microsoft SQL Server 2008 Data Mining对Adventure Works DW 2008R2 示例数据库进行数据挖掘。课程的实验教学内容主要包括:

实验一:SQL Server 2008 数据多维分析环境的建立;

实验二:关联规则挖掘方法;

实验三:决策树挖掘方法;

实验四:聚类挖掘方法。

为了让学生更好地进行实践动手,在教学中分两步:第一步,具体的操作步骤的讲解,由老师进行;第二步,学生上机并详细的分析挖掘结果,要求学生熟悉使用Microsoft SQL Server 2008进行数据挖掘的步骤,以及几种常用的算法的挖掘过程:包括创建数据源、创建数据源视图、创建挖掘结构(主要参数的设置)、处理和浏览挖掘模型。如关联规则,要求学生分析挖掘的模型,找出有价值的规则出来。

5 结论

为迎接大数据时代带来的互联网经济机遇,很有必要同时也是时代迫使在应用型本科中开设数据挖掘课程。对这一类学校的教学也是一个挑战,需要老师们在教学过程中不断摸索和改进。在教学过程中,需要针对应用型本科生的学习能力、知识结构,设计好教学内容并采用适当的教学方法,从而使学生对学习的内容感兴趣,改进课堂教学效果,以提高学生实际动手能力,使学生对数据挖掘课程的整体结构、基本概念、经典算法有较深入理解和掌握,最终达到教学目的。

参考文献:

[1] 徐金宝.对应用型本科生开设数据挖掘课程的尝试[J].计算机教育,2007(14):27-29,57.

[2] 李姗姗,李忠. 就业需求驱动下的本科院校数据挖掘课程内容体系探讨[J].计算机时代,2015(1):60-61,64.

[3] 张艳.大数据背景下的数据挖掘课程教学新思考[J].计算机时代,2014(4):59-61.

[4] 李忠,李姗姗. 应用型本科院校IT专业数据挖掘课程建设[J].计算机时代,2014(11):65-69.

[5] 张增平,乔晓华. 针对应用型本科生数据挖掘课程的教学实践[J].内蒙古财经大学学报,2015,13(4):132-137.

数据挖掘课程设计论文范文第2篇

关键词: 数据挖掘; 知识体系; 案例教学; 教学评价

中图分类号:TP311 文献标志码:A 文章编号:1006-8228(2014)04-59-03

Abstract: With the advent of the era of big data, data mining has become an essential technology which has important social value in the field of business, healthcare, manufacture and administrative management, etc. In many universities, the course of data mining is an important course which is integrated with other disciplinary knowledge and plays an important role in talent cultivation. According to the characters of big data, the knowledge hierarchy data mining is presented, and case teaching and new teaching evaluation method in graduate students' data mining course are discussed. The result shows that the effect is good and it is welcomed by graduate students.

Key words: data mining; knowledge hierarchy; case teaching; teaching evaluation

0 引言

近年来,传统科学研究(如天文物理学、生物医学等)、电子商务、网络搜索引擎(如GOOGLE和百度等)和物联网等产生的数据已经以PB或ZB(10的21次方)来计算。以分布式数据仓库、流计算的实时数据仓库技术为代表的最新数据存储技术,让全世界的数据存储量越来越大,由人、机、物三元素高度融合构成的信息化的社会引发了数据规模的爆炸式增长和数据处理模式的高度复杂化,大数据(Big Data)时代已经到来[1]。因此,数据具有越来越强的可视性、可操作性和可用性,能够越来越细致、精准、全面和及时地反映人的思维、行为和情感,以及事物的特性和发展规律,要想让这些大数据以更加有效的方式为提升人类各方面的生产力和生活质量服务,离不开以非平凡的方法发现蕴藏在大量数据集中的有用知识为根本目的数据挖掘技术的支撑。

市场上对于有大数据背景知识又懂数据挖掘技术的专业人才的需求也将越来越大,作为一名高校计算机专业教师,根据自己三年来研究生数据挖掘课程的授课经历,结合当前大数据的时代背景,对数据挖掘课程教学进行了新的思考和探索。

1 明确大数据背景下学习数据挖掘知识的重要性

1.1 大数据的定义

“大数据”是最近几年才出现的新名词,尚无统一的概念,维基百科上的解释是:大数据是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的整合共享,交叉复用形成的智力资源和知识服务能力。

1.2 大数据的特征

大数据的特征可以总结为四方面,即4V。

⑴ 数据量浩大(Volume)――数据集合的规模不断扩大,已从GB到TB再到PB级,甚至开始以EB和ZB来计数。例如:1立方毫米电子显微镜重建出的大脑突触网络的图像数据就超过1PB。

⑵ 模态繁多、异构(Variety)――大数据面向的是一切计算机可以存储的数据格式,类型包括结构化数据、半结构化数据和非结构化数据,包括互联网上的各种网页、图片、音频、视频、文档、报表,以及搜索引擎中输入的关键词、社交网络中的留言、喜好和各种传感器自动收集的监控结果等等。

⑶ 生成快速(Velocity)――大数据往往以数据流的形式动态、快速地产生,具有很强的时效性,同时,数据自身的状态与价值也往往随时空变化而发生演变,数据的涌现特征明显。

⑷ 价值巨大(Value)――数据显性或隐性的网络化存在使得数据之间的复杂关联无所不在,将对信息科学、社会科学、网络科学、系统科学、心理学、经济学等诸多领域的研究和应用起到革命性的作用,价值巨大[2]。

Gartner、IBM和牛津大学2012年联合的关于大数据的研究报告指出:交易数据、记录数据、事件和电子邮件是四大主要数据;数据挖掘,数据可视化,预测,建模与数据优化是五大数据能力[3]。大数据的潜在价值只有通过数据挖掘才能显现,因此,国外的Google、IBM、Amazon、Oracle、Microsoft、EMC;国内的腾讯、百度、新浪、淘宝等知名企业已经开始着眼大数据,从不同角度进行数据挖掘,以便改善自身服务,创造更大的商业价值。所以,作为高校教师,首先要让学生了解大数据的基本特点,明确数据挖掘知识和技术对当今社会的重要意义。

2 利用概念图,构建数据挖掘课程的知识体系结构

在大学里,设置一门课程,不能只关注这门课程所含的内容,更要考虑教育培养学生基本专业能力、可持续发展能力等本质性的问题。

数据挖掘是一门结合数据库技术、统计学、机器学习、神经网络、知识系统、信息检索、高性能计算和可视化等多门学科知识的交叉学科[4]。而且,该课程既包括各种理论知识,又离不开相关的实践技术,整个教学过程是培养和提高学生的创新能力和综合解决问题能力的重要途径。因此,针对计算机专业的学生,教学的首要任务是构建起整个课程的核心知识结构(如图1所示),同时,简单介绍相关的统计学、机器学习等计算机专业学生不太了解的非专业知识。

课程核心知识结构是教学的主线,是学生必须要掌握的。首先,让学生明确数据挖掘前要先经过预处理,再存入数据仓库;其次,针对具体情况利用相关的挖掘工具和挖掘算法进行挖掘;最后,挖掘结果以可视化的形式有效地展示给用户。教学的重点是挖掘算法和挖掘工具。对于挖掘算法,以数据挖掘国际会议ICDM(the IEEE International Conference on Data Mining)的专家评选出的十大经典算法(见表1)为主[5],结合相关实例给学生介绍各种算法的基本思想和相关概念,重点介绍使用较多的分类、聚类、关联、序列和机器学习这几种算法,先为学生打下良好的理论基础。

3 以实例为切入点,注重理论结合实践

数据挖掘课程主要针对我校研究生开设,考虑到学生就业和当前市场需求,以及课程本身实践性强的特点,在教学过程中要注重理论结合实践,注意培养学生解决实际问题的能力。因此,在给学生介绍目前常用的数据挖掘工具(如IBM Intelligent Miner、SAS Enterprese Miner、SPSS Clementine、Weka等)的基础上,结合市场应用需求,以实例为切入点,分别分析数据挖掘在互联网日志分析、电子邮件分析、互联网广告挖掘、电子商务、移动互联网等各大领域中的实际应用情况和成功案例(表2)。同时,还可以从内容挖掘、结构挖掘和用户访问模式挖掘这三个方面简单介绍WEB挖掘的基本知识[6]。这样,课程本身就脱离了枯燥的理论,让学生对数据挖掘有了感性认识,激发学习兴趣。

⑵ 过滤垃圾邮件。\&互联网广告\&⑴ 通过大数据挖掘,精准定位各类客户的广告形式;

⑵ 准确评估广告效果。\&电子商务\&用数据提升整体营销;通过日志挖掘做客户分析;用序列算法分析商品上架时间;用聚类算法对商品分类、提升会员管理。\&移动互联网\&⑴ 锁定用户的数据价值,通过地理位置信息挖掘出有价值的东西;

⑵ 文本挖掘。\&]

在教学过程中,贯穿以“能力培养为目标”的实践教学理念,提供有效的网络资源,让学生自己动手动脑,分析成功案例,完成教师给定的虚拟挖掘任务,强化学生参与意识,教师在以学生为主体的教学过程中当好指导者和激励者,从而充分调动学生的主观能动性,掌握不同应用领域大数据的挖掘问题的基本解决方法,培养学生的创新能力。例如,给学生一个文本挖掘的分类题目,让他们熟悉从原始数据的清洗、预处理、降维、建立模型、测试、得到结论等一系列环节。

4 改革教学评价,实施分类化评价

数据挖掘课程是一门融合了多个学科的实践性很强的课程,对应的考核方式应该与其他专业课程有所区别,应该更重视学生学习过程中的表现和能力的提升。

理论知识的考核注重学生对数据挖掘基本概念、挖掘流程和主要挖掘算法的掌握情况,主要以试卷考核的方式为主,注意主观题和客观题的数量比例,采用统一考核方式和评判标准。对于实践技能的考核,主要强调的是学生对不同类型数据进行挖掘时应掌握的相关软件使用技能的考查,考核时除了要体现学生对实验原理的掌握外,更重要的是要反映出学生在实验方法的掌握、设计、操作过程中的实际能力,我们取消了以往把一次性考试结果作为总成绩的方法,而把学生平时课堂实验成绩作为总成绩的主要部分,考核成绩占课程总成绩一定比例。

教师教学质量的评价与学生考核成绩相对应,可采用单独评价和统一评价两种方式。单独评价是指将社会实践作为一个独立的质量评价过程对教师教学质量进行考核;统一评价是指将教师实践教学与理论教学综合起来统一考核,以一定比例计入教师总体评价。

无论是对学生,还是对教师,这种分类化的教学评价方式,不仅有利于学生实际能力的培养,而且对教师的教学水平也是一种促进,有利于课程教学质量的不断提高。

5 结束语

大数据时代,谁能发掘出数据背后的巨大商业和社会价值,谁就能在激烈的市场竞争中处于优势。数据挖掘作为计算机应用专业的研究生核心课程之一,也是学生今后就业必需的专业技能之一。以往的教学过程理论性强,枯燥乏味,考核形式单一,学生学习热情普遍不高,不利于学生专业能力的培养。本文结合当前大数据的时代背景,在构架课程核心知识体系的前提下,结合实际应用领域和案例,分析数据挖掘常见算法和常用工具,强调学生的参与和主观能动性的发挥,而采用分类化的教学评价又能比较客观、公正地评价学生对课程知识和专业实践技能的掌握情况以及教师的教学效果。课程开设三年来的教学实践证明,学生综合运用计算机专业知识的能力得到提高,理论与实践结合的创新能力得到锻炼,教师在教学过程中不断完善了自身的知识结构,提高了教学水平,实现了教学相长,得到了学生的好评。

参考文献:

[1] Anand Rajaraman, Jeffrey David Ullman.大数据:互联网大规模数据挖掘与分布式处理[M].人民邮电出版社,2012.

[2] 李国杰.大数据研究的科学价值[J].中国计算机学会通讯,2012.8:8-15

[3] Jiawei Han,Micheline Kamber,Jian Pei等.数据挖掘概念与技术(第3版)[M].机械工业出版社,2012.

[4] 王珊,王会举,覃雄派等.架构大数据:挑战、现状与展望[J].计算机学报,2011.10:1741-1743

数据挖掘课程设计论文范文第3篇

关键词:实践教学研究;建构主义理论;信息管理专业;数据挖掘

中图分类号:G642.0?摇 文献标志码:A 文章编号:1674-9324(2014)15-0197-02

一、引言

随着数据挖掘、商务智能技术的快速发展与广泛应用,作为综合型应用型人才的信息管理专业的本科生必须在掌握一定理论知识的前提下熟悉数据挖掘的实践操作,能够根据实际数据构建数据仓库的多维模型、进行联机分析处理,并能结合案例主动思考分析,熟练选择合适的数据挖掘方法解决管理领域的问题,得出数据挖掘的结论。这就对数据挖掘课程的实践教学提出了很高的要求。数据挖掘是一门与多学科交叉的综合课程,其课程内容丰富、课程案例和使用工具具有多样化特征,这使得实践教学设计的方案的可选择性增强了,同时也对选择适合的内容、案例与工具并设计成一个完善的系统化的实验增加了难度。

二、基于建构主义理论进行实践教学设计

1.建构主义理论与实践教学目标。建构主义理论强调,学生通过以往的学习和经历已经形成了对客观事物的基本理解和认识,已具备了一定的知识结构,学习的过程是学生个人的知识储备与知识结构和外界影响相结合,并在结构过程中继续主动地建构自己新知识结构的过程[1]。

基于建构主义理论,给出数据挖掘课程实践教学的主要目标即为在原有理论知识理解的基础上,在新的教学实验情景下不断学习和理解,最终熟悉了实验情景、掌握了课程设计的应用,还能改达到对原有知识的深刻理解,进而能在新的实验情景和新的应用案例下有启发式的想法和思路,进行独立的思考和研究。具体包括:巩固已学习知识、加深对理论知识的理解,实验内容设计与教材理论体系一脉相承,有助于学生系统化理解本课程;深刻理解数据挖掘多步骤之间以分析为驱动、以数据相衔接的前后关系;训练学生对管理问题的抽象能力,培养学生学习兴趣。通过管理实例深刻体会到数据挖掘方法的重要性和实用性,培养学生对课程的兴趣,引导学生学会科学思考问题、提炼问题;熟悉主流软件,为学生踏入数据仓库与数据挖掘领域做好铺垫。实验使用业内流行的数据整合软件和商务智能软件进行实验设计,使得学生的实践适应技术的发展。

2.基于建构主义理论选择实验工具与实验案例。建构主义认为,学是与一定的情境相联系的。学习情境是学生可以在其中进行自由探索和自主学习的场所,一个良好的实践教学情景设计对学生学习要有明显的激发和引导作用。

在案例选择时,教师可以为学生提供一种典型的案例背景,在这种背景下的研究方法可以给予较多的辅导,使学生首先熟悉实验工具的环境,以及实验工具、实验案例与实验内容和原理的融合。再准备一些其他的经典案例供学生自由选择,鼓励学生用已有的知识来寻找最佳解决方案。这样,就促进了学生对知识、能力的迁移,并使得这一过程成为学生能力和自我有意识的调节过程。在确定软件选择方案方面,根据对国内外调研情况的分析[2],数据挖掘实践模块的工具的选择,可以分为以下三种情况:一是使用基本工具编程实现算法;二是直接使用具备数据整合、多维数据建模等方法的商务智能工具;三是使用数据挖掘软件进行数据建模或编程开发。根据信管专业培养方案的培养目标,后两种模式较为适合。可以针对学生基础知识的掌握情况,选择合适的工具为学生设计综合性实验,并在实验后期留一部分自由度,让学生自己设计数据仓库、进行数据挖掘,并对挖掘结果进行多种形式的展示。

3.基于建构主义理论设计实验原理与内容。建构主义理论认为,意义建构是整个学习过程的最终目标,即认识事物的性质、规律以及事物之间的内在联系,通过“同化”和“顺应”来完善和丰富个体的认知结构[1]。“同化”是利用原有认知结构中的有关经验去学习当前的新知识,并对新知识进行过滤或改变,原有框架的一部分。如果原有经验不能“同化”新知识,则要引起“顺应”过程,即对原有认知结构进行改造与重组。[3]

基于建构主义理论进行实践教学活动设计,需要围绕意义建构目标而展开,需要在安排实践教学课程前,明确理论课程的主要框架,并遵循已有的理论框架和逻辑结构安排实践环节,这样学生就能够更有效地从学习过程中理解当前实践内容所反映的事物性质、规律及其互相联系。

实验原理实际就是实验所选择的理论和方法基础,在实验设计时最好能依据课堂内容进行选择,并注意最好选择按照课堂内容的顺序前后衔接,这样更加符合建构主义的教育方法。实验内容就是以与学生专业相符合的案例和案例的数据,应用实验原理进行实验的设计。在本课程中主要的实验原理是:应用数据预处理抽取、转换和装载方法,对原始数据进行整合和装载;应用数据仓库的OLAP技术,建立星型模式的多维数据模型,并进行OLAP操作,应用多维数据展示技术进行数据展示;应用数据挖掘分类与预测方法,对多维数据建模、预测,并使用报表工具展示挖掘的结果。主要实验内容包括:数据集成与转换,使用Pervasive软件实现数据存储格式转换、集成;进行Mstr商务智能软件的基本配置,并将实验1的数据装载到软件的数据仓库表中,为实验3做准备;数据仓库与多维数据的OLAP操作,使用商务智能软件针对原始数据建立星型模式多维数据模型,实现多维数据模型的OLAP操作,掌握商务智能软件的数据展示功能;数据挖掘方法应用,创建季度指数度量,进行数据挖掘前的数据转换,并创建训练度量实现对销售量的预测。

4.基于建构主义理论设计实践教学方式和方法。在建构主义理论下,教师需要由传统的知识的传授者与灌输者转而成为实践教学的设计者、组织者、引导者。教师要引导学生形成分析问题的思路,启发学生对实践活动进行评价、反思和讨论,帮助学生深刻理解学习内容并形成新的认知结构。从课程内容安排上分析,建构主义强调“支架式教学”,即为学习者的知识建构提供一种概念框架[4]。为此,要在安排实验前对实验任务加以分解,形成逐渐递进式的概念框架,便于由浅入深逐步引入实践内容。例如,对于第三个实验――数据仓库与多维数据的OLAP操作,教师首先带大家回顾多维数据模型的星型模式、OLAP操作和多维数据展示三部分理论课内容,再分析案例数据,引导学生思考如何对案例数据进行处理,然后给出答案,加深对原来这三部分内容的理解。从对学生的引导和教学方法上来说,应该充分发挥学生的主动性,鼓励学生大胆探索,主动观察和认识客观事物,并鼓励学生在在实践中重新整合头脑中原有的知识,通过讨论、思考的过程加深对客观事物的认识。在条件允许的前提下,为学生提供更多的案例训练的机会,加深对知识的理解和知识架构的丰富与完善。本实验选用的实验模式为小组讨论、教师引导、上机实验相结合的方式,使用的具体方法有录制实验教学视频,引导学生思考初始数据蕴含的管理问题,画出课程知识点与实验过程、软件使用关系图等方式。

三、实验效果与结论

使用建构主义理论设计实践环节,事前给学生做好知识架构的铺垫,针对入门级实践,进行原理的讲解与回忆、进行实验过程的引导思考与详细讲授,同时提供更多情景资源给学生训练;对深入研究型的部分,给学生较大自由度,由学生自己完成。该门课程多数学生能够独立完成实验过程,并且能够在实验过程中较好地理解实验原理,分析管理问题。本实验综合效果较好,随着数据挖掘在信息管理专业中重要性的增强,在教学实践中增加课时的可能性很大,继续使用建构主义理论进行实践环节设计对学生也更有好处。

参考文献:

[1]张向葵.教育心理学[M].北京:中央广播电视大学出版社,2003.

[2]韩家炜.数据挖掘:概念与技术[M].北京:机械工业出版社,2001.

[3]赵学凯,赵芳.教学建设与改革[J].北京教育,2007,(01).

[4]齐宏,王爱萍.实践教学环节的认知理论基础与教学设计[J].开放学习,2007,(7).

数据挖掘课程设计论文范文第4篇

【关键词】数据挖掘 发展经济学 教学质量

【中图分类号】G642.0 【文献标识码】A 【文章编号】1009-9646(2008)09(b)-0043-02

发展经济学课程体系庞大、理论丰富、学派林立,表现为海量的、模糊的、随机的信息。如何在教学中改进和创新本课程的教学模式,提高教学质量一直是从事本课程教学的教师所面临的主要问题之一。本文应用数据挖掘技术对这些信息进行量化、分析、处理,以便对教学质量监测系统更加科学、客观的设计、控制和评价,实观对教学质量监测系统的优化,进一步提高教学质量。

1 发展经济学教学中面临的困境

由于教材、开设时间、教授方法、教师水平等诸多原因,发展经济学教学一度停留在“浅显易懂”的范围内,具体表现在以下几个方面:

1.1 教师方面

首先,教师专业结构不合理。多数发展经济学教师是在其所学经济学相关课程,如政治经济学、经济史以及经济思想史等的基础上开始自我学习和提高的,所以未经过发展经济学系统学习和训练。其次,教学方式的效果并不理想。大多数高校的发展经济学课程所采用的授课方式仍然是以任课教师的课堂讲授为主,也有少数教师采取专题讲座和案例讨论方式的,教学中,教师把备课、教学的重点及主要精力用在了概念的界定、逻辑推理和追求理论体系的逻辑性、完整性上,而较少关注经济现象的变化及学生关心的实际问题,这就很难引起学生的共鸣。

1.2 学生方面

在教学过程中,一方面由于学生的基础不同、领悟程度不同;另一方面一些学生学习态度不端正;再加上大班化授课,人数多,间接带来学生上课纪律不好,存在迟到早退乃至旷课现象,不认真听课及做作业,严重影响课堂教学效果和质量。

就学生的专业基础而言,大学四年级是最佳学习时机。但是,发展经济学课程的教学和学习需要安排充裕的时间,而大学四年级的课程安排一般很少,专业课程的教学已经结束,其原因在于,大学四年级学生必须参加社会实习、撰写毕业论文、寻找工作单位和研究生入学考试,这些事需要花费大量时间和精力。如果在这一阶段还有发展经济学的课程教学显然是不合适的。这便出现了学生专业基础与发展经济学教学时间安排上的矛盾。

1.3 教材方面

教材的内容过于陈旧,目前国内高校使用的发展经济学教材的主要内容多年不变,有的发展理论、经济发展政策己与当代先进的理论、政策明显不符,也与我国经济发展现实不合。发展经济学的内容在不断地更新和发展,我国对发展经济学的理论研究已经达到相当高的水平,我国经济实践中也积累了相当多的经验,但教材建设远远没有跟上理论研究和实践发展的步伐。

2 在提高发展经济学教学质量中的数据挖掘

本文结合数据挖掘技术,分析提高发展经济学教学质量途径。数据挖掘流程可分为四个模块:数据收集模块、数据处理模块、数据挖掘模块和数据表示应用模块[1]。如图1所示:

2.1 数据收集模块

在学校的各部门中积累了大量的影响发展经济学教学质量的数据,这些数据分散在人事处、学生处、教务处、科研处等各个部门除了利用这些已有数据,还必须把更多的因素考虑在内。包括:(1)教学过程中教师教学方法、教学内容、教学设计、教学态度和教学效果;(2)教师的学历、职称、培训经历、现代教育观和信息意识等。

2.2 数据处理模块

数据处理模块处理的信息包括:解决语义模糊性,数据库按照元数据标准对数据进行清理、集成和变换,检查数据的完整性和一致性,将数据整合成能被采掘算法利用的数据,最后存入数据采样库。

2.3 数据挖掘模块

数据挖掘模块:在友好的导航界面引导下,使用合适的算法通过关联分析、分类分析、聚类分析和序列模式分析对经过处理、转化的数据,进行挖掘、分析处理,得出结果并输出给数据表示与应用模块。

2.3.1 教师信息的挖掘

从以下几个方面对教师的信息进行挖掘:(1)课堂教学信息挖掘:通过对教师、学生的分类分析、关联分析找出数据间中隐藏的关联网。根据教师、学生的行为占有率、行为转换率得出本节课的教学模式图。(2)对教师教学风格、特点的信息挖掘:包括对教师语言特点、提问的比率、提问的开放性程度、与学生的互动能力等主观性因素进行量化,可视化。

2.3.2 学生信息的挖掘

从以下几个方面对学生的课堂行为表现进行挖掘:(1)思维状态:看学生是否对教师的提问,提示信息作出积极的反馈;学生是否主动提出问题、发表见解。(2)交往状态:一看课堂上是否有多边、丰富、多样的信息联系与信息反馈,二看课堂上的人际交往是否有良好的合作氛围。

2.4 数据表达和应用模块

2.4.1 数据表达。挖掘发现的知识可以利用可视化技术,如树、表、规则、图表、交叉表、矩阵或曲线等多种形式表示,使内容易于理解能够直接被人们使用。

2.4.2 数据应用。数据挖掘在教学质量监测系统中的应用主要有以下几个方面:

(1)个性化学习。1)学习者特征的可知性分析。根据学生的注册信息和需求纪录,系统可以向学生显示那此可能引起学生特殊兴趣的新知识。2)分析需求趋势。分析每个学习者的访问模式,通过挖掘对应的访问历史记录,系统向不同的学生提供符合其访问习惯的页面信息,预测学习需求。(2)自动答疑系统。系统解答与对学生提交的问题是同步并发的过程,用户在页面输入提出的问题,提交给计算机处理,系统对输入的问题进行分词和提取关键字的预处理。(3)教学评价和学习结果评价。教学效果和学习结果都需要一个客观公正的评价,数据挖掘可以帮助实现多方面,多层次、全方位的评价。

参考文献

[1] J.Han and M .Kamber 著.范明,孟小峰译.数据挖掘:概念与技术[M].机械工业出版社,2004.

[2] 谭祖谊.发展经济学教学模式改革初探,中国青年政治学院学报,2005,(5):93-96.

数据挖掘课程设计论文范文第5篇

关键词:远程开放教育,数据挖掘,应用,智能化

 

1 前言

现代远程开放教育的全过程基本上都是通过浏览网站的形式进行的,学生在Web上的行为都会产生大量的信息,这些信息在远程教育的全过程中十分宝贵,充分挖掘这些信息及其背后潜在的信息,反馈来指导远程教育中的各个环节,以此来为学生提供个性化的服务内容,增强远程开放教育的竞争力。利用数据库技术来存储管理数据,利用网络和计算机学习的方法来分析数据,从而挖掘出大量的隐藏在数据背后的知识,即数据库中的知识发现---KDD(Knowledge Discovery in Databases),其中,数据挖掘技术便是最为关键的环节。论文参考网。基于远程开放教育将是当前和未来教育的重要辅助系统,本文提出并介绍信了把数据挖掘技术应用于现代远程开放教育系统中。

2 数据挖掘概述

2.1数据挖掘(DataMining)定义

数据挖掘就是从大量存储的数据中,利用模式识别、统计和数学的技术,筛选发现新的有意义的关系、模式和趋势的方法。就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它主要依靠人工智能、机器学习和统计学技术,对数据进行归纳推理,从中挖掘出潜在的模式,预测未来趋势,为决策提供支持。

2.2数据挖掘的主要任务

(1)关联分析。两个或两个以上变量的取值之间存在的规律性称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分析的目的是找出数据库中隐藏的关联网。

(2)聚类分析。聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。

(3)分类。分类就是找出一个类别的概念描述,它代表了这类数据的整体信息。

(4)预测。预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。

(5)时序模式。时序模式是指通过时间序列搜索出的重复发生概率较高的模式。它是用己知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。

(6)偏差分析。在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之间的差别。

2.3数据挖掘对象

根据信息存储格式,用于挖掘的对象有关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及Internet等。

2.4数据挖掘技术实施的步骤

(1)确定业务对象。清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有评价,并以用户能理解和观察的方式将发现的知识呈现给用户。

(2)数据准备。这个阶段的工作包括数据集成、数据选择、预分析和转换。要对Web服务器上的数据进行挖掘,必须研究站点之间异构数据的集成问题,只有将这些站点的数据都集成起来,提供给用户一个统一的视图,才有可能从巨大的数据资源中获取所需的东西。

(3)数据挖掘。这个阶段就是利用数据挖掘工具对经过转换的数据进行挖掘和发现知识的过程。不同的数据挖掘工具有不同的算法,面向不同的分析需求,并且当具体使用操作时,也在一定程度上受到数据分析人员的思维方式和行为习惯的影响。数据挖掘利用人工智能领域中一些已经成熟的算法和技术。如:人工神经网络、遗传算法、决策树方法、邻近搜索算法、规则推理、模糊逻辑、公式发现等来进行数据的挖掘。

(4)结果分析。论文参考网。数据挖掘的结果由分析人员根据发现知识的领域重要性、可信度和支持度等阀值来对发现结果进行评价,并以用户能理解和观察的方式将发现的知识呈现给用户。通常会用到可视化技术。

(5)知识的同化。将分析所得到的知识集成到业务信息系统的组织结构中去。

3 现代远程开放教育系统简介

远程开放教育系统能实现个性化学习、实时教学、实时考试和智能答疑。为每一个接受网络远程教育的学习者提供个性化的学习进程。能根据与当前学习者相类似的学生的学习模式自动地对其后继知识的学习进行预测以及合理推荐,并对学习者的学习过程进行分阶段的评价,依据其绩效信息动态调整其学习难度、练习与测试内容,对学生提出的问题实现智能化答疑,对该学习者薄弱环节进行有效指导,做到因材施教和全天候学习。

远程开放教育系统由用户系统、WEB服务器、应用服务器、数据服务器、用户数据库和资源数据库组成。

用户系统用于实现远程开放教育系统的显示功能,其功能是:实现信息的和接受,管理员通过它来实现系统的管理、更新、维护等,主要是通过XML语言和HTTP协议实现WEB浏览器与WEB服务器的链接和信息通讯。WEB服务器用于完成远程开放教育系统的事务处理,用于处理学习过程中的各种事务。应用服务器直接为WEB服务器提供相关服务,处理WEB服务器以及XML文档组成的用户的事务请求信息。论文参考网。数据库服务器用于完成数据处理,为应用服务器提供相关服务,完成数据查询、修改和更新等服务,并把运行结果反馈给应用服务器。资源数据库中主要由远程开放教育系统中要使用的课件库、答疑库、作业库、试题库和必要的超级链接等构成。用户数据库主要用于存储远程开放教育系统中要使用的的注册档案、用户目前的学习内容、学习进展、作业情况和考试情况等信息。

4 数据挖掘技术在远程开放教育中的应用

现代远程开放教育是随着现代信息技术的发展而产生的一种新型教育形式,其基本特征是利用计算机网络和多媒体技术,提供丰富的教学资源供学习者选用,教学形式由原来的以教为主变为以学为主。数据挖掘技术在现代远程开放教育中的应用主要有以下几方面:

(1)在个性化学习方面的应用

由于每个学习者的知识背景、学习习惯和学习目标都不一样,故个性化学习在远程开放教育中就显得非常重要。为了实现此功能,基于WEB的智能远程开放教育系统首先要根据学习者的特点和学习目标来收集学习者的数据信息,然后对收集到的信息进行预处理,再应用一种合理的挖掘算法或综合应用不同的算法,如关联规则分析、聚类和分类技术、统计分析以及时序模式技术等,来处理此数据,最终发现用户的访问模式,但是通过模式挖掘后,生成的规则数目大、表达晦涩且不好用,这时就需要用到智能查询机制、可视化和联机分析等技术对模式进行分析评价,经过模式分析和应用技术处理后,选择一种学习者易于理解和接受的表达方式将知识数据显现出来。利用数据挖掘与学习内容绑定的技术,系统就可以以可视化方式来指导学习者学习和个性化发展,这样系统就实现了个性化学习功能。

(2)在资源库建设方面的应用

资源库建设在整个系统中至关重要,为了建立覆盖面广、功能齐全的资源库,我们就必须编制信息资源目录,征集种类资源信息,并进行资源查重、资源信息筛选、资源信息整理和存储;同时按学科门类建设积件库。当老师在系统内制作课件,为了有针对性和避免重复,我们可以对所有学习者已选的课程进行聚类,并通过聚类学习算法来自动确定每门课程的类别标记。接着利用数据挖掘中的关联规则,估计出一组相关同位类课程,再利用泛化关联规则,找到其上位类课程,或利用序列模式,预测出与之有关的学生未来可能选择的同级课程,最后围绕学习者的需求权限进行课程设置。

(3)在实时教学方面的应用

在本系统中,由于引入了互联网技术、人工智能技术、数据库技术和知识发现技术,通过机器学习、统计分析等方法设计出了个性化处理引擎,从大量的数据中进行数据挖掘,提取有用的、潜在的信息。学生可以通过网络实现每天24小时的学习,而且本系统可以更多且及时的了解到学生的学习学习进度、需求、能力、兴趣爱好等方面的信息,并动态地根据这些信息调整学习计划和进度,让学生得到针对其 个性 的教育,实现因材施教。

(4)在智能答疑方面的应用

基于WEB的远程教学系统中的智能答疑系统只要用户能上网,就可解答学生在学习过程中产生的问题。它能根据学生用户访问日志、问题记录等数据进行数据挖掘,用智能抽取的方法实现智能答疑。从用户访问日志和提问信息里面可以分析出学生的行为。智能答疑系统后台存储了大量的由经验丰富的教师精心挑选的问题答案,对于用户提出的问题.系统首先通过对问题的分析自动在数据库中寻找最适合的答案。这样通过数据挖掘,针对学生用户提问记录、日志不断更新和调整学生用户知识库,使问题的回答更加精确。

(5)在实时考试方面的应用

本系统的实时考试系统是一个基于数据库和WEB的远程在线式实时的测试系统。它能考虑个别学习者的能力和特性,按照考试的目的和必要性,提供各种问项信息,如难易程度、辨别程度等。并且还能同步打分,提供成绩进展情况,根据个人特性解释问题,按个人及科目对考试结果进行各种统计分析和评价,并存入学生用户数据中。这些功能的实现是由于系统采用关联规则、聚类和分类工具对数据库中抽取的数据进行处理,分析出学生的特性及其对课程各知识点的掌握程度,并结合学生的考试目的恰当地反馈给学生,这样提高了学生学习的效率。

5 结束语

在现代远程开放教育网站设计中,基于XML(ExtensibleMarkup Language,可扩展标记语言)的新一代系统设计环境,可以更好地描述半结构化和结构化的数据,更有利于进行数据搜索和挖掘。如何整合XML和Web服务技术,以此为契机开展数据挖掘和知识获取,在现代远程开放教育网站的设计中以学习者为中心,提供一种基于资源的学习,教学资源可以适应各种学习者的需要和背景进行不同的组合,提供更加优良的、个性化的服务。

参考文献:

[1]李爽,陈丽.国内外网上智能答疑系统比较研究[J].北京,中国电化教育,2003(5)

[2]苏新宁.数据挖掘理论与技术[M].北京:科学技术文献出版社,2003

[3]赵丹群.数据挖掘:原理、方法及其应用[J].现代图书情报技术,2000,(6)

[4]周云真,舒建文,王平根.据挖掘在基于WEB的智能远程教育系统中的的应用[J] .南京:文教资料,2006(10)