您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页基于数据挖掘的网络学习行为分析及其教学策略研究

基于数据挖掘的网络学习行为分析及其教学策略研究

来源:爱go旅游网
基于数据挖掘的网络学习行为分析及其教学策略研究

方静

(湖北工业大学,湖北省武汉市,430068)

摘要:随着信息技术的快速发展和网络技术的广泛应用,对传统的学习方式产生了很人的冲击,基于网络环境的教学已经成为一种重要的形式和学校教学的组成部分。作为一种新生的学习方式,网络学习有其独特的优势和发展潜力,网络学习包括四人要素:学习者要素、教师要素、网络课程内容要素及网络学习环境要素,每一种要素之间的相互关系都会影响网络学习的有效性,随着网络学习普及性的提高,对网络学习有效性的关注尤为重要,日前对此问题所进行的思辨研究比较多。而当前大学生已经基本掌握电子计算机和网络使用的基本技能,将数据挖掘作为当前大学生网络学习的基础,通过学习者要素、教师要素、网络课程内容和网络学习环境为要点,研究大学生的网络学习行为,从而有针对性的引导大学生有效学习。本文拟通过分析研究,应用数据挖掘方法探讨网络学习的有效性,并基于数据挖掘的分析结果提出网络学习的引导策略。

关键词:网络学习、有效学习、数据挖掘、关联规则、多维度分类

1 引言

随着计算机网络技术的发展和互联网的普及,网络教育正以迅猛的态势发展起来。我国的远程教育正式进入了第三个发展阶段—以多媒体计算机和网络教育为代表的现代远程教育。网络环境下教与学的时空分离造成了教与学相互作用的弱化,应用数据挖掘方法研究网络环境下教与学相互作用的关系,可以有效探索网络学习新机制,为网络环境下的学习者、

教师、课程开发者和管理者提供服务,指导他们在网络环境下进行教与学的实践,以提高教育管理绩效和学习绩效。目前对于网络学习行为的研究,国内外学者主要集中在对网络学习者行为特征的统计及描述、网络学习行为监控系统的设计与实现、网络学习行为模型的构建及网络学习行为交互及反馈机制的探讨等几方面。笔者从 CNKI 中以数据挖掘、数据挖掘和网络(Web)等一系列关键词进行搜索,从搜索结果可以看出,我国在数据挖掘领域的研究自 1996 年左右起步以后,研究成果逐年递增。数据挖掘逐渐从数学、计算机方面的应用扩展到教育、医学、地理等多种领域。数据挖掘在教育中的应用,也取得了一定的成果,但在网络学习方面的应用研究还相对较少。论文拟通过实证研究,应用数据挖掘方法,探索网络有效学习机制,并对学习者进行网络学习提出可行性建议,以提高学习者进行网络学习的有效性,探索培学生网络学习能力的新途径;对教师进行网络有效教学提出可行性建议,以促进网络教学规范化;对管理员及开发人员提出网络课程管理和开发的可行性建议,以提高网络课程管理的有效性。

2 研究的理论基础

2.1 网络学习

网络学习,就是指通过计算机网络进行的一种学习活动,允许学习者自由选择学习内容、学习地点和学习时间。相对传统学习活动而启,网络学习有以下三个特征:一是丰富的和共享的网络化学习资源;二是以个体的自主学习为主要形式;三是突破了传统学习的时空限制上。因此网络学习是在网络环境下,学习者与学习资源、教师等基本元素之间相互作用的过程和方式,是一个顺应到认同、再到内化的过程,是行为学习、价值学习和规范学习的统一。网络学习的优势体现在可以在任何时间、任何地点发生,具有很大的灵活性,教与学的方式多样化,能够为学习者提供丰富的资源,但是网络学习教与学的过程及管理难以控制,学习者因缺乏自主独立性导致容易迷失。

网络学习在内涵上,可以从四个方面去认一识:网络作为学习的工具;网络作为学习的对象;网络作为学习的资源;网络作为学习的环境,进一步解释为:网络学习是通过网络进行的学习过程;网络学习是学习网络本身的过程;网络学习是开发和利用网络知识与信息、资源的过程;网络学习还意味着把网络作为学习的一种环境。学习环境是由学习资源和认知工具以及相应的模式、策略、氛围构成,网络是一种环境的观点基本涵盖了其他三种观点,只有从学习环境的角度来理解网络的本质,才能更好地解释网络所支持教与学过程中的多种形式和特点。

2.2有效学习

有效学习是指优化的组织和实施学习,发挥主体的积极能动性,有效的完成和实现既定的学习任务和自主学习。对有效学习概念的界定,有三种取向,一:从学习过程和结果的角度,强调学习者在态度上“想学”、过程中“能学”并能“学会”;二:从学习的水平和层次的角度,认为有效学习是超越“记住”、“理解”程度的适应性学习,更加强学习者的主动性,强调有效学习的结果;三:能在不同的情境下解决实际问题。三种取向的定义的共同点是认为有效学习是新知识与学习者已有的观念建立实质性联系,都强调学习的实效,即会学和能解决实际问题,最终学会学习、形成新的行为或思维习惯的过程。

网络有效学习指在网络环境下,学习者围绕学习内容或问题,积极地通过探究、协作或自主的方式、充分利用网络学习资源和工具对信息进行批判性、创新性地加工,最终提升知识与技能水平,形成自我发展的能力。有效的网络学习至少应该具备学习者主动建构、按时完成学习任务及目标以及自身获得发展三个条件,应该以真实问题为起点,以学习兴趣为动力,以学习活动的体验为外显行为,以分析性思考为内隐行为,以指导、反馈为外部支持。

2.3学习者特征

学习者特征,从心理层面对其进行概念界定,比较典型的是:学习者特征指影响学习过程有效性的学习者内部心理过程的各个方面。从经验背景对其进行概念界定,学习者特征是指影响学习过程有效性的学习者的经验背景的各个方面。传统环境下,对学习者特征的分析,主要包括学习准备和学习风格。

网络环境下学习者特征除了包括影响学习者学习过程有效性的学习者心理特征外,还涉及学习者在社区中的行为表现,即行为特征,以及学习者与社区环境、社区成员的关系和互动等特征,具体包括以下四个方面:学习者的起点水平,包括网络学习能力、原有的学科知识基础、态度;心理特征,包括学习风格、学习动力(动机、自我效能感、归因);行为特征及社会关系特征。

3 数据挖掘技术及应用

3.1 数据挖掘的概念和应用

3.1.1 数据挖掘的概念

数据挖掘(Data Mining,简称DM),简单的讲就是从大量数据中挖掘或抽取出知识。它的定义描述如下:数据挖掘,也称为数据库中知识发现(Knowledge Discovery from Database,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。数据挖掘受多个学科影响,是数据库系统、统计学、机器学习、可视化和信息科学的交叉学科。

3.1.2 数据挖掘的应用

数据挖掘技术在国外的大型商业、金融业、保险业、医疗、通信、运输等大型企业得到了广泛应用,国内目前总体上还处于理论探讨和应用试验阶段。同时,数据挖掘也被用于识别欺诈行为和发现犯罪倾向。在科学研究领域数据挖掘主要用于帮助天文学家发现遥远的类星体;构建人类健康状况的预警分析系统;建立互联网中搜索引擎以及通过分析用户点击流得到有关用户使用兴趣的价值信息等。

数据挖掘在教育领域的应用主要有以下几个方面:

1. 个性化学习

(1)学习者特征的可知性分析

学习者特征由学习者的知识结构和学习风格组成。利用数据挖掘功能分析学习者特征,帮助学习者修正学习行为。

(2)分析需求趋势

分析各个学习者的访问模式,通过挖掘对应的访问历史记录,系统向不同的学生提供符合其访问习惯的页面信息,预测学习需求。同时可以评估学习者需求倾向的改变,有助于提高教育网站的竞争力。

2. 自动答疑系统

在系统的后台存储了大量的,由经验丰富的教师精心挑选的问题答案。当学习者提出问题后,系统对问题进行分析,通过对问题的分析自动在数据库中寻找最适合的答案,并按照匹配的程度推荐给用户,利用交互机制从用户端获得反馈,并及时有效地对问题关键

字的权重进行修正,提高答疑的准确性。

3. 教学评价和学习结果评价

教学效果和学习结果都需要一个客观公正的评价,数据挖掘可以帮助实现多方面,多层次、全方位的评价。对学生学习行为和综合素质进行评价,一般采用模糊综合评判及模糊聚类的方法;教学评价则使用决策树来保证评价的科学性,客观性和公证性。

3.2 数据挖掘的过程

数据挖掘是一个从已知数据集合中发现各种模型、概要和导出值的过程。KDD过程是一个以知识使用者为中心、人机交互的探索过程。通常知识发现的过程主要由三个部分组成,即数据整理、数据挖掘和结果的解释评估:

1.数据整理

数据整理包含两方面,一是从多个数据源去整合数据挖掘所需要的数据,保证数据的综合性、易用性、数据的质量和时效性。另一方面是如何从现有数据中衍生出所需要的指标。数据整理包括数据准备、数据选取、数据预处理、数据变换。

2.数据挖掘,这个阶段包括选择算法和数据挖掘。

(1)选择算法:根据确定的 KDD 目标选择合适的知识发现算法,包括选取合适的模型和参数。

(2)数据挖掘:运用选择好的算法,从数据库中提取用户感兴趣的知识,并以一定的方

式表示出来。

3.解释评估,这个阶段包括模式解释和知识评价。

(1)模式解释:对发现的模式(知识)进行解释。将无关和冗余的模式剔除。若模式不能满足用户需求则返回前面的某步重新处理。

(2)知识评价:将发现的知识以用户能了解的方式呈现给用户。包含知识一致性检查和模式可视化处理。上述步骤中,数据挖掘占据非常重要的地位,它决定了整个 KDD 过程的效率和效果。

3.3 数据挖掘的常用算法

数据挖掘方法分为统计方法,机器学习方法,神经网络方法和数据库方法。统计方法有回归分析、判别分析、聚类分析等。机器学习有归纳学习方法,遗传算法等,神经网络有前向神经网络,自组织神经网络等。数据库方法主要是多维数据分析和 OLAP,以及面向属性的归纳。本论文在此介绍以下几种常用算法。

1.聚类分析(Clustering)

聚类就是把整个数据分成不同的组,并使组与组之间的差距尽可能的大,组内数据的差异尽可能的小。常用聚类的方法有 K-平均方法,K-中心点方法。利用聚类算法可以从 Web 访问信息数据中聚类出具有相似行的那些学生。把这些聚类结果提供给学生改善学习或网络管理员改善网络服务。

2.关联规则(Associations)

关联规则是描述数据库中数据项之间存在潜在关系的规则,数据项之间的关联及根据一个事务中某些项的出现,可推导出另一些项在同一事物中也出现。常用的算法有 R.Agrawal 提出的 Apriori 算法和 FP 算法。 关联规则可以发现学生某些知识兴趣点之间的相关性,然后动态提供给学生这些知识点之间的超链接,使学生在上网学习时更加方便。

3.决策树(Decision Tree)

决策树主要应用于分类分析,它是利用信息论中的互信息(信息增益)寻找数据库中具有最大信息量的字段,寻找树的一个节点,再根据字段的不同取值建立树的分支,在每个分支子集中重复建立树的下层结点和分支来进行构造。常用算法有 ID3 算法。 通过分类算法可以实现对学生知识水平的客观分类。以便为其提供相应的学习内容和练习内容。同时也为教师提供准确的教学情况信息。

4.模糊集(Fuzzy Set)

根据模糊集合理论,对实际问题进行模糊判断、模糊决策、模糊模式识别、模糊聚簇分析。系统复杂性越高,精确能力就越低,模糊性就越强。

5.遗传算法(Genetic Algorithms)

一种新的优化技术,基于生物进化的概念设计了一系列的过程来达到优化的目的。这些过程有基因组合、交叉、变异和自然选择。为了应用遗传算法,需要把数据挖掘任务表达为一种搜索问题而发挥遗传算法的优化搜索能力。

6.神经网络(Neural Network)

模拟人脑神经元方法,以 MP 模型和 HEBB 学习规则为基础,建立三大类神经网络模型:前馈式网络、反馈式网络、自组织网络。

4 基于数据挖掘的网络学习行为分析

4.1 网络学习行为的多维度分类

网络学习者进行网络学习的过程是长期的,在整个学习工程中,每一门课程的学习阶段以及每一个课时的学习阶段,学习者对学习内容的学习兴趣不同,对学习这门课程的态度也就不同,从而他们学习时产生的学习行为也表现出一定的差异性。另外,学习者的学习较久,要分析出他们的学习风格与学习偏好,需要抽取较多的数据来进行分析。由于学习者进行每次上课的学习行为的数据量都很大,要挖掘网络学习者的学习风格与学习偏好,也需要对网络学习者的学习行为分类进行相应的分析处理。

本文对网络学习行为的分类是在彭文辉等人的网络学习行为多维度模型对网络学习行为的分类的研究基础之上,从社会、心理、生理、情感、环境这几个维度进行划分的。社会维度指的是网络学习者学习行为中体现出的交流互动方面的特征,心理维度指的是网络学习者学习行为体现出对信息的分析和综合以及学习方式的选择等方面的特征,生理维度指的是网络学习者依据优势感官的使用不同而对各种类型的学习资源的使用表现出一定偏好的特征,情感维度指的是网络学习者学习行为体现出对鼓励!学习坚持性!学习内容组织偏爱的喜好方面的特征,环境维度指的是学习者对网络学习平台的使用!工具使用!背景音乐的使用等方面喜好特征。

网络学习者的网络学习行为大致归类如下:

(l)社会维度:提问、发布帖子、浏览帖子、在线答疑、在线讨论等交互学习行为

(2)心理维度:根据导航选择学习内容、使用搜索引擎搜索学习内容、整理收藏夹、信息保存、信息分类、做笔记、写blog、制作网络作品、发起学习讨论组、发表文章、发表学习心得等

(3) 生理维度:使用学习目标、关键词、案例、文本、视频、音频、动画、图片、图、表、课后练习、在线试题等资源的时间以及频度等

(4)情感维度:使用QQ、Insn、网易泡泡等实时交流工具与人交流;.使用em目、bbs、blog等进行交流

(5) 环境维度:对背景音乐、辅助学习工具的使用

网络学习中,学习者的操作产生的数据量非常庞大,这些数据都需要采用数据挖掘技术进行整理和分析才能得出学习者的一些个性化特征。

4.2 利用关联规则对网络学习行为进行分析

关联规则是找出隐藏数据中的关系网,并分为简单关联、时序关联和因果关联。例如:客户购买A的同时,经常会购买B(简单关联);客户购买了A,就需要购买B(因果关联):客户购买A后,隔一段时间就会购买B(时序关联)。

在网络学习过程中,学习者按照自己的喜好进行学习,其学习行为也与自身的学习风格

与偏好有很大的关系。关联规则可以用来发现学习者学习行为之间的关系,通过对网络学习者的某两类网络学习行为之间取值关系进行分析就可以得出他们之间的关系,从而预测学习者将要进行的下一个行为,以此来挖掘网络学习者学习行为之间的关系,使得学习者学习风格更明显。

挖掘网络学习者的学习风格与学习行为之间的对应关系,应该具有相同的考察维度,才能进行准确的分析。网络学习者学习行为之间的内在关系,也应该从多个方面进行分析:

(l)社会维度:挖掘网络学习者交互学习行为之间的关系,具体来说就是挖掘出学习者在学习时积极参与、观望、逃避协作学习的学习态度,此外还挖掘出学习者参与讨论、合作、辩论、竞争等的协作学习行为之间的关系。

(2)心理维度:一个是要挖掘网络学习者信息检索行为之间的关系,主要是分析网络学习者在学习时对页面结构的使用关系,是否按照学习平台安排的学习过程进行学习、是否边学习边搜索资源等关系;再就是要挖掘网络学习者信息加工行为之间的关系,考察网络学习者收藏页面、保存信息、整理信息、做习题等之间的关系;此外还有依据学习者的学习行为,挖掘出学习者的学习方式。

(3)生理维度:挖掘网络学习者使用资源的关系。学习者使用学习目标、关键词、文本、图片、动画、视频、音频、习题、图、表、在线习题之间的关系,分析网络学习者学习行为的序列、因果关系等等。

(4)情感维度:挖掘网络学习者沟通交流行为之间的关系。这个部分主要分析网络学习者在学习时是否容易受到QQ、网易泡泡、MSN等实时交流工具的影响以及是否及时与其他学习者或老师进行沟通交流的情况,挖掘出学习者的学习坚持性、是否需要鼓励等特

征。

(5)环境维度:挖掘出学习者对网络学习平台的使用特点。

4.3 利用聚类分析规则对网络学习行为进行分析

聚类分析是把数据按照相似性分为几类,同一类中的数据具有共同点,不同类中的数据不同。网络学习者进行学习时,产生了大量的行为数据,为了判断出学习者进行的是什么行为,就需要对数据进行归纳分类。在分析网络学习者的网络学习行为时,利用聚类分析技术,学习者对学习平台中的对象进行的相同操作则视为进行的是同种类型的学习行为,通过对学习者不同的学习行为进行归类,为构建学习者的学习风格模型提供基础。

应用聚类分析规贝上分析网络学习者学习行为,主要从以下两个方面进行:

(l)将学习者的学习行为归类为:写blog、使用导航、使用搜索引擎、整理收藏夹、动画、信息保存、信息分类、课后练习、做笔记、制作网络作品、发起学习讨论组、在线答疑、小组活动、同伴反馈、发邮件、发表学习心得、利用bbs提问以及回答问题、使用qq、Insn、网易泡泡、email、在线辩论、使用学习目标、关键词、文本、音频、图片、表、频度等类别。

(2)将分类好的学习行为整理为社会维度,心理维度,情感维度,环境维度等几类。将学习行为进行分类后,为以后的分析学习者的学习风格与偏好提供准备。

4.4 利用预测分析方法对网络学习行为进行分析

预测是利用历史数据找到变化的规律,构建出模型,并用模型对未来数据的种类及特征

进行预测。网络学习者进行网络学习时,他们的学习风格一般比较固定,那么他们的学习行为也会有一定的规律和特点。预测分析方法利用学习者的网络学习行为随时间而变的规律,预测学习者在接下来将会进行的学习行为。通过预测分析方法,可以为学习者提供具有个性化特点的学习资源,创建独特的学习环境,促进学习。

5 基于数据挖掘的网络学习行为的引导对策

5.1 学习者要素的K一means算法

我国高校在校学生数量大,从成人教育、本科教育、硕士研究生教育和博士研究生教育有多种层次,不同层级当中的不同层次都有很大的差别。因此,通过K一means算法,从学习者要素出发,将学习者进行分类,从而有针对性的开展网络学习行为的定位和培养。最为简单的就是通过学生的成绩和获奖情况的综合权重来进行模糊聚类分析。以本科生的K一means算法为例,通过大一大二的公共基础课程的成绩为样本,采集男女比例适当的学生数据,通过以特征向量进行第一次聚类分析,将本科学生层次分为高、中、低3个层次,并且又在每个层次当中发现大一和大二学生的差异性,最终,将男女,年级,专业作为3个层。其中,对于一些特例需要特殊关注,特别是“偏科”现象,工科学生中存在英语大多是弱势,而文科学生在数学逻辑思维和判断上存在短板。因此,将不同层级的学生进行详细的划分,并且做好划分的详细记录,不仅要从微观上划分,更要从宏观上有共同特点。

5.2 教师要素的NaiveBayes分类

高校是最具有学术氛围的地方,从教师的角度来看,教师的工作年限、教学经历、教学成果和职称等方面,都处于一个大体稳定但小有变化的特点,因此教师要素,在大学生的网络学习上具有很强的引导和传播作用。高校的教师的数量是相对较少的,并且专业分科和特点十

分明显,因此符合NalveBayes分类的运用条件,例如,以机械专业领域为例,将某一个教师设定为但一样本的数据样本,并且该教师已知属于机械专业领域,通过教师的教龄、支撑位样本等特点,可以将老师划分为多个层次和专业化程度,如专业程度上有,助理工程师教授级高工等。将教师的数据和信息进行深入挖掘之后,我们可以从专业化、水平等角度进行合理的配置教师资源,通过教师的综合影响力,来启发学生的思考,让学生通过网络的渠道进行自主性的学习。

5.3 网络学习内容的EM期望值

网络学习的内容分为两个部分,第一部分是高校图书馆和网络学院提供的相对静态资源,另一部分是学生通过教师因素环节当中引导而自主的进行信息搜索。对于高校图书馆和网络学院学习内容的EM计算,最简单的就是通过网站资源的点击量和关注趋势等为数据样本,然后进行可视化和聚类分析,通过实验可以发现,可以简单的通过某些软件进行详细的定位和选择,自主的进行这几个方面资源的整理,提高满足度和契合度的过程中,EM扩大也就达到了数据挖掘的目的。对于第二部分的内容。由于学生的关注内容和热点不一样,就应当通过教师因素进行直接传播,例如教师自身发现较好的资源或者网站等,对学生进行直接的传递,从而弱化学生信息搜集当中的负面情绪。

6 结论

网络学习不同于面对面的教课方式,对于网络学习者行为的研究目前也大都基于海量的用户数据。因此对于网络学习者行为研究的目的和有方法都需要很明确并要有最快的解决。在阅读文献的过程中发现目前的研究缺乏实际可以参考的案例,更多的是关注于数据的获取、挖掘算法的研究,而缺少设计与需求调研。同时,很多研究将学习者学习行为的采集与评价混为一谈。例如,在学习者模型中涉及到了学生的学习态度,学习积极性等方

面。我们认为,学习者模型的目的和任务是收集学习者的各项学习信息,而评价则是建立在学习者模型基础之上的另一个环节。对于网络教学平台来说,学习者信息、课程、资源、学习者评价等各个模块应是低耦合的。个性化资源的推荐、评价等功能的实现,调用的只是学习者信息模型中的数据,而不应该是每个功能模块都要重新收集学习者信息。因此,我们主张将学习行为进行系统的分析、采点量化,充实到学习者信息模型(依据 CELTS或其他标准的学习者信息模型)中来,作为学习者个人的信息库,以期达到资源的重复利用。

数据挖掘技术已经在许多领域取得很好的应用,在教育领域中,随着网络学习用户的不断增多,使用数据挖掘技术可以解决海量数据的问题,能够较客观实时地反映远程学习者的学习行为特征,为教师进行具体课程的教授提供了重要的依据。

参考文献:

[1] 曹梅.知识发现在网络教学系统中的应用研究进展[J].开放教育研究,2008,(12):89一93

[2] 王松涛.论网络学习=J].教育研究,2000,(3):58一61

[3] 吴婕.浅析数据挖掘软件的发展[J]信息系统,2004(2):212一214

[4] 李雄飞,李军. 数据挖掘与知识发现[M]. Data Mining and Knowledge Discovery.高等教育出版社.2003 年 11 月第 1 版

[5] 陈玉婷,王斌,刘博,宋斌,李颉.关联规则挖掘算法介绍[J].计算机技术与发展.2006,5:21-25.

[6] Robert Powell, Richard Weeks[美]著,袁鹏飞译.C#和.NET 架构[M].人民邮电出版社.2002 年 4 月第一版.

[7] A.Russell Jones[美]著,陈建春,白雁,杨永平译.ASP.NET与C#从入门到精通[M].电子工业出版社 2003 年 3 月第一版.

[8] 高丹丹.论网络学习的评价[J].电化教育研究.2009(l1):25一29

[9] 贾瑛.Web使用挖掘在远程教育中的应用研究[D].陕西师范大学,2008

[10] 张家华,张剑平.网络学习的影响因素及其LICE模型[:Jj电化教育研究,2009(6):73一77

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务