近年来,随着大数据成为互联网信息技术行业的流行词汇,教育逐渐被认为是大数据可以大有作为的一个重要应用领域,有人大胆地预测大数据将给教育带来革命性的变化。大数据技术允许中小学和大学分析从学生的学习行为、考试分数到职业规划等所有重要的信息。许多这样的数据已经被诸如美国国家教育统计中心之类的政府机构储存起来用于统计和分析。盘点近年来大数据应用于教育行业的十大案例。
国内:
一、华中科技大学近两年个性化大数据的实践,通过数据理出学生在校期间生活和学习的主线,并放在一个故事化的场景里来叙述,引起了众多毕业生的共鸣。
6月8日,一封名叫《光阴的故事一致某某》的电子信件和截图在华中科技大学毕业生的微信朋友圈广为流传。每一位即将离校的学子只要打开链接,输入自己的校园账号就能获取在校期间的学习,读书,餐饮等各方面数据和收获。
该校网络与信息化办公室副主任王士贤介绍,《毕业生大数据--光阴的故事》由华中科技大学网络与信息 化中心在2015年第一次推出,今年在教务类数据的基础上还增加了毕业生的借书、进出图书馆,党员组织 发展,校园卡刷卡,计算机等考等相关数据。
二、由厦大图书馆设计的一个名为“圕(tuan)·时光”的网站, 收集整理了毕业生大学时代的阅读记录、进馆次数等, 被毕业生视为大学生涯的图书馆记忆。今年,这个网站还特别增加了毕业生在食堂的消费记录,如打了多少份免费米饭。也就是说,这是一份物质食粮和精神食粮的双重记忆。
由于今年的“圕·时光”,新增了学生们在食堂的消费记录,毕业生登录后,不仅能看到自己最爱去的餐 厅、超市、消费的金额,还能看到自己在大学期间,打了多少份米饭。厦大图书馆表示,这是根据学生一卡通的大数据统计出来的,只提供给学生本人。
三、每个月在食堂吃饭超过60顿、一个月总消费不足420元的,被列为受资助对象。
据报道,南京理工大学教育基金会通过数据分析,每个月在食堂吃饭超过60顿、一个月总消费不足420元 的,被列为受资助对象。南京理工大学还采取直接将补贴款打入学生饭卡的方式,学生无需填表申请,不用审核。
四、电子科大曾做过一个课题——寻找校园中最孤独的人。 他们从3万名在校生中,采集到了2亿多条行为数据,
数据来自学生选课记录、进出图书馆、寝室,以及食堂用餐、超市购物等数据。通过对不同的校园一卡通 前一后刷卡”的记录进行分析,可以发现一个学生在学校有多少亲密朋友,比如恋人、闺蜜。
最后,通过这个课题找到了800多个校园中最孤独的人,他们平均在校两年半时间,一个知心朋友都没有。 这些人中的17%可能产生心理疾病,剩下的则可能用意志力暂时战胜了症状,但需要学校和家长重点予以关爱。
国外:
五、纽约州波基普西市玛丽斯特学院(Marist College)与商业数据分析公司Pentaho合作发起开源学术分析计划 (The Open Academic Analytics Initiative),旨在一 门新课程开始的两周内预测哪些学生可能会无法顺利完成课程。
该计划基于Pentaho的开源商业分析平台(Business Analytics Platform)开发了一个分析模型,通过收集分析学生的学习习惯——例如点击线上阅读材料、是否在网上论坛中发言、完成作业的时长——来预测学生的学业情况、及时干预帮助问题学生,从而提升毕业率。
六、KickUp是一个专注教师测评的标准化SaaS工具,测评数据来自教师的自查报告及学年内的各项教学结果的反馈,这些数据可以纵向记录教师的成长历程,提出有待改善的地方。KickUp根据学生和老师的数量、 按地区进行收费,目前全美有超过50个地区的学校在使用这款测评工具。
七、以美国的著名高校卡内基梅隆大学和普渡大学为例: 对这两所高校,领英都收集了60000多名毕业生的职业生涯数据。数据量之庞大,足以在其中看出清晰的规律。输入“MIT”,你很快就会看到这所高校的毕业生一般会在谷歌、IBM和甲骨文公司找到工作。输入“普渡”,你会发现礼菜、康明斯和波音是毕业生的首选。
这类信息对于中学的高年级生和低年级学生都是一座金矿,因为大多数中学生对将来的职业都只有模糊的想法。运用领英的这个工具,对太阳能、编剧、或者医疗器械感兴趣的学生,就可以挑选那些毕业生最容易进入相关领域的大学拫考了
八、据PBS报道,伊萨卡学院(Ithaca College)自2007年开始收集学生的社交网络数据。该学院为申请者设立了一个类似Facebook的网站IC PEERS,让申请者得 以通过网站联系学院教师和彼此。
伊萨卡使用旧M统计分析系统来收集IC PEERS上产生的数据,研究拥有怎样的网络行为的学生更有可能选择就读伊萨卡。收集的数据包括申请者上传了多少张账户照片、拥有多少名IC PEERS好友。研究人员认为, 这能反映出申请者对这所学院有多感兴趣。
九、“希维塔斯学习”是一家专门聚焦于运用预测性分析、 机器学习从而提高学生成绩的年轻公司。Civitas Learning提供了一套应用程序,学生和老师可以在其中规划自己的课程和安排。“希维塔斯学习’’各种基于云的智能手机第三方应用程序(APP)都是用户友好型的,能够根据高校的需要个性化。这意味着高校能聚焦于各自不同的对象,相互不同地用这家公司的分析工具开展大数据工作。
该公司在高等教育领域建立起最大的跨校学习数据库。 通过这些海量数据,能够看到学生的分数、出勤率、 辍学率和保留率的主要趋势。通过使用100多万名学生的相关记录和700万个课程记录,这家公司的软件能够让用户探测性地知道导致辍学和学习成绩表现不良的警告性信号。此外,还允许用户发现那些导致无谓消耗的特定课程,并且看出哪些资源和干预是最成功的。
十、一家名为Knewton的大数据公司开发了一个数字平台, 该平台分析了几百万学生(从幼儿园到大学)的学习过 程,并基于这一分析来设计更加合理的测试题目和更加个性化课程目标。该公司与Houghton Mifflin Harcourt建立了合作关系,开发出了 K-12阶段的个性化数学课程,同时还与法国创业公司Gutenberg Technology—道,开发了智能数字教科书。
简单来说,这些课程和教科书能够适应每个学生的差异。学生可以按照自己的节奏来控制学习进度,而不会受到周围其他学生的行为的影响。然后,系统会给教师一个反馈,告知哪个学生在哪个方面有困难,同时给出全班学生的表现的整体分析数据。
在教育学习领域,大数据中提取价值的5种主要的技术如下:
1.预测(Prediction)——觉知预料中的事实的可能性。例如,要具备知道一个学生在什么情况下尽管事实上有能力但却有意回答错误的能力。
2.聚类(Clustering)——发现自然集中起来的数据点。这对于把有相同学习兴趣的学生分在一组很有用。
3.相关性挖掘(Relationship Mining)——发现各种变量之间的关系,并对其进行解码以便今后使用它们。这对探知学生在寻求帮助后是否能够正确回答问题的可靠性很有帮助。
4.升华人的判断(Distillation for human judgment)——建立可视的机器学习的模式。
5.用模式进行发现(Discovery with models)——使用通过大数据分析开发出的模式进行“元学习”(meta-study)。一家名为Knewton的大数据公司开发了一个数字平台, 该平台分析了几百万学生(从幼儿园到大学)的学习过 程,并基于这一分析来设计更加合理的测试题目和更加个性化课程目标。该公司与Houghton Mifflin Harcourt建立了合作关系,开发出了 K-12阶段的个性化数学课程,同时还与法国创业公司Gutenberg Technology—道,开发了智能数字教科书。