课程思政背景下大数据技术专业课程实施--以数据采集与清洗技术课程为例

期刊: 素质教育 DOI: PDF下载

黄隽

江门职业技术学院

摘要

大数据技术以数据为基石,数据如何获取是大数据技术专业学生所需要解决的问题,而互联网数据是常见的来源之一,数据采集与清洗技术是江门职业技术学院信息工程学院大数据技术专业开设的一门专心核心课,该课程内容不仅涵盖了使用网络爬虫获取互联网数据的前沿性知识,并且在实施过程中蕴含丰富的课程思政元素。


关键词

网络爬虫、课程思政、大数据技术

正文


数字经济的发展离不开大数据技术,大数据技术以数据为基石,通过对数据进行处理分析得出结论进行决策。随着互联网的普及和信息技术的快速发展,网络数据已经成为人们获取信息的重要来源。Python爬虫技术作为网络数据获取的重要手段,在许多领域都有广泛的应用,网络数据的采集是大数据技术专业学生应掌握的关键技术之一。大数据技术专业课程专业知识的综合性较强,知识点丰富,教师在授课的时候关注点在专业知识的传授,缺乏安排思政内容的讲解,忽视了学生思想道德及信念的培养。直接添加思政内容一是容易导致专业知识点衔接不紧密,学生学习专业知识的时候思路容易被打断导致教学效果差,同时学生对思政知识的吸收也不够好。

基于此,本文以江门职业技术学院信息工程学院大数据技术专业开设专业核心课程---数据采集与分析技术为例,在思政背景下探索大数据专业课程的实施,为培养出更多有理想、有信念、有知识、有技能的大数据人才具有重要的现实意义。

一、课程思政建设的必要性及课程特点

20205月,教育部在《高等学校课程思政建设指导纲要》指出要将课程思政融入课堂教学建设全过程,发挥好每门课的育人作用[1]20213月,《教育部办公厅关于开展课程思政示范项目建设工作的通知》指出,要加快形成“校校有精品、门门有思政、课课有特色、人人重育人”的良好局面[2]。可见,高等职业教育不仅需要培养学生技能,更要在育人上下功夫,课程思政建设是育人的一个重要环节,需要将核心价值观融入到课堂。为了实现将专业课程与思政元素有机融合的目标,国内教师针对不同的课程特点进行了多角度的尝试,探索了具有很多具有专业特色的教学模式[3,4]

江门职业技术学院大数据技术专业数据采集与清洗技术课程安排在第四学期开设,是一门专业核心课程。通过该课程的学习,学生可以学习如何使用Python爬虫进行网络数据采集,并对所采集的数据进行简单的清洗和保存。学生在学习的过程中需要分析页面结构,并定位出所采集的数据,采集数据后将数据整理保存,这个过程中学生大部分的精力在的观察数据、分析数据。如果所采集的数据蕴含丰富的思政元素,那么学生在分析数据的时候会自然的吸收思政养分,从而学生获取思政知识由传统的被动式接受,转变为主动式获取,思政内容与专业知识可以有机的融合,不会在专业知识中生硬的出现,思政育人润物无声。

二、课程思政建设的总体框架

根据数据采集与清洗技术课程特点将本课程分为五个模块,认识Python网络爬虫、页面请求原理、页面数据解析方法、selenium采集方法、网络爬虫框架Scrapy。采用项目式教学,每个任务中以项目的方式开展,共八个项目。如图1所示:

 

1 数据采集与清洗技术内容

在每个项目在实施的过程中分为课前预习、课中探讨、项目分析、项目实施、总结升华。如表1所示:

1:项目实施过程

课前预习

课中讨论

项目分析

项目实施

总结升华

在网络教学平台发布预习任务,学生查看具有思政内容的网页。

学生分享页面分析情况及思政内容个人心得体会。

教师根据项目中的问题进行分析和对重难点进行讲解。

学生根据教师发布的任务进行数据采集及清洗。

教师对学生所出现的问题进行总结分析。学生完成学习报告攥写。

 

三、课堂教学设计示例

1. 项目一:分析页面结构熟悉爬虫法规课程思政

课前预习:教师发布学习任务,学生自行上网查阅网络爬虫相关法律法规。

课中讨论:学生分享自己所了解的网络爬虫法律规范,哪些数据是可以采集哪些数据不能够采集。

项目分析:教师讲解页面的基本分析方法,给学生普及相关法律法规,让学生一定要遵守网站规范,培养学生的法律意识、道德观念和职业素养。

项目实施:学生根据教师指定采集的思政内容完成页面分析,并给出解决方案。

总结升华:学生分享在分析页面时所遇到的问题,教师对问题进行总结分析。学生完成学习报告攥写,如何对页面进行分析以及今后如何遵守相关法律法规。

2.项目四:Xpath解析数据

课前预习:教师发布预习任务,本次任务采集学习强国网站学习时评栏目“拼搏,为了心中那束光”页面数据采集,需要整个页面内容的数据采集

课中讨论:引导学生发言,对所采集的页面网站的内容进行交流,杭州亚运会上中国健儿在亚运会上努力拼搏,团结协作为祖国争取荣誉

项目分析:教师对整个页面结构进行分析,通过元素定位,找到页面文字和图片的位置,然后打开页面源码,查看文字和图片是否在源码里面,并查看页面的请求方法是Get还是Post,是否有相关请求数据。在对内容的定位过程中,学生再一次查看页面的思政元素。

项目实施:学生开始进行代码完成和程序测试,将定位的元素经过整理合并成一个完成的内容

总结升华:教师针对学生所遇到的问题以及采集情况进行总结,让学生写一份关于Xpath分析页面,以及针对中国健儿努力奋斗取得的成绩,作为学生应该如何奋斗

总结

学生通过数据采集与清洗技术课程的学习,可以掌握Python爬虫采集页面数据的方法,通过多个项目的学习,学生掌握了不同情形下数据采集方法。教学案例页面都是思政网站页面学生在学习的过程中会耳濡目染的学习到思政知识,同时根据当下不同的热点选取相应的思政内容,一方面增强了思政内容的实时性,另一方面让思政内容更为贴近生活,使得学生更快更主动的学习思政知识,将思政内容与专业知识有机融合,取得了较好的育人效果

 

参考文献

[1]教育部.高等学校课程思政建设指导纲要[EB/OL].https://www.gov.cn/zhengce/zhengceku/2020-06/06/content_5517606.htm.

[2]教育部办公厅关于开展课程思政示范项目建设工作的通知[EB/OL].http://www.moe.gov.cn/srcsite/A08/s7056/202103/t20210322_521681.html.

[3] 姜洋,张志远,何志学.程序设计课程思政系统化教学模式探索[J].计算机教育,2022(10):106-109.DOI:10.16512/j.cnki.jsjjy.2022.10.018.\

[4]路龙宾,王小银,许学斌等.Python语言程序设计的多角度思政教育教学[J].计算机教育,2022(09):58-62.DOI:10.16512/j.cnki.jsjjy.2022.09.022.

 


...


阅读全文