作者:谭义红,陈治平
[摘 要] 在大数据时代,社会各行各业都需要大量数据分析人才,尤其是大数据分析人才。为此,部分高校正在积极探索数据分析人才的培养模式。在分析大数据时代数据分析人才的应用场景、岗位需求的基础上,结合信息与计算科学专业的内涵和特征,提出了一套一般本科院校信息与计算科学专业数据分析人才培养模式,给出了明确的培养目标、课程体系的设置、实践教学及平台的建设意见。
[关 键 词] 数据分析人才; 信息与计算科学专业; 大数据; 人才培养
[中图分类号] G647 [文献标志码] A [文章编号] 2096-0603(2018)01-0054-02
自1998年信息与计算科学专业(以下简称信科专业)开设以来,专家学者和教学管理人员[1-2]一直在探讨一般本科院校信科专业到底能培养什么样的人才,如何培养等问题,但至今还没有形成统一的认识。随着大数据时代的到来,信科专业将迎来新的发展机遇。
一方面,在大数据时代[3-5],社会将提供大量数据分析方面的就业岗位。盖特纳咨询公司预测大数据将为全球带来440万个IT新岗位和上千万个非IT岗位。麦肯锡公司预测美国到2018年需要深度数据分析人才44万~49万,缺口达14万~19万人。需要既熟悉本单位情况又了解大数据技术与应用的管理者150万,这方面的人才缺口更大。
另一方面,培养数据分析人才是信科专业的优势所在。信科专业涉及数学、计算机、信息、管理等学科。这一交叉学科的特点非常适合培养既有扎实数学基础、又具备计算机应用能力和信息处理能力的数据分析人才。
综上所述,在信科专业培养数据分析人才,不仅能为社会输送大量的数据分析人才,同时也给该专业的办学提供了新的发展空间。本文在分析大数据时代数据分析人才需求的基础上,结合信息与计算科学专业的内涵和特征,提出了一套一般本科院校信息与计算科学专业数据分析人才培养模式,给出了明确的培养目标、课程体系的设置、实践教学环节及平台的建设意见。
一、数据分析人才需求分析
大数据(Big Data)指的是所涉及的信息量规模巨大,以至无法通过目前主流软件工具在合理时间内实现采集、管理、处理,并成为帮助企业经营决策以达到更积极目的的数据。从某种程度上说,大数据是数据分析的前沿技术,从各种各样类型的数据中快速获得有价值信息的能力就是大数据技术。基于大数据的规模大、异构、产生速度快等特征,这给数据分析人才提出了更高的要求。
为了更清楚地理清社会需要什么样的大数据分析人才、学校应培养什么样的数据分析人才等问题,本课题组对当前大数据人才进行了深入的调研。下面主要从大数据的应用场景、大数据的岗位需求等方面进行阐述。
(一)大数据的应用场景
基于大数据的特点,大数据的应用场景主要包括以下五个方面:(1)收集大数据建立庞大数据库。(2)利用大数据分析客户的行为特征。(3)利用大数据实现运营分析优化。(4)利用大数据实现IT效率和规模效益。(5)利用大数据实现智能安全防范。
(二)大数据的岗位需求
随着大数据时代的来临,越来越多的人意识到数据正在成为政府、企业最重要的资产,并将决定着企业的未来发展。因此,获得大数据相关的人才,成为政府、企业当前迫切的需求。根据当前主流人才网站的招聘信息和大数据知识结构,可将大数据人才大致分为六类。
1.大数据分析师
岗位职责:在特定行业中,,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究评估、预测的专业人员。
知识结构和能力:数学基础:概率论和统计、数学建模等;数据分析技术和工具:SPSS/SAS/Python、数据挖掘技术、数据仓库、机器学习等;数据库技术:Mysql/nosql/Oracle等;云计算技术:Hadoop/MapReduce/Spark;行业知识:政府、金融、电信、医疗、电商等。
2.大数据应用开发工程师
岗位职责:负责搭建大数据应用平台以及开发分析应用程序。基于服務器端数据库、数据处理、分布式存储及实时并行计算、机器深度学习,通过前端数据可视化,实现商业数据挖掘、智慧决策等应用系统开发的高级人才。
知识结构和能力:基础知识:Linux、J2EE等;云计算技术:Hadoop集群/MapReduce /Spark等;数据库技术:Mysql/nosql/Oracle等;系统开发技术:Web技术/移动互联网开发等。
3.数据可视化工程师
岗位职责:负责在收集到的高质量数据中,利用图形化的工具及手段,清楚地揭示数据中的复杂信息,帮助用户更好地进行大数据应用开发。
知识结构和能力:基础知识:Linux;可视化开发工具:R/Spotifre/Qlikview;数据分析技术:数据挖掘、机器学习。
4.大数据管理工程师(DBA)
岗位职责:负责企业内部大型服务器、存储、数据安全管理工作,并对网络、信息安全项目进行规划、设计和实施,在数据安全方面有具体技术的人才。
知识结构和能力:基础知识:Linux;云平台、云计算技术:Hadoop集群;数据库技术:Mysql/Nosql/Oracle/MongoDB等。
5.大数据架构师
岗位职责:负责大数据系统研发,包括大规模非结构化数据业务模型构建、大数据存储、数据库构设、优化数据库构架、解决数据库中心设计等,实现对平台监控、辅助运维系统的开发。
知识结构和能力:核心框架:Hadoop、Spark、Storm等;云计算:MapReduce组件:通用算法、Yarn,HBase、Hive、Pig等重要组件。
6.数据科学家
岗位职责:将单位、企业的数据和技术转化为有用的商业价值,是联通海量数据和管理者之间的桥梁。