早在1980年,未来学家阿尔文托夫勒在 《第三次浪潮》一书中,就将大数据誉为“第三次浪潮的华彩乐章”。现在的大数据更是站在互联网的风口浪尖上,是公众津津乐道的热门词汇。同时这股热潮也催热了大学里的大数据专业。

  到底什么是大数据?本科专业中哪个专业是和它相对应的?一般开设在哪些院系?阳光高考特别采访了对外经济贸易大学信息学院副院长华迎教授,来谈一谈这个大家关注的热门专业。

  进入互联网时代,中国的网民人数已超7亿,大数据的应用涉及到生活的方方面面。例如,你在网站上买书,商家就会根据你的喜好和其他购书者的评价给你推荐另外的书籍;手机定位数据和交通数据可以帮助城市规划;甚至用户的搜索习惯和股市都有很大关系。

  在谈到大数据的时候,人们往往知道的就是数据很大,但大数据大的数据。对外经济贸易大学信息学院副院长华迎教授介绍:“现在的大数据包括来自于多种渠道的多类数据,其中主要来源网络数据。数据分析不是新的,一直都有,但是为什么叫大数据呢?主要是因为网络数据的格式、体量、价值,都超出了传统数据的规模。对这些海量信息的采集、存储、分析、整合、控制而得到的数据就是大数据。大数据技术的意义不在于掌握庞大的数据信息,而在于对这些数据进行专业化处理,通过加工实现数据的增值,更好地辅助决策。”

  本科专业中和大数据相对应的是“数据科学与大数据技术”专业,它是2015年教育部公布的新增专业。2016年3月公布的《高校本科专业备案和审批结果》中,北京大学、对外经济贸易大学和中南大学3所高校首批获批开设“数据科学与大数据技术”专业。随后第二年又有32所高校获批“数据科学与大数据技术”专业。两次获批的名单中显示,该专业学制为四年,大部分为工学。

  “数据科学与大数据技术是个交叉性很强的专业,很难说完全归属于哪个独立的学科。所以,不同的学校有的是信息学院申报,有的是计算机学院牵头申报,有的设在统计学院,还有的在经管学院。像北京大学这个专业是放在理学下,授予理学学位。大多数是设在工学计算机门类下,授予的是工学学位。”华迎教授说:“数据科学很早就存在,是个比较经典的学科,现在和大数据技术结合形成了这个专业。目前教育部设定的本科专业名称为数据科学与大数据技术,专科名称是大数据技术与应用。”

  以对外经济贸易大学该专业为例,专业知识结构包括数学、统计、计算机和大数据分析四大模块,具体课程设置如下:

  数学:数学分析一、数学分析二、高等代数、离散数学。统计学:概率论与数理统计、多元统计分析、随机过程。计算机:数据结构、计算机组成原理、操作系统、数据库系统原理、C++程序设计、Java程序设计、Python与大数据分析、科学计算与Matlab应用、R语言等。大数据分析:数据科学导论、机器学习与数据挖掘、信息检索与数据处理、自然语言处理、智能计算、推荐系统原理、大数据分析技术基础、数据可视化、大数据存储与管理、大数据分析实践等课程。

  华迎教授介绍:“数据科学与大数据技术是一门实践性很强的新兴交叉复合型学科,无论是开设在哪个学院下,数学、统计学、计算机三大块课程是必须得有。各高校在这几门背景学科的基础上,交叉融合其他的专业知识技能。如我校在数学、统计学、计算机知识体系模块中又增加了体现学校特色的财经类行业应用和外语模块,以提升学生的行业应用能力和国际化水平。根据各校偏重的专业方向,课程设置有所差异,感兴趣的同学可以具体查看各校的专业和课程设置情况。”

  随着移动互联网和智能终端的普及,信息技术与经济社会的交汇融合,引发了数据迅猛增长。新摩尔定律认为,人类有史以来的数据总量,每过18个月就会翻一番。而海量的数据蕴含着巨大生产力和商机。

  2011年至2014年四年间,我国大数据处于起步阶段,每年均增长在20%以上。2015年,大数据市场规模已达到98.9亿元。2016年增速达到45%,超过160亿元。预计2020年,我国大数据市场规模将超过8000亿元,有望成世界第一数据资源大国。但数据开放度低、技术薄弱、人才缺失、行业应用不深入等都是产业发展中亟待解决的问题。

  根据领英发布《2016年中国最热职位人才报告》显示,有六类热门职位的人才当前都处于供不应求状态,稀缺程度各有不同,其中,数据分析人才的供给指数最低,仅为0.05,属于高度稀缺。

  中国商业联合会数据分析专业委员会资料显示,未来3至5年,中国需要180万数据人才,但截至目前,中国大数据从业人员只有约30万人。同时,大数据行业选才的标准也在不断变化。初期,大数据人才的需求主要集中在ETL研发、系统架构开发、数据仓库研究等偏硬件领域,以IT、计算机背景的人才居多。随着大数据往各垂直领域延伸发展,对统计学、数学专业的人才,数据分析、数据挖掘、人工智能等偏软件领域的需求加大。

  2015年9月国务院印发《促进大数据发展行动纲要》,系统部署大数据发展工作。《纲要》明确提出了七方面政策机制,其中第六条就是加强专业人才培养,建立健全多层次、多类型的大数据人才培养体系。目前,大数据主要有三大就业方向:大数据系统研发类、大数据应用开发类和大数据分析类。具体岗位如:大数据分析师、大数据工程师等。

  “大数据分析师是用适当的统计分析方法对收集来的大量数据进行分析,强调的是数据的应用,侧重于统计层面内容会多一些。比如做产品经理,可以通过数据建立金融模型,来推出一些理财产品。而大数据工程师则侧重于技术,主要是围绕大数据平台系统级的研发,偏开发层面。”华迎教授介绍:“我们把大数据分析在业务中使用的流程总结起来,分为以下几个步骤:数据获取和预处理、数据存储管理、数据分析建模、数据可视化。在这个应用流程中,毕业生可以根据自己的兴趣和特长,在不同的环节选择就业。”

  在“教育部2015年度普通高等学校本科专业备案和审批结果”中北京大学、中南大学、对外经贸大学成为首批开设 “数据科学与大数据技术”本科专业的高校,随后中国人民大学、北京邮电大学、复旦大学等32所高校成为第二批成功申请该专业的高校。目前,我国已有35所高校获批“数据科学与大数据技术”本科专业,第三批申请结果也即将公布。

  数据科学与大数据技术是个交叉性强、跨学科的专业,很难说是完全归属与那个独立的学科。高校牵头申报的学院不同,培养重点和授予的学位可能不一样。因为课程来自于不同的学院,也有高校是联合一些学院单独成立机构来申报。从名单可以看出,在大部分开设院校中该专业都属于工学类,有个别院校将其归属在理学门类,授予理学学位。

  有志于学习数据科学与大数据技术专业的学生,可以从大学的传统优势领域和行业背景考虑选择。比如,复旦大学的大数据技术本科专业是设在大数据学院下;北京大学是在数学院开设了该专业,偏数学的内容更多一些。对外经济贸易大学该专业设在信息学院,因为财经是学校传统优势,专业还会偏重经济、金融等相关学科领域的知识。

  从2017年数据科学与大数据技术专业的录取情况看,该专业的录取分数还是比较高的。以对外经济贸易大学和重庆理工大学为例,2017年对外经贸大学数据科学与大数据技术专业在京理科一批录取最高分653分,最低分646分,平均分650分,平均分高出北京一本批次线分。

  重庆理工大学理学院院长李波介绍,学校理学院有金融数学、数学与应用数学、信息与计算科学、应用统计学、应用物理学、新能源科学与工程专业,数据科学与大数据技术是2017年获批后开设的。尽管该专业属于本科二批招生,但首批数据科学与大数据技术专业所招73名学生的平均分超一本线分左右,并且第一志愿录取率达百分之百。

  考生报考时要注意,目前获批开设的院校并非在所有省都有招生计划,还有的高校是按大类招生。如北京邮电大学该专业2017年本科就是按计算机大类招生。随着各省高考改革的实施,越来越多的省份加入新高考的序列,未来会有更多的高校施行按大类招生。

  值得注意的是,数据科学与大数据技术只招理科生,但女生的比例并不低。据华迎教授介绍:“第一年招生时,我们以为这纯工科专业绝大部分都会是男生报考,录取后发现女生还是很多的,女生比例大概占了这个专业总人数的一半儿。” 重庆理工大学2017年的首批73名学生中,男生45人,女生28人,女生比例占总人数38%。