5月9日下午,电气信息学院在管理学院报告厅举办了《大数据技术与应用》专题学术讲座,邀请吉林建筑大学计算机系主任徐勇教授主讲。电气信息学院计算机教研室和信息安全教研室全体师生参加了讲座。讲座由电气信息学院副院长刘舒婷主持。
徐勇教授把本次讲座分成四个模块,从大数据的来源、什么是大数据、大数据的应用及Hadoop介绍四个方面为师生们进行了讲解。首先讲述了大数据的历史、来源,早在1980年,著名未来学家托夫勒在其所著的《第三次浪潮》中提出“大数据”这个概念,《自然》杂志在2008年9月推出了名为“大数据”的封面专栏。徐勇教授特别指出,从2009年开始“大数据”成为互联网技术行业中的热门词汇,尤其是针对“大数据”的特点,由维克托·迈尔-舍恩伯格和肯尼斯·库克耶在《“大数据”时代》中提出了“大数据”的四个典型特征:一是数据体量巨大(Volume);二是数据类型繁多(Variety);三是价值密度低(Value);四是处理速度快(Velocity)。这便是“大数据”著名的4V特点。
接下来,徐勇教授还突出强调了大数据在现代社会的应用,他列出社交软件、商务软件、门户网站等我们现在常用的互联网软件,表明现在的互联网公司都是大数据公司。他还生动的举例了身边的例子,如尿不湿与啤酒,这两个看来是互不相干的商品,但是如果出现很多父亲为小孩买尿不湿顺便再买啤酒的信息反馈时,这两个商品就会在超市里被摆放的比较近一些,它们之间就产生了商业关联。这些生动的生活事例,展示出目前大数据在身边现实生活中的广泛用途,徐勇教授继而谈出了现在大数据所具有的商业价值。此外,徐勇教授对Hadoop大数据处理软件进行了介绍,并讲述了Hadoop的功能与用法。
徐勇教授的专题讲座,话题新颖活泼,语言幽默风趣,使师生们受到了启发,开拓了视野。在问答环节,师生们踊跃提问,各抒己见,徐教授也一一作出解答。同学们体会说,徐教授的专题讲座留给我们许多需要深入思考的问题,比如现在一些大企业的数据量已经接近EB量级,而且数据类型的多样性也对数据的处理能力提出更高要求;还有数据价值密度的高低与数据总量的大小成反比,如一小时的视频,其中有用数据可能仅有一二秒,如何通过强大的机器算法更迅速完成数据的价值“提纯”,这些都是目前大数据背景下亟待解决的难题。当然,这些问题也提高了我们进一步学习的兴趣。我们一定会牢记徐教授对大家的寄语,即期望年轻一代在大数据时代下要有全新的思维方式,要有“开放性”、“深刻性”与“创新性”的品行。(电气信息学院供稿)