设为首页 |  加入收藏 欢迎访问教育之声网
重要声明:
“教育之声网”推送文章除实在无法确认,我们均会注明作者及来源。部分文章或图片推送时未能与原作者取得联系,若涉及版权问题,烦请原作者联系我们,将会在36小时内删除处理,特别感谢,也特别欢迎您的投稿。
滚动新闻:
首页 > 校长之声 > 正文
北航校长怀进鹏教授:网络计算的机遇
2013-04-12 09:07:04   来源:教育之声网   

  【教育之声网4月12日消息】信息技术发展给我们带来很多变化,也经常让我们眼花缭乱。因为信息技术一直以需求为主,作为人造的技术,社会需求和人类本身的理解创造了很多新的问题。

  今天跟各位一起分享一下我对当前网络计算,特别是以“大数据”为主,究竟什么是大数据?大数据有什么价值?以及未来应该关注什么?在这里跟大家一起交流。

  1969年是技术发展、社会发展有两个事:

  第一,1969年夏天,美国两名宇航员登上月球。这个事件是大挑战中,把治疗癌症、登月等作为攻克,1969年挑战成功,进入太空。

  第二,10月29日,互联网最早的两个节点被连接起来了。本来在粮站期间,为了避免中央中心被打破,能够分散不同的地方,信息不能终端、指挥不能终端。没有想到在社会实际应用当中创造如此多的发展。

  有位心理学家Licklider提出一个设想,能不能把世界上所有计算机能够连接一起,可以获取数据,并且同时多台计算机。我们把他称为计算机互联网一个先驱者,最早提出了未来发展的设想。

  70年代和80年代是信息技术和计算机的角度来看,有两个重大进展:

  第一,TCP、协议的实现使得初步的网络计算能力产生,也为互联网发展奠定基础。由此,提出TCP协议两位学者获得了计算机的诺贝尔奖。

  第二,操作系统发展,操作系统进一步把CPU、内存、文件、进程、I/O以一种“虚拟化”的方式来避免用户过多了解内部复杂的信息结构和管理模式。这种方式更有效利用好计算机的存储能力。正是这个贡献在计算机操作系统当中有两次授予图灵奖。

  另一方面,如何利用互联网计算机联系起来以后利用后台更多其他的资源工作,实际上一直是人们追求和探索的重要一部分。

  信息技术是和人们的需求、对它的设想共同绑定在一起推动力技术的发展和应用的进步。过去的二十年当中,计算速度和存储容量加快,CPU性能提高了3500 倍,价格下降了45000倍和360万倍,这样一个大的背景使得获取信息的能力,在通讯当中提供传输问题都得到了极大的提升。给我们提出一个新的问题,未来IT技术是否还能计算给出差异。如何更有效提高信息技术能力,特别是计算和存储能力性价比不断提升的时候。

  IT的理念是多快好省,IT的生存法则是领先。在IT领域枪打不了第二只鸟,这个行业发展非常残酷。07年美国总统报告美国经济生产力50%得益于科技创新,1/3来自于信息产业。在西方发达国家没有一个国家不把IT技术作为引领产业发展和技术创新最重要的一点,也在不断更新引领由于重大需求技术可能的设备推动技术。包括最近几年美国推出未来信息创新的云计算、移动计算在经济发展的重要位置,以及产业性对未来发展的思考,对未来新的规律的岁考。

  1993年传输通讯的费用达到2000美金/2G,2007年以后不足1美金,大幅的下降。正是在微电子、信息技术本身发展中推到了今天这样的地步,当网络带宽成为廉价资源,不再在意上网时间会占用投资比例和花费成本的时候,发展超过摩尔定律。充足利用资源获取网络计算,整个互联网进入新的时代,这是由于IT技术的发展。

  由于这样的变化终端不再需要复杂系统的配置,而更多的我们需要后台的支持。无论是智慧城市还是云计算,是由于IT技术导致了成本大幅下降,人们可以把更多应用需求集中到后台来处理,这样的处理变革是互联网出现了第二次新的发展。也就是说,如何做好数据和大规模数据处理的服务变得越来越重要。

  智慧城市也好、云计算也好、物联网也好,是由于我们有了大量可处理的数据、带宽费用下降,给我们带来一种新的变革的机会。现在整个产业布局当中,Google公司是一个互联网的公司、软件公司还是电信公司?实际上我们看到Google在进入移动通讯当中非常厉害。我们也知道它的安卓系统,也知道它在这里还有很多操作系统。实际上一个传统互联网的公司或者发展公司进入通讯领域创造了很多奇迹。

  微软也是一样,在移动互联网当中也有很大的贡献,苹果公司是传统中做的尽善尽美,在这个部分把消费联系起来、互联网联系起来、传统技术整合起来。

  在这样一个大的背景下,由于IT本身的发展导致IT真的是和CT结合,形成了ICT,我们知道了苹果进入通讯电视、Google进入通讯电视、雅虎、微软,也有中国三大互联网的公司。百度、腾讯和阿里巴巴。在这样一个背景下,巨大的数据处理能力就为互联网未来的发展创造很多的机遇,比如社会网络的发展。

  有了数据为什么有这么多的价值?也许还记得第一次预测到甲流,现在H7N9比较热门,甲型H1N1不是专家预测出来,而是Google公司提前算出来的。 Google公司通过上网的人来了解有这样的症状应该吃什么药,为什么用了这个药好?算了几千万模型发布出来。它发现了在大数据背后的社会价值和商业价值。

  同样,百度通过获得用户搜索行为、浏览行为,建立用户模型产生更多的价值。三年前我跟马云聊的时候,我觉得世界经济危机、中国经济走势数据最有能力的,完全是真实的数据、在线交易看到市场,这里有很多可以挖掘和运营的,并且社会服务有很多有价值的信息,包括日本海啸也是,通过 facebook提前预测美国大选结果等,中国也有大量利用微博信息。有新的表示方法和预测能力,也有对热点定位和分析,预测发展需要。

  互联网越来越走向以人为中心,带来很多新的机会。如果说在计算机和信息技术当中出现第一次变革是PC时代,创造出软件是一个商品,互联网创造了第二次新的产品,信息本身变成廉价的产品。而当前由于廉价的网络带宽和微电子技术快速发展,互联网第二次价值就是数据价值逐渐开始成为真实。

  但是如何驾驭这些数据?一个方面数据是泛滥的,实际上大数据没有什么太多的价值。所以经济学人两年前、三年前说数据泛滥,从稀缺到丰富本身带给我们很多问题。另一方面,前面提的社会网络、大数据的挖掘,以及在经济、医疗、信息领域当中同样带来另一方面高度的价值。

  因此,如何来驾驭大数据?使得这些低密度、杂乱无章、海量的数据所用这也是重要的。

  现在谈了很多云计算,云计算后台处理以服务为导向,本质计算是大数据作为处理应用支持的服务。而云计算本身并不能保障服务质量,只是提供大量的基本支持。所以在云计算和大数据当中,我们如何认识它后面技术的规律和应用的价值,也许可以为我们增加很多新的对技术的理解。所以,我想大数据后面其实我们已经认同一个观点,有了百度如果分析数据的话,能掌握用户的浏览行为。有淘宝可以知道一部分人的购物习惯,有了新浪也许可以对思维习惯和对社会认识进行分析。在生活、购物、思考实际上可以在这些进行。美国政府和欧洲正在加快当前经济紧张情况下投资大数据,这个问题所反应的是大数据的背后价值。

  什么是大数据?有很多不同的认识。但是一个社会的观点处理不了的数据是大数据,而且找到更有效的方式。大数据很热门,人们也定义了思维的特征,不仅量大传播快。数据处理本身带来的价值计算机信息技术重要的内容。我们分析用户在线的习惯,从而做好商业促销和网络。在商城里可以通过一年、半年的购物习惯来摆设商品的位置。不同对数据的分析在商业价值的利用以及在研究方面都有很多。比如说以单词匹配来找错误。

  大数据分析处理当中,由于计算存储能力给带来的新的机会。医药方面,也有大量数据处理的结果。数据处理有价值。未来五年之内,大数据发展势头越来越高。同时,分析了当前企业当中目前大数据已经投资的 30%和将要投资的企业主要分布和行业特点。进一步推动全球大数据需求和处理方面的投入。

  究竟大数据价值在哪里?开普勒和牛顿同样是天才科学家,只是牛顿名气比较大。开普勒基于他所得到的数据计算出来行星的位置,准确程度即使到今天现代科学仪器仍然相差不远。也导致了大数据科学研究的四种模式,实验科学、理论科学、计算科学到数字科学。这里研究有很多问题,虽然计算机信息技术是人造科学。但是在反应出自然的科学当中,也开始有这类问题。

  这类问题有什么?数据和应用是多样的,复杂度高。有不同的表达方式,和原来结构化数据有本身的差异。如何获取、建模、存储、查询、共享、分析?并且把杂乱无章的表现出来,本身很重要的问题。

  数据如此多、变化如此快,怎么挖掘出有价值的东西。大数据不是每个人海里捞针,沙漠里找到黄金。这是大数据价值。

  五年前facebook数据库存15个TB已经非常重要,三年之后每天有70TB而且压缩过的数据放到数据仓库。它是一个社交网,带来的困难。而且基本上面临的问题是100个节点到1000个节点,甚至更大,传统的不能用。导致了一些新的变化。

  十二年前,有一篇很好的论文,一定的数据量的情况下算法的好与坏决定了量。在大数据面前很多样,采样选样的精确性,不精确的计算带来很多新的问题。在处理问题的时候,发现最优的算法和最简单的算法,数据规模很大的时候简单的算法更好。

  因此,在这个领域当中,传统的数据库,算法和结构是过去软件的特点,现在发生了新的变化,这些变化要做什么?有很多问题。由于时间关系这里只给一点,过去算法是要采样,尝菜,炒菜没有熟尝一下。算法要有新的方式,不是传统的东西。另外,还有还原方法,还原用最简单的方法。

  计算对于系统的要求也有很多,以前是操作系统和数据库。在结构化处理方式成为产业化推动应用的最大支撑。未来同样会出现新的数据处理,而它的数据处理应用能力将会有更大的变化。我想大数据下是有价值的,价值背后也有很多技术和科学问题,如何从单独专业到一个新的购物中心的发展,未来互联网运营和服务模式也会发生变化,这样变化会带来机会。这样的发展就是大数据当中作为学术界研究数据表示的问题。算法设计、系统问题以及挖掘和处理,也包括现在的智能搜索,以及利用众多的智慧完成。

  有很多新的机会,由于时间关系不多讲。大数据我个人认为是产业,是资源,更是科学。发展与推动和应用是相关的,需要形成一个产业链共同推动,所以也期望在大数据发展当中,互联网公司、应用公司以及学术界能够在知识需求当中来推动和带来中国在数据科学和产业当中的发展。

相关热词搜索:北航 校长 怀进鹏
相关评论
联系我们 | 版权声明 | 我要链接 | 教育之声简介 | 法律顾问 | 广告服务 |
Copyright © 2000-2012 cedcm.com.cn All Rights Reserved.
投稿邮箱:edu@cedcm.com.cn | 京ICP备12037710号-1 | 总机: 010-88687877 | 传真: 010-88682677
本网站所刊登的教育之声网各种新闻、信息和各种专题专栏资料,均为教育之声网版权所有,未经协议授权,禁止下载使用。