以GPU 为核心的分布式高性能计算,正在成为未来Metaverse 生态闭环中不可或缺的

2021-09-18 13:24:59来源:36Kr编辑:时寒峰

扫一扫

分享文章到微信

扫一扫

关注鹿财经网微信公众号

  原标题:以GPU 为核心的分布式高性能计算,正在成为未来Metaverse 生态闭环中不可或缺的一部分
 
  作为2021年游戏产业最热的话题,Metaverse在承载未来发展期望的同时,也依然像蒙着面纱一般让人难以捉摸。在这其中,以GPU 为核心的分布式高性能计算,正在成为未来Metaverse 生态闭环中不可或缺的一部分。

  聪图云CEO何永表示,在云游戏和Metaverse愈发趋于融合的今天,聪图云解决了几个非常核心的关键问题:高性能比、低延迟、计算节点高密度、高稳定性、覆盖范围广。
 
  无论是云游戏还是云渲染,背后都是GPU提供计算能力,而且必须是分布式(边缘)计算,因为用户是无处不在,计算资源需要就近分配。为解决这些问题,上线18个月的聪图云平台上已有超过8100个GPU,支持超过16种GPU的型号,在全球有超过38个计算节点。
 
  “目前聪图云GPU的增速是月环比增长10%,即单月有近1000张GPU的增速。由于目前GPU在全球范围内都是稀缺资源,所以GPU的租用率非常高,聪图云平台现阶段的租用率是98%。到2025年,我们的目标是希望能够做到全球覆盖有100万台GPU,能够支持100个GPU型号,能够在全球有1000个高性能计算节点,从而覆盖100个国家。”何永表示。
 
  何永:各位朋友大家上午好!我是聪图云的CEO、深脑链创始人何永,我今天分享主题是《下一代云计算:分布式云计算》。
 
  随着5G、人工智能、云游戏、云渲染、元宇宙的时代到来,人类对算力的需求呈现一个爆炸式的增长。仅仅在人工智能一个领域,在2012-2018年不到七年时间里,整个算力的需求提升了30万倍,并不是30倍。它的需求增长,远远高过摩尔定律。到2021年,整个需求的增长已经超过100万倍,所以说算力正处于一个相当于寒武纪的爆炸时代。
 
  我们看知名的预测机构Tractica做的预测,全球人工智能算力的增长将会从2016年35亿美金到2025年的1154亿美金。可以看到这个增速非常快,每年的增速超过50%。其中基础的计算能力,即AI云计算基础设施占了整体70%。前面嘉宾也说到,云游戏领域计算占到总体60%,计算已经成为人类社会发展一个非常重要的瓶颈。
 
  人工智能今天已经发展到什么样的状态?阿尔法狗2016年横空出世,曾经人类 专家预测,在围棋领域人工智能在接下来30年内都很难战胜人类。但是没想到2016年阿尔法狗打破了人类顶尖的棋手,一下子把人工智能带到全世界人类面前。虽然人工智能之前已经有30多年研究历史,但大家没有意识到,原来人工智能时代已经到来。比如在无人驾驶领域,特斯拉目前的无人驾驶10.0版本已经发布,在正常高速公路上已经不需要手动驾驶了。并且特斯拉花费6亿美金建立了一个超算中心,用来支持人工智能的训练。所以说人工智能算力需求正在呈现爆炸式增长。再比如人机对话、智能音响、高考机器人、蛋白质结构预测等,都是一些革命性的创新。
 
  人工智能有三大要素:深度模型、大数据、高性能计算。其中高性能计算就是以GPU为核心的计算。这也可以解释为什么在十年前英伟达市值不到因特尔的零头,而今天英伟达市值已经超过因特尔的两倍,这就是时代的变化。
 
  人工智能为什么需要这么多算力?人工智能有很多深度的学习模型,卷积神经网络,每个单元都是不断做计算,不断的矩阵计算、数学计算,才能算出这样的结果。这些数学计算都需要大量算力支持。像最近特别火的能够达到1750亿参数的GPD3,人类神经元的数量超过100万亿,也就是说它已经趋向于人类的神经元。
 
  这么大的模型,如果从传统技术去做,需要巨量的算力,每训练一次需要几百万美金。传统的云计算已经很难适应新时代的需求。我们看人工智能的发展,整个人工智能的世界现在向大模型发展:十年前的时候可以用几块GPU做训练,逐渐发展到现在,多模态、大规模的预训练出来,需要2000块GPU做处理。2000块的成本是多少?一次训练百万美金。
 
  人工智能时代是这样的,云游戏和元宇宙,消耗算力当然是非常惊人的,同时也可以看到整个云游戏市场增速非常快,今天主题就是云游戏,大家认为云游戏是未来游戏的发展方向。
 
  想把云游戏做好,要抓住两个非常重要的特征:第一需要低延迟,不能说玩游戏等三秒才有响应;第二游戏是非常高清的,传输速度一定非常快,像我们看一部电影,如果网速非常慢,看电影肯定非常卡。想让这两个指标非常好,怎么办?第一计算中心必须离用户非常近,比如今天在北京玩游戏,如果计算中心在新疆,可以说这个游戏是没法玩的。大家可以想到,游戏用户覆盖全球,全球每一个城市都有游戏玩家,如果有一天云游戏覆盖全球,那可以想像,想达到良好的用户体验,怎么办?今天的云计算模式能够适应吗?今天的云计算只是在全球有有限的几个大型的数据中心。即使是阿里、腾讯,也是只有很少数的数据中心。所以我们认为传统的计算模式已经无法适应新时代的需求。
 
  我们认为云计算产业已经到了需要变革的时候,需要重构整个云计算产业的需求,聪图云就是为此而诞生的。聪图云产品从四年前开始研发,在去年上半年开始上线。聪图云打造的是一个完全开放的体系:通过算力供给端的开放体系,达到人人参与,人人可以通过聪图云的技术模块加入到聪图云的平台里面,从而贡献GPU的算力资源。聪图云服务于像云游戏的解决方案商、云游戏厂商,为他们提供基础的GPU算力,从而降低他们的计算成本,提升他们的用户体验。
 
  聪图云怎么做到这些?聪图云用到的一个非常核心的技术就是区块链技术,也就是大家说的元宇宙,元宇宙里面的NFT,元宇宙怎么和现实世界结合,区块链产生非常重要的作用。聪图云通过区块链技术解决了一个核心的供给问题,从而让云计算产业从一个封闭的体系,变成一个开放的体系。比如像谷歌云,谷歌云的机器一定来自谷歌自己采购的,不会有别人给谷歌提供GPU的服务器,因为这是传统模式的封闭体系。但是在聪图云里面,完全不一样。聪图云的GPU的资源来自于全球企业,他们可以贡献他们的算力。
 
  聪图云解决了几个非常核心的关键问题:
 
  第一是高性能比。如果云游戏、人工智能想要大规模普及,必然要把成本降下来。聪图云正好提供了这样一个渠道。聪图云上面GPU成本是性价比非常高。
 
  第二人人可参与。人人可以在聪图云的体系里面参与进来,贡献整个未来人工智能、云游戏和元宇宙的发展红利。
 
  第三低延迟。因为聪图云GPU的资源来自于全球各地,可以离用户非常近,可以进行实时就近调度,对用户来说可以做到非常良好的用户体验。
 
  第四是高密度,因为游戏是覆盖全球,全球每个城市都有游戏玩家在玩。所以计算资源需要非常高的密度,在未来每个城市都需要有计算节点,甚至每个城市有多个计算节点,才能满足用户的需求。
 
  第五是高稳定。游戏的玩家需要流畅、稳定的体验。聪图云通过智能合约的区块链质押模式,保证机器供应方能够保持机器的稳定,每提供一台机器需要质押机器三分之一的资金,机器必须放在T3级别以上的数据机房。
 
  第六是广覆盖,能够在全球个城市进行覆盖。
 
  聪图云上线18个月,目前整个聪图云平台里面有超过8100个GPU,支持超过16种GPU的型号。目前主要是英伟达的GPU型号,未来会加入更多的国产GPU的型号。现在在全球有超过38个计算节点,可以说目前聪图云经过18个月的发展,经过四年研发,在GPU计算节点数量并不亚于全球的巨头。我们目前已经覆盖8个国家,并且正在快速增长中。目前聪图云整个GPU的增速是月环比增长10%,就是现在每个月能够将近有1000张GPU的速度在增长。因为目前GPU在全球范围内都是稀缺资源,所以整个GPU的租用率非常高,我们平台目前租用率是98%。我们到2025年的目标是希望能够做到全球覆盖有100万台GPU,能够支持100个GPU型号,能够在全球有1000个高性能计算节点,从而覆盖100个国家。
 
  聪图云的定位和很多云厂商非常不一样,我们定位于高性能算力的IaaS层服务,我们只专注在IaaS层,我们只关注给大家大家提供算力,我们自己并不做PaaS和SaaS。我们服务于人工智能、云游戏、云渲染、元宇宙领域,并且遍布全球,如果是中国企业在海外需要计算资源可以找到我们,如果是外国企业在中国有计算资源也可以找到我们。

     投稿邮箱:lukejiwang@163.com   详情访问鹿财经网:http://www.lucaijing.com.cn

相关推荐