万字详谈:如何破解元宇宙算力之困?(下篇)

2024-03-30 16:32:11 来源:本站 作者:

书接上文,让我们接下来了解一下元宇宙算力之困的趋势和未来行业发展机会。

【趋势篇】3D内容程序化生成及AIGC技术发展

1)程序化生成和AIGC的发展趋势是怎样的?

黄浩智:对AIGC,目前行业评论褒贬不一。换脸技术能帮助你真实地得到一个新的视频结果,通过AI能力,已经能一些做相对成熟的应用。换脸技术能帮助你真实地得到一个新的视频结果,通过AI能力,已经能一些做相对成熟的应用。另一方面,3D化之后,特别是跟相对真实的光照发生交互之后,这种直接处理图像的技术一方面使视频的连续性被破坏,另一方面实时加入AI计算的算力成本非常吃力。但也有一些突破思路,比如Houdini这个工具,通过一些预先编好的程序,直接做程序化生成。元象也在思考如何利用机器学习方法,做程序化生成,让整个生产过程更加智能化。具体来看,如果要生成一座城市,通过直接读入地图,抓取里面的路网信息,自动把路和楼房大概的布局生成出来,通过预先设置的程序化生成不同风格的楼房,很快就能把整座城市建完。2)AIGC相关技术的成熟度怎样?如何能节约成本?郑暾:关于AIGC,通常设想的终极形态是利用AI把想要的东西一次全部生成出来,但目前技术可能还做不到。其实有一种折中方案,即AI生成一部分内容,人再去后期调校或修改。黄浩智:CG相关的行业,无论是做游戏、做影视,还是做动画,包括各种3D内容体验,人力成本非常高,除了发挥创意外,有很多重复的繁琐工作要做,因此他们非常关注这方面进展。例如动捕回来的数据往往有抖动,或因为遮挡或某些原因没捕捉好,可能都需要美术团队手工修复,修改过的数据部分可以作为学习目标,然后训练模型,也可完成自动化修复的部分工作。另一方面,AIGC在初期能帮助人创作故事。曾经看到有个蛮有趣的工作,虽然还是2D,但能通过输入文本直接把画面呈现出来,一定程度上解放了艺术家刚开始需要做的构思或获取灵感的工作,却没办法完全替代人去做创作部分,但这种方式可以通过不同组合的画面辅助想象力发挥。郑暾:不仅在美术方面,AIGC对游戏也有一定帮助。比如用AI生成内容,甚至生成数值和故事,如AI自动模拟游戏体验,未来还会有革新发展,甚至有可能整个游戏都是由AI制作。云游戏在一定程度上能够帮助解决这个问题,目前AI整体网络已经往巨型化的方向发展,云游戏借助云上的强大算力,一定程度上也能解决这方面的算力之困,是AI未来更好更充分发展的方向。黄浩智:我们团队之前做过王者荣耀AI,在AlphaGo、AlphaGo Zero之后,这种对战类AI技术已经很成熟,但难的是把AI行为语言做得足够像真人,或者足够像异世界生物,有很多类似开放性问题可以探索。3)大规模预训练模型会对AIGC带来哪些新的技术变革?郑暾:即使GPT4再优化,也不会达到特别小的状态。因为本质上,整体的AI都是一个非常复杂的多项式,这个多项式要能处理的问题足够多,但它的参数太少,表达的能力就达不到。即使在云上面,使这个技术被更多的人或者公司用到,但想把这种巨型神经网络压缩下来,还是有一定难度。黄浩智:大规模预训练模型是一个非常重要的方向。通过学习海量数据能使模型预测出不错的效果,但实际上并没有理解到推理相关内容,可能只是在做记忆或数据压缩工作。大模型预训练模型肯定会持续发展,但它短期内不会取得很大的突破,其趋势更综合化,包括同时解决更多不同的问题,承载更多数据记忆功能。另一方面,在AI跟图像的结合上,有一些非常小的模型,甚至是在线学习,它通过预学习一些数据,把它输入进来,推理过程中参与的参数就会变少,神经网络本身去计算的部分也会变少。拿超参数举例,如果它能把和你长得比较像的东西预先记好,下次你再来一个类似的数据输入,它其实已经是经过非常多轮计算的结果,加上一个小网络,它就能有还不错的效果。郑暾:这样AI整体的小型化,在特定问题上的小型化应该会发展挺快。黄浩智:对,还有它的存储会更大,因为需要记录一大堆预先编码好的东西,使得计算部分网络虽然少,但其实需要去预记录这些经过,可能也是神经网络多重处理这样一些信息才能够去落盘,需要更多一些存储。郑暾:这其实也更像是云系统的或云上的一个优势,可以几乎无限大的空间去把这些都给存下来,随调随用。4)现在AIGC基本都是生成二维图片,什么时候才能生成三维的物体呢?黄浩智:目前的3D数据太少,虽然游戏里面有很多,但风格非常特异,而且很多没有开源数据。郑暾:数据可能是一方面,体验设备是另一方面。目前用户媒介使用主要还是在手机、电脑这样的平面屏幕去体验,即使我们生成的是3D,它最终渲染出来的还是2D的画面,可能等以后AR、VR这种沉浸感设备更流行之后,大家的需求越来越多,自然会推动一些人去更好地解决这些问题。5)如果破解了算力之困,还会有什么有趣的应用场景?郑暾:我认为可对虚拟世界赋予更多的想象力,并拓宽思维。作为元宇宙的基建公司,我们也很关注相关产品的建设。目前大多数应用场景都只做一件事,即把真实世界搬至线上。比如在一个光速只有现实世界十分之一的虚拟空间里会是怎样的,在空心圆球的世界里面生活的一群人会是怎样的,可能这里的猫有六只腿,鸟能跑得飞快,它们跟人进行交互时是否有很有意思的交集。这可能是可以拓展的方向,因为这不仅是把渲染算力简单释放出来,还充分应用了逻辑层面的算力。黄浩智:虚拟世界的魅力在于用户可根据自身想法去进行各种创作,创作工具起着至关重要的作用。游戏制作需要从头搭建场景,由于不同游戏资产的风格完全不同,基本都需从模型做起。当积累到一定资产数量时,允许用户直接使用这些资产,甚至加上AI算法,游戏风格化迁移则更加方便。有了资产之后,可以利用智能化工具快速组织一个游戏世界,或者其它3D应用世界,实现摆放物品之间的关联提示,随着这些AIGC相关的工具越来越完善,整个3D内容创作过程会更加便捷,也会有更多不同类型的应用去展示。接入层仍然具有趣味意义,目前视觉类传达设备还不够商业化,但具备一定的成熟度。比如Oculus Quest 2已经到了行业认为可以接受的状态,但AR眼镜还有较长的路要走。除了视觉类设备,比如脑机接口、触觉嗅觉传感器等,都可以使内容传达更具趣味。直观体现是创业团队目前在做动作捕捉技术,传统手柄或者键盘操作与虚拟世界交互,无论是光学动捕还是惯性动捕,都需要穿戴式设备。因此我们需要关注实时视频动捕技术,用很先进的方法捕捉主角动作,跟自然环境发生交互,用来驱动他的虚拟角色,交互方式的升级也是非常重要的方向。郑暾:元宇宙基础设施建设与虚拟世界呈现具有正向相关关系。比如像《黑客帝国》那样的脑机接口,或未来将不需要语言,在虚拟世界中想到某一个画面,或某一个场景,它就能具象化生成出来,基于此再去做一些内容的创造和场景的搭建,可能会更有想象力。【创投篇】畅想元宇宙行业的未来1)从投资人角度看,还有什么值得探索的创业方向?蔡霖:在元宇宙里,有些公司产品业务类型会适合财务投资,有机会成为平台型公司。有些类型是单点技术、产品、渠道的突破,如果此类产品服务用户需求没有那么大,市场天花板就会明显,这类的公司就很可能被收购。我们的投资小组也研究了Epic、Unity、Adobe、Roblox、Meta这些公司近年的收购。举个例子,素材公司单一存在的话产品单薄,加上工具和交易平台,有不同的产品矩阵,使其竞争壁垒变得更加强大,才能慢慢成为平台型公司。我们也鼓励创始人在了解自己的产品定位后,调研产业链,了解客户需求创造有价值的产品。把真实世界搬到元宇宙,从0到1的切入点,跟从1到10和从10到100的切入点都是不一样的。初创公司资源有限,因此需要在早期明确产品切入点和优先级,在后期明确技术和产品的可拓性和延展性。2)如何评判判断一个团队或产品方向是否优秀?孙雷之:我们是一家专注超早期阶段的投资机构。我们评判项目主要有三个标准。第一个是技术驱动。我们希望找到有核心技术的团队,有很强的技术壁垒,能够通过技术变革带来新的产品形态和商业模式。第二个是市场规模和商业模式。我们希望技术创新能在商业场景中找到很好的应用,未来有爆发的潜力。第三个就是人。人是非常重要的一环,我们希望看到创始团队有非常强的学习能力和团队组织能力,创始人需要找到好的合作伙伴,去补齐自身的短板。比如说一个技术出身的创始人,我们希望他能找到一个对产品、商务、战略都有清晰和深刻的认识的合伙人。如果创始人是做商务、产品出身,我们希望能够搭配一个很强的技术合作人,为产品打造更深技术的护城河。3)这三个标准有优先级吗?孙雷之:我个人觉得人是排第一位的,尤其对于早期创业公司。技术可能会不断迭代,产品可能会有新的形态或应用场景,这些都会随着公司的发展而不断变化。只有创始人拥有很强的学习和迭代能力,可以随外界环境变化不断调整和升级,公司才能走得更远。排第二位的是技术能力。大家都不缺创业想法,但真的能把想法变成一款优秀的产品,能够提高使用效率和用户体验,这跟技术是必不可分的。排第三位是商业模式,这可以随着公司的成长发展去不断调整和优化。蔡霖:团队、产品技术、周期还有市场规模,是我们评估团队时非常重要的标准。每个产品和创业公司都有周期,有时在风口,有时在低点。创始团队有坚持的初心和韧性极为重要。在产品需要转型的时候,如果创始团队有聚人的能力,就能吸引到一群聪明的人并及时调整方向,及时看到新机遇,团队一起成长越来越强。4)元宇宙背景下,像远程办公室的,大家能以相对松散的状态,实现多人为某个项目集体贡献,这样会成长出不一样的团队吗?蔡霖:2020疫情开始时,大家就已经在分散办公了,当时我们公司有套体系用以鼓舞远程团队士气。随着世界越来越全球化,在非洲、东南亚、印度、欧洲、中东等地区都有这种分布式工作流和技术员工远程协作支持的服务提供机构。通过虚拟经济虚拟办公软件的利用重新调整社会分工,提供人力价值可拓性,可以让一个公司在受地域限制的情况下,可以快速发展产品和业务。分布式远程办公难度在这个过程中如何跨国地去交流且产生信任感,让员工感受到不只是一个合约的经济绑定,这是需要创始人和团队给员工工作赋予更多的意义。我还蛮期待有一天World is One,全球跨界人才能聚到一起,协同创造出更有价值和创意的产品。孙雷之:过去两年很多人一直在居家办公,由于疫情原因也不能出差,所以很多初创公司都是非常全球化的团队,员工分散在不同的国家。随着技术的不断发展,元宇宙带来了很多3D办公的新体验,未来还会出现很多更有趣、更有效的办公解决方案,我们也非常期待在这个领域看到更多的创业公司和创新产品。5)虚拟世界产生了更多的键盘侠,作为世界的建造者,我们有什么办法去解决?郑暾: 不是虚拟世界产生了更多键盘侠,而是因为随着信息流通更高效或虚拟世界诞生,键盘侠的声音更容易传播,这其实是信息充分交流的必然产物。黄浩智:用另一个层面解读,之前这种2D化的信息流,它是一个高度的抽象,它的中心其实在信息本身。个人觉得人与人的交流之间除了传递的信息本身很重要之外,其实有一些非常小的细节,比如为什么有时候大家会觉得面谈会能够亲切,是因为看到小的表情或者一些肢体语言,这些其实都被一个简单的头像去过滤了。假设到3D化的场景内,假设虚拟角色能够非常实时、非常准确地去反映无论是表情还是肢体一些变化,甚至你非常激动的时候面红耳赤,或者说你比较平静的时候的一些小点声。如果这些能够去传达出去,其实是传统的文字信息本身之外的,我觉得是人与人交流之外的重要维度。郑暾:这一点上其实表情或者说像语气等等这些,其实一定程度上也是元宇宙里面的算力之困。毕竟想要能够很好地去表达你的表情,你作为脸部模型,可能三角面片的数量就已经要上升到巨大的一个数量,这也是我觉得可能为什么未来的元宇宙或者虚拟世界做到好了以后,一定是能在云上或者说至少是做不同的协同下才能做到的,而不是仅仅靠单机的这种情况能做到。其实像之前,几个月前Unreal发布了metahuman的捏脸IDE,甚至当时为了捏好那张脸的IDE都是一个云化的IDE。我觉得这也算是一个能够通过云来帮助我们生产更多内容,来破解所谓算力之困的这么一个很经典的应用。

6)虚拟人现在的情况、技术发展还有未来的商业应用是怎样的?黄浩智:与其说是虚拟人,其实更多是数字人或数字化身的概念。当你觉得虚拟人物有趣,很可能是背后的灵魂吸引了你。而虚拟人本身传达灵魂有趣的东西首先是通过面部和动作精确地表达人的感情。此外,人还是视觉动物,虚拟人本身具有吸引人的外貌也很重要,这里指头发、皮肤的真实感,或者偏卡通化的形象设计。其次再根据风格减弱或增强信息,并形成新的风格,这时候需要强调不同信息的质量,这个是虚拟人特有的维度。另一方面要去驱动动作的输出,可能还需要不同类型的声音及定制化赋予虚拟人物生命。郑暾:虚拟人物不仅局限于人,也可以虚拟一些不一样的生物,比如在虚拟的世界里,用户可以通过虚拟生物实现,养大熊猫、孟加拉虎、非洲象,甚至养已经灭绝的远古猛犸等,在元宇宙这样的虚拟世界便会获得多重体验。除了去体验身份,我觉得更脑动一点是能不能有机会去体验一下他的大脑。比如我作为一个工程师可能就特别期待,如果有机会能像浩智这样的AI博士那样去思考一个问题,会是一个什么样子的场景,我觉得这个甚至不仅能共享身份,甚至能共享大脑,这些可能都是未来一些很有想象力,很有意思的东西。蔡霖:科技确实给了我们一个窗口,让我们在多个平行宇宙、虚拟世界、现实世界切换,实现这种跨时空、跨物种、跨历史的这种交互,可能这个是之前任何一个时代都完全做不到的。记得在2017年的时候,在硅谷的一个展会,让用户戴VR眼镜体验当沉浸式进入一个和自己不同性别、身份、人种的角色里的感受,体会不同境遇,不同群体和个体间的不免因为境遇不同有隔阂,互相理解看似简单但也很难强加。随着AR、VR的技术和沉浸式内容越来越成熟和正向引导,可以协助我们提高对不同群体的一个感知力和同理心,这样可以增进大家的互相理解。孙雷之:记得小的时候看电影特效,觉得非常的酷炫,当然成本也是非常高,只有电影大片才能够承担得起这样高额的费用。现在随着技术的发展,比如动作捕捉、虚拟拍摄等创新技术,虚拟世界其实已经离我们非常近了,我们可以近距离地亲身体验到这样一个虚拟世界。在过去只能在电影特效中才能够看到的场景,现在已经触手可及,这是一个令人激动人心的时代。7)小公司和在大公司创业有什么区别?郑暾:我也是在大公司和小公司之间来回跳跃,大公司和小公司最主要的区别是大公司有非常多的资源和人脉,可以去做很多很大的事情,更按部就班。小公司相对这一点来说,资源或能触达的人相对偏少,但反过来,小公司也更能施展个人才华,更有机会得到成长。黄浩智:我觉得就是一个词概括,即当家作主。在小公司更有当家作主的感觉,很多事情需要亲力亲为,在大公司其实就是踢皮球的艺术,大家把工作仅仅作为工作,但在小公司更多是事业,或者是你人生体验的一部分。8)创业最艰难的时刻是什么时候?郑暾:可能是技术上遇到了瓶颈,公司又遇到了各种各样的问题。作为创始人,不仅要对事负责,也要对员工负责,当这些问题同时涌现的时候,可能会有无力的感觉。但反过来,当你迈过它,它可能也会成为你最有成就、最开心的时刻。黄浩智:元象成立不久,我感觉可能还没到那个最艰难时刻,但可能也经历过一些,具体不确定,因为未来是发展的。从已有的经历来说,我觉得最困难的时候是初期做团队的组建,会比预想要困难,要找到志同道合的队友其实是一个比较困难的事情。除了大家在大公司招人,通过能力或者简历去简单地筛选,小公司和创业公司去做愿景和动力的匹配真的非常重要,有点看缘分的感觉。9)什么时候最开心或最有成就感?黄浩智:当你看到产品能够触达用户,能够收到反馈,无论经过再多的困难,其实都是非常开心的事情。郑暾:像我刚才说的,当迈过了那道坎,就会觉得自己无所不能。10)对于创业,你们最想招到什么样的人?他需要具备怎样的知识框架?郑暾:对于创业,知识框架可能是其次需要考虑的东西,首要考虑因素是对方是否具备自驱力、足够聪明。因为跟这样的人一起合作,很大程度上能帮你解决很多问题,甚至在问题发生之前就未雨绸缪,这对创业公司至关重要。创业公司核心竞争力就在于它能很快地把想法变成现实,把事情做到位,这个过程中其实就需要能够把这件事情做到位的人,总结下来就是聪明且有自驱力的人。黄浩智:据此我想补充好奇这个点,创业公司是不断变化的地方,过往经历更多是证明此人具不具备学习能力,或者完成事情时的态度。但创业公司要做的肯定是新的事情,因此过往经验肯定不可能完全匹配。郑暾:其实像好奇心是驱动大家去创业的一个很大的动力,通过不断地探索,不管是技术上的未知、管理上的未知,还是人上面的未知,那么充满好奇心的人可能就比较适合来创业公司能够一起成长。孙雷之:我个人比较欣赏有激情和热情、对世界充满好奇、有很强学习能力、同时还很有趣的创业者。11)谈一下对公司的愿景,以及个人在元宇宙发展的历史进程中想要充当什么角色?郑暾:最大的希望是技术能真正改变世界。我是偏工程偏理工出身,对公司最朴素的愿望就是带领公司通过技术让世界变得更好,不管是虚拟世界,还是与让真实世界互联。黄浩智:元象创始人姚星有一句话叫技术创造价值。从个人或公司的角度来说,我希望3D内容触达率更高,成为新的媒介技能,即继图片、视频后的新媒介。如果要让3D媒介繁荣起来,制作手段、呈现手段都要达到一定高度。最终愿景当然是希望能够为大家带来价值。

相关文章
 
奇趣图片