圆桌认知智能领域会出现下一个商汤吗
周湘豫、程丹年11月9日至10日,科技智库「甲子光年」在北京举办了「甲子引力」大会。在11月9日下午的“数据智能”专场中,南京大学人工智能学院教授俞扬、猎户星空CSO王兵、奇弦智能创始人陆云波等嘉宾参与了“数据智能下一阶段:从感知到认知”主题圆桌。甲子光年创始人、CEO张一甲担任本场圆桌的主持人。圆桌要点总结:1.AI的突破方向可能在现有的认知边界之外,但是一定存在。2.人类语言本身具有低效性,是低维向高维的映射,这也导致NLP技术试图让机器理解自然语言的尝试面临较大的瓶颈。3.人工智能的未来方向是智能决策和智能支持。4.深度学习与专家系统和知识图谱思路的结合可能是未来AI技术突破的方向。圆桌实录如下:主持人:张一甲甲子光年创始人、CEO圆桌嘉宾:陆云波奇弦智能创始人俞扬南京大学人工智能学院教授王兵猎户星空CSO张一甲:我刚才在那边的会场主持了一个圆桌,刚下来没过两分钟就被叫到这边的会场,有一种穿越的感觉。那个是“基础科学”论坛,跟北大的院长、老师、教授聊了聊基础科学,现在进入到业界,聊一聊当下最热的选题之一,数据智能。今天现场几位都是老朋友,大家用两分钟时间简单介绍一下自己。南京大学人工智能学院教授俞扬俞扬:我是来自南京大学人工智能学院的俞扬,主要的研究方向是决策智能。前面几位演讲嘉宾也提到了决策,但在我来看,更多是决策辅助和决策支持。我们说的决策,则是像打游戏这种场景下的决策,叫做自主决策。换句话说,原来需要人来做决断,现在完全由机器替代,这是我做的方向。王兵:我是来自猎户星空的王兵,我们是一家服务机器人公司。行业里有非常多服务机器人公司,我们和其他公司的差别主要在于,我们是以完整AI技术链条为基础,软硬一体的综合性公司,用到的所有语音视觉识别、导航算法都是公司自主研发的,基本没有用别人的解决方案。行业里也有很多提供算法的公司,但在服务机器人领域,对场景的要求特别高,有很多场景的环境比实验室恶劣得多。我们花了大量时间把软硬件整合,在服务机器人的应用场景里做了比较深的挖掘。陆云波:我目前是同济大学的老师,自己做了一家公司,叫奇弦智能,三年半时间融了三轮资。呼应一下俞教授,他说智能要自主决策,要像打星际一样,我上大学本科时就打《星际争霸》、《红色警戒》,这些游戏让我想到:有没有可能企业也能像打游戏一样做经营决策?前面说过数字孪生,美国军方一直有一个梦想,打一场战争时,把整个战场在计算机里重构出来,以替代原来的沙盘推演。今天在某种程度上,一些实体行业,比如制造业、物流业,我们已经有相关案例,也已经把1.0版本做出来了。11月1日时,我们在同济校友科技博览会上也做了专场发布,奇弦智能希望把一个公司整体复制到计算机里,真正让智能帮老板做一些决策。张一甲:陆教授公司11月1日在同济大学的发布会是我主持的,我亲眼目睹了发布会的过程,非常酷,让我印象深刻的是,他们完完全全把港口、物流这样的体系全息建模,然后在这个过程中支持决策,听起来好像陆教授和俞教授两个人的领域有相关性,王兵总坐在他们两个人中间有没有不舒服?王兵:还好还好。张一甲:对于服务机器人来讲可能不是很在乎感知还是认知,反正你都有是吗?王兵:我们链条更长一些,从感知、认知、决策到执行,在服务机器人里都得有。张一甲:我们两个人的立场是一样,我们俩都是需求方的立场。你是机器人的需求,我是普通人类的需求,我们一起看一看这两位誓要把AI推向认知智能领域的科学家怎么回答我的问题吧。感知时代:自然语言的局限性“真正解决认知问题,本质上是解决通用的人工智能。”——猎户星空CSO王兵“我们今天的目光聚集在那个地方,其实不一定是对的。未来的方向可能在我们的认知边界之外,在另一个地方,我相信它一定是存在的。”——奇弦智能创始人陆云波张一甲:最近确实有这样的说法,人工智能的下一个黄金十年在认知领域或者决策领域。那什么是感知?什么是认知?在我的理解里,感知就是让机器看得见、听得见,数据从真实世界来到我的身体里,这是感知。认知是数据来到我的身体里之后,我怎样消化这个数据,看到一个物品要做什么样的反应、决策或行为?人类在这个世界上生存,是靠试错、学习、不断交互,不是只有感知,很大程度上需要认知,否则就跟植物没有太大区别。人工智能在过去几年,出现一波AI“独角兽”,基本集中在感知领域。我的问题来了——AI下一个黄金十年,认知时代是不是到来了?还有认知领域是不是有可能出现下一个商汤?俞扬:会不会出现下一个商汤,我不太好回答这个问题。关于认知智能我是这样看的,我们可以把它看成两个不同的维度,一个维度是很宽,一个是很深。所谓很宽,是我们在处理信息时需要有更多的知识和常识。比如说在做人机对话时,人经常会出现一些我们意料之外的词语,这些词语的出现,是机器难以处理的,这需要有很宽的知识。而很深就是在做决策时,要考虑很远的未来。我们想达到一个目标,比如希望有最优的营销方案、最好的风控,像这样的业务,我们现在做出的决策,对未来的影响是什么?这是我从两方面的维度想到的。实际上这两个不同的维度,我知道有不少做知识图谱、自然语言处理、人机交互的企业正在做,但目前看起来没有像商汤这样做感知的公司那么大。我认为面临的问题很难,但对应的价值可能更多一些。张一甲:知识图谱的公司看起来之所以长得没有商汤大,是不是因为上一波风潮找到了刚需场景?还是说感知更能解决问题?俞扬:我的感觉是,在感知这个领域上面我们是可以用人工把数据全部标好,但是在知识图谱这样的领域里,要构建知识图谱所需的大量标注好的数据,开销极大,甚至是在构建常识图谱时,都不知道相关的知识从哪里来。所以即使拥有大量的人工标注的数据也没办法很好地完成,这是我们面临的一个很大不足。张一甲:我们可以用语言来描述说,我看见一头大象,但是我们没有办法描述说,此时此刻我理解到了什么,很难形容出来,我们对自己的了解还如此之少。俞扬:另外一个维度就是一个深度的维度。我们最近看到很多吸引眼球的人工智能新闻,其实都是关于深度的。机器在围棋、星际、DOTA这些游戏上,都能达到人类专家的水平,甚至完全碾压人类;但是我们看到,像DeepMind、OpenAI这么巨大估值的企业,面临的一个问题就是无法落地,不仅不挣钱,还烧钱特别快。从这个角度看,技术好像进步得特别快,但当我们想用决策技术来创造价值时,却面临巨大困难,所以这也是我们正在突破的难题。猎户星空CSO王兵王兵:我们说的认知,包括自然语言理解。其实在内部我们有超过五千万的本体知识图谱,也有不同领域的知识图谱,但真正解决认知问题,本质上要解决通用的人工智能。为什么这么说?人类的智能,其实本质是对时间、空间以及时空序列的理解;对空间的理解,人和动物都有,把一只猫放出去,它能找回家,把一只鸽子放出去,它也会飞回来,对空间的理解是生命很久以前就建立的能力,这是我们说的对空间的直觉性理解能力;但是对时间的理解是人所独有,人类能产生复杂的记忆,而动物不能。张一甲:这个很有意思,你能给我们解释一下,为什么动物没有复杂的记忆,什么是复杂的记忆?王兵:时间的本质是什么?时间的本质是变化,所以时间的本质是因果。因为有因果关系、逻辑关系,有变化的前后顺序,才有了时间,所以对这种现象的理解,本质就是对时间的理解。人有这样的能力,只有人类可以用一句话去描述未来,这就是语言带来的效果,这种能力其实很难得。张一甲:说明人的时间感很大意义上是依赖于我们的语言,因为我们使用了一种线性的逻辑语言,我们再这么聊下去可能观众都听不太懂了。但是我确实很感兴趣的事情是,我非常同意您的观点,人类使用的语言某种意义上,是非常低效的,三体人是用脑电波交流的。王兵:对,他们是用脑电波交流的。由于物理的限制,我们发明了非常简练的语言,所以为什么自然语言理解会非常困难,因为它是一个从低维到高维映射的问题。我可能就说了五个字,但这五个字后面代表的信息量是极大的。但这个巨大的信息量要产生出来,取决于我们对物理世界的理解,取决于我们拥有的常识和所处的语境。比如我在今天的会议上说五个字,和我在家里说五个字,是完全不一样的意思,这就是为什么我们今天会认为,通用人工智能如此困难。张一甲:我明白,今天上午我和搜狗的王小川聊这个事情,我和他的观点有点一致,就是说某种意义上,我们觉得NLP是一件很无奈的事情,我们非要把大自然这样一个立体的世界,用自然语言去描述,这几乎是不可能的事情。同样一句话,我们的理解都不一样,只是一个投射,维度都不一样,那把时间都花在这样一件事情上,真的是一个长期的解决之道吗?还是说,我们干脆研究脑机接口?搞不好,脑机接口比自然语言还来得更快一点。我这只是破坏性提问啊(笑)。王兵:所以我们做服务机器人,本质必须要做到多模态的理解和记忆。只有这三五个字的话,我很难去揣测用户的意图。我要看他的表情,知道他是谁、他的历史和背景,包括当时是在怎样的一个环境,所有的这些信息加起来,才能对他的意图有一个相对准确的估计。我们所说的推销人员察言观色的能力也是这种能力,是建立在大量常识和场景化知识的基础上的。张一甲:明白。刚刚陆总讲了,其实他已经在很多的场景找到了很好的案例,而且我亲眼见证了他的很多大客户对他的信任,不断在帮他背书。我想问一下俞教授,您刚才说这个事很难赚到钱,很难应用,那么你现在在做的事情有没有什么突破点呢?俞扬:陆总那边在做的全息化,其实是和我们有一点类似的,我们是通过历史数据积累的场景,还原出在这个场景里的运作规律,有了这个规律后,我们可以把现在所有用来打游戏的技术,全部用来解决业务场景里面临的问题,而且可以直接拿到业务场景里来用。张一甲:陆总,您想做的事情和他有没有什么不同的地方?陆云波:我觉得可能还是有一点共鸣的。针对前面的问题我稍微做一些补充,我觉得认知智能领域,一定会出现商汤这样的企业。我是来自经济管理学院,在企业管理这个维度上面,大家知道吗?SAP竟然是德国最大的上市公司,我们知道西门子、大众,但是其实SAP才是德国最大的上市公司,市值一千多亿美金。Oracle也是一千多亿美金,包括Salesforce也是一千多亿美金。智能时代来了,对这个领域会带来什么变化?比如说,一个企业分成内部和外部,内部就是运营,外部就是市场。就拿运营来看,人工智能会不会长出一个运营大脑?和现在大家说的单点智能是不一样的。这个智能的运营大脑有点接近美国军方说的作战大脑,未来一定是百亿美金、千亿美金的公司。这条路是不是靠认知领域的突破,就能走出来呢?从个人角度来讲我很怀疑。我呼应一下俞教授,该怎么去打这个游戏?今天的人类,就像一群鸟群在飞舞,每一个人其实不一定看得清楚方向,我们跟着大家在走,我们过去看3D打印、智能硬件、O2O和共享经济,今天我们的目光还聚集在那个地方,这不一定是对的。所以(未来的方向)可能在我们的认知边界之外,在另一个地方,我相信它一定是存在的。一甲也知道,我们在过去三年里,有一些合作的客户,而且取得了非常好的结果,可以说这条路初步得到了验证,它是有可能走通的。转折点到来:认知智能“深度学习本质用大数据来学习非线性映射的一种方法,可以解决几乎所有的直觉类的问题。”——猎户星空CSO王兵“我想在前面说的‘深度学习做得很好’前面加一个修饰语,在固定的数据集上面深度学习做得很好,但一旦拿到开放的业务场景下,我们经常发现没有办法在真实世界里做一些试错。”——南京大学人工智能学院教授俞扬张一甲:你现在和11月1日发布你产品时的状态完全不一样。你的项目做了3年,今年是第一次对外亮相,我想知道在认知智能这个领域,最近是存在了一个所谓的转折点吗?使得大家都愿意在这个时间点去谈论这件事。甚至包括刚才百分点也在这么说,他们也做了10年,但到今天这个时间点,大家都开始去谈知识图谱,谈认知。这个转折点是什么?还是说发生了一些什么事情导致了这样的一种变化?俞杨:如果从我们做人工智能的历史来看,第二波人工智能的浪潮就是关于认知,第一波浪潮实际上是在
转载请注明:http://www.kohkf.com/wadzz/14692.html