人工智能的拉锯战:揭示谷歌和深度思维之间的爱、恨、爱和敌意

简介:自从被谷歌收购后,DeepMind开发的阿尔法狗在击败了许多围棋大师后变得很出名。

DeepMind是一家位于英国伦敦的人工智能初创公司。它是由人工智能程序员和神经科学家黛米莎·比斯(DemisHassabis)等人共同创建的。

该公司将机器学习与系统神经科学相结合,建立了强大的通用学习算法,并将其应用于仿真、健康、游戏开发等领域。

最近,《经济学人》集团1843年的杂志发表了一篇文章,揭示了明星人工智能公司及其创始人的故事,以及对谷歌的爱、恨、爱和恨。

本文来源于《大数据文摘》,来源:经济学,汇编:奥克西昂苏格、林安安、小琪、张秋月。

如需重印,请联系原作者。

欲了解更多激动人心的内容,请下载扑克金融应用程序(iOS和安卓版本都有)。

Deepmind也许是当今世界上对AGI最有影响力的公司。

《经济学人》最近写了一篇关于明星人工智能公司及其创始人的长篇故事。

通过对20多位内部人士的访谈,研究了公司的研究态度——对AGI的追求和对精进学习的痴迷,这对他们的研究思想产生了重要影响,并深深植根于他们的企业文化之中。

以下是全文汇编,敬请欣赏。

2010年8月的一个下午,一名34岁的伦敦人大步走上旧金山湾的舞台。

他深吸一口气,放松紧张的神经,露出破碎的笑容,说道,“今天,我要告诉你如何用一种完全不同的方式建造它”空空气突然平静下来,仿佛在等待一个想要改变世界的人喊出他的伟大抱负——“AGI”德米沙比斯说。

AGI指的是通用人工智能,它是一种理想化的计算机程序,具有与人类相同甚至更高的智能水平。

AGI可以执行独立的任务,如识别照片或翻译语言,这与我们手机和电脑中的人工智能基本相同。

但是除此之外,它还能做加法和减法,下棋和说法语。能理解物理论文,写小说,制定投资策略,和陌生人愉快地交谈;它甚至可以监控核反应、管理电网和交通流量,并毫不费力地在各个领域取得一项又一项成就——AGI将把当今最先进的人工智能集成到袖珍计算器中。

目前,人类是唯一有能力完成所有这些任务的智能生物,但是人类的智能受到身体所能提供的能量的限制。AGI在电脑上运行,所以它不会受到这些限制。AGI的能力上限仅由处理器数量决定。

AGI将以每秒阅读数万篇物理论文的速度完成监测核反应和吸收知识的任务。它将很快拥有发现新能源的能力,这是人类经过数千年进化后无法比拟的速度。

当计算机的速度和可扩展性有助于人类智能时,目前似乎无法解决的问题将很容易得到解决。

哈萨比斯曾向英国《观察家报》记者描述,他希望AGI能够掌握“癌症、气象学、能源、基因组学、宏观经济学和金融系统”等学科。

哈萨比斯在一个叫做奇点峰会的会议上发言。

根据未来学家的说法,“奇点”指的是AGI造成的结果。

由于AGI将高速处理信息,它将很快变得“极其智能”。

自我完善的快速循环将导致机器智能的“爆炸”,将人类窒息在“硅尘”中。

那么这个奇点会带来乌托邦还是地狱?这已经成为宗教信仰的一个普遍问题。

“如何建立人工思维”,“人工智能解决衰老问题”,“替换我们的身体”,“改变生与死的界限”...从会谈的题目来看,与会者倾向于把人工智能视为救世主;相比之下,哈萨比斯的演讲似乎没有“基于神经科学的研究方法探索AGI建筑”那么大的噱头

哈萨比斯说话很快,在平台和屏幕之间踱步。

他穿着一件栗色套衫和一件白色的纽扣衬衫,很像一个大学生,但是在他瘦弱的身体下,他有着巨大的智慧和无限的力量。

哈萨比斯解释说:到目前为止,科学家已经从两个方向探索了AGI。

一个分支可以称为基于规则的人工智能。

沿着这条道路的研究人员正试图描述一个能够像人类一样思考并通过编程实现它们的系统所需的所有规则。

这种方法在20世纪80年代和90年代很流行,但没有产生预期的结果。

哈萨比斯认为,形成人类认知的神经结构太微妙,无法用这种方式来描述。

另一个分支的研究人员试图数字化复制大脑的神经网络。

尽管这有些道理,毕竟大脑是人类智慧的所在。但是哈萨比斯认为,研究人员的尝试就像试图绘制宇宙中的每一颗恒星,他们也在一条弯曲的道路上。

更根本的问题是,这种研究方法就像是试图通过挖掘计算机检测晶体管的相互作用来理解MicrosoftExcel的工作原理。他们对大脑处理水平的关注是错误的。

哈萨比斯提出了一个中间立场:AGI应该从大脑处理信息的宏观方法中汲取灵感——而不是从物理系统或特定环境下的应用规则中。

换句话说,它应该专注于理解大脑的软件,而不是硬件。

现有的新技术,如功能磁共振成像(fMRI),使研究人员能够探索特定活动下的人脑活动,证明了这一方向的可行性。

他告诉听众,最新的研究表明,大脑通过在睡眠中重复经验来学习一般原理,研究人员应该尝试模仿这个系统来构建人工智能。

演讲幻灯片右下角出现了一个圆形蓝色漩涡,徽标下立刻出现了两个字“DeepMind”——这是该公司首次正式公开亮相。

这篇演讲远没有看上去那么简单。哈萨比斯为了这次邀请已经努力工作了一年。

他的真正目的是与硅谷亿万富翁彼得希尔(PeterThiel)见面一分钟,希尔是会议的发起人——哈萨比斯想要希尔的投资。

泰尔似乎比哈萨比斯本人更热衷于AGI。

泰尔在2009年奇点峰会上的一次演讲中说,他对未来最大的恐惧不是机器人起义(他在新西兰内地有一个末日避难所,他实际上比大多数人准备得更好)。

相反,他担心奇点来得太晚,世界需要新技术来抵御经济衰退。

DeepMind最终筹集到总计200万英镑,其中泰尔投资了140万英镑。

当谷歌在2014年1月以6亿美元收购该公司时,泰尔和其他早期投资者的投资收益率为5000%。

对许多创始人来说,这是一个快乐的结局。

他们可能会放慢发展速度,甚至后退一步,花更多的时间处理金钱。

但是对哈萨比斯来说,谷歌的收购只是建立AGI帝国的又一步。

2013年,他花了大量时间谈判交易条款,使DeepMind独立于谷歌运作。DeepMind在不失去控制权的情况下获得了谷歌提供的现金流和计算能力。

哈萨比斯认为DeepMind将是一个混合体:它作为一家创业公司拥有强大的自我驱动能力,汇集了顶尖大学的聪明才智,并拥有世界上最有价值的公司之一的雄厚资金支持——所有这些因素都将加速AGI的到来,解决人类面临的难题。

德米莎·萨比斯(Demishassabis)1976年出生于伦敦北部,中国血统的围棋天才少年,是三兄弟姐妹中最大的一个。

我父亲是住在塞浦路斯的希腊人,经营一家玩具店。我妈妈是一个住在新加坡的中国人,在英国百货公司约翰·刘易斯工作。

他从很小的时候就表现出惊人的天赋——当他四岁的时候,他看了父亲和叔叔之间的一场象棋比赛,对象棋上瘾了。几周之内,他在象棋比赛中击败了许多成年人。到他13岁时,他已经在世界同行中排名第二。

此外,当他八岁的时候,他已经可以在计算机上实现自己的代码,并且只有通过自学才能掌握编程技术。

1992年,哈萨比斯提前两年完成了他的高级课程。

他在BullfrogProductions公司找到了一份视频游戏编程的工作。

哈萨比斯写了一款名为主题公园(ThemePark)的游戏,玩家可以在其中设计和运营一个销售额高达1500万份的虚拟游乐园。

此后,该公司优化开发了一款更大规模的虚拟城市游戏,哈萨比斯(Hassabis)写的《主题公园》(ThemePark)成为这款大规模游戏的一部分。

除了写游戏,他还擅长玩游戏,如象棋、拼字游戏、扑克和双陆棋。

1995年,在剑桥大学学习计算机科学时,Hassabis在学生围棋锦标赛中多次击败对手。

围棋比象棋复杂得多。只有通过长期训练,玩家才能获得足够的经验来熟练地制定游戏策略。

没有人知道哈萨比斯以前是否玩过围棋。

哈萨比斯很快控制了初级比赛,然后击败了经验丰富的围棋职业选手,后者对自己输给一名19岁的新手感到震惊。

剑桥围棋大师查尔斯·马斯休斯(CharlesMatthews)在观看比赛后,决定开始训练哈萨比斯。

哈萨比斯一次又一次地展示了他在围棋方面的天赋。渐渐地,他开始怀疑计算机是否能像人类一样通过积累的经验来学习。

游戏提供了现实世界中无与伦比的学习环境。

虽然游戏是从现实世界发展而来的,但它们可以在没有外界干扰的情况下高效地进行。

与现实世界相比,在游戏中,时间过得比现实生活快得多:几天后,玩家可以组成一个小组,几分钟后战斗。

1997年夏天,Hassabis去了日本。

那年5月,IBM的深蓝电脑击败了世界象棋冠军加里·天冬诺夫(GarryKasparov)。

这是计算机第一次在国际象棋比赛中击败大师。

这场竞争已经引起了全世界的关注,也引起了人们对计算机持续发展和潜在威胁的关注。

哈萨比斯遇到了日本象棋大师马萨伊·科孚朱瓦瑞亚(MasahikoFujuwarea),他谈到了将战略游戏与人工智能相结合的想法:有一天,他将建立一个能够打败世界上最好的人类围棋手的计算机程序。

20岁的哈萨比斯认为,他目前的能力不足以支持他实现梦想,但他已经有了一个蓝图。

1998年,他创立了一个名为酏的游戏工作室。

Hassabis专注于开发一个叫做共和国的政治模拟游戏。

哈萨比斯还在学校的时候,他告诉他的朋友穆斯塔法苏利曼(MustafaSuleyman),这个世界需要一个能够模拟复杂社会动态和解决困难社会问题的模型。

现在,他试图在游戏中做到这一点。

事实证明,这是非常困难的。

长生不老药最终发布了游戏的浓缩版本,但游戏没有着火。

其他类似的游戏一个接一个地失败了(比如一个叫做邪恶天才(EvilGenius)的邦德反派模拟器)。

2005年4月,哈萨比斯关闭了长生不老药。

马修斯认为哈萨比斯创建公司只是为了获得管理经验。

现在,在哈萨比斯开始寻找AGI之前,他对一个关键领域——人脑了解得还不够。

2005年,哈萨比斯从伦敦大学学院(UCL)获得神经科学博士学位。

他在博士期间研究记忆和想象力。

一篇被引用超过1000次的论文表明健忘症患者很难想象,这表明记忆和心理形象的创造之间有联系。

为了解决AGI问题,哈萨比斯试图理解大脑。

他的大部分工作最终回到了一个问题上:人脑是如何获取和记忆概念和知识的?Hassabis于2010年11月15日正式成立DeepMind。

该公司的使命陈述与现在一样——“solve intelligence”,然后用它来解决其他问题。

正如哈萨比斯在奇点研讨会上告诉与会者的那样,这意味着计算机可以理解和执行像人脑一样的任务。

哈萨比斯并不认为科学已经完全理解了人类的思想。

他认为AGI蓝图不能简单地从数百项神经科学研究中提出。

他相信他目前的水平足以支持他的AGI研究。

然而,情况并非如此。

我们仍然对大脑的实际工作方式知之甚少。

2018年,一群澳大利亚研究人员质疑Hassabis博士论文的研究结果。

他们认为这篇文章的统计数字很糟糕。

尽管查询是针对一篇论文,但这足以表明DeepMind还有很长的路要走。

苏莱曼和尚勒格是两个痴迷于AGI的新西兰人。哈萨比斯在伦敦大学学院遇见了他们,他们后来成为DeepMind的共同创始人。

哈萨比斯非常有天赋,在他的领导下,DeepMind发展得越来越快。

DeepMind的前运营经理本·福克纳(BenFaulkner)说:“哈萨比斯有点像磁铁,吸引了越来越多的人才。

“许多人拒绝了谷歌和脸书等硅谷巨头的提议,选择进入DeepMind。

也许DeepMind最大的成功是雇佣和留住最聪明和最好的人才。

DeepMind在布鲁姆伯里拉塞尔广场开了一家商店,就在UCL街对面。

DeepMind对机器学习技术——强化学习——的关注源于哈萨比斯对游戏和神经科学的双重热爱。

这个程序的建立是为了收集相关的环境信息,并通过重放积累的经验来学习,就像哈萨比斯在奇点大学建筑讲座中对人脑活动的描述一样。

计算机在强化学习领域仍然是一片空白空。

这个程序展示了一个虚拟环境,就像模拟象棋或电子游戏一样,只有规则是已知的。

该程序包括至少一个称为神经网络的组件,它由多层计算结构组成,可以过滤信息并识别特定的特征或策略。

每一层都在不同的抽象层次上检查环境。

起初,这些网络的成功率很低,但重要的是它们会不断积累经验。

当尝试不同的策略时,它们会变得越来越复杂。如果他们成功了,他们会得到回报,一旦他们犯了错误,他们就不会再犯了。

人工智能最大的优点是任务重复的速度。

2016年,DeepMind吸引了全世界的注意力,建立了一个人工智能项目,将强化学习和其他技术结合起来玩围棋。

这就是所谓的阿尔法狗(AlphaGo)。

2016年,阿尔法围棋在首尔举行的五场比赛中击败了世界冠军,震惊了全世界。

第二年,改良版阿尔法围棋打败了中国围棋冠军。

像1997年的深蓝一样,阿尔法狗改变了人们对自我成就的看法。人类世界的冠军不再是地球上最聪明的人。

哈萨比斯在将自己的雄心壮志告知福朱瓦雷亚近20年后实现了这个目标。

哈萨比斯说这场比赛几乎让他喜极而泣。

传统上,AlphaGo的学生通过在一场比赛中击败对手来回报,而Hassabis则通过赢得整个比赛来感谢马修斯。

深蓝(DeepBlue)是靠蛮力和高速计算赢得的胜利,但AlphaGo有不同的风格。它看起来非常有艺术性和人性化。

它的优雅和精致,以及它卓越的计算能力,都表明DeepMind在疾病治疗和城市管理的项目设计上比它的竞争对手走得更远。

哈萨比斯坚信深度思维会改善世界。

但是AGI有很大的不确定性。即使有一天它实现了,我们也不知道它是好是坏,或者它是否会服从人类的控制。即使它可以被控制,谁应该控制它?Hassabis从一开始就试图保护DeepMind的独立性,坚持DeepMind应该留在伦敦。

2014年,当谷歌想要收购该公司时,控制权问题变得更加紧迫。

哈萨比斯不需要把DeepMind卖给谷歌,他手头有很多现金,他已经想出了一个商业模式,允许公司设计游戏来资助研究。

然而,像许多创始人一样,他没能抵御谷歌巨大的资本吸引力。

哈萨比斯不想交出他精心创建的公司,因此作为交易的一部分,DeepMind制定了一项计划,防止谷歌单方面控制公司的知识产权。

据知情人士透露,在收购前一年,双方签署了一份名为“道德与安全审查协议”的合同。

审计协议规定,DeepMind的核心技术AGI将由一个名为道德委员会的委员会控制,只要它能被成功研究。

同一消息来源称,伦理委员会不仅是谷歌的明显让步,还为DeepMind提供了坚实的法律支持,以控制其最有价值和最危险的技术。

团队成员的姓名尚未公布,但另一个接近DeepMind和谷歌的消息来源称,DeepMind的三位创始人都是委员会成员。

(DeepMind拒绝回答关于审计协议的一系列详细问题,但表示“道德监督和治理从一开始就是我们的重中之重。

“哈萨比斯可以用另一种方式决定心灵深处的命运,那就是忠诚。

过去的老员工和新员工现在都认为哈萨比斯的研究课题是DeepMind最大的优势之一。

他的课程吸引了数百名世界上最有才华的专家,他们放弃了学术研究,自愿加入他的团队。

DeepMind在巴黎、阿尔伯塔和阿姆斯特丹都有分支机构。

许多员工认为他们与Hassabis和DeepMind的关系比与谷歌的关系更密切。毕竟,谷歌收购DeepMind是为了获利。

他们都相信,只要保持个人忠诚,哈萨比斯比其唯一股东拥有更大的权力。

对谷歌来说,通过代理服务DeepMind招聘人工智能人才比从脸书或苹果挖人要好。

DeepMind还有另一个杠杆来源,即它的公众影响力,但这需要不断曝光。

这是公司最擅长的。阿尔法围棋(AlphaGo)是一场公关秀。

自被谷歌收购以来,该公司已多次吸引全球关注。

其中一种流行的应用产品,可以在眼睛扫描中发现作为黄斑变性模式的指示器。

另一款软件使用类似AlphaGo的框架从头开始学习下棋,成为历史上最伟大的棋手。它只花了九个小时就打了起来。

2018年12月,一个名为阿尔法折叠(AlphaFold)的项目比其他竞争对手更准确地预测了复合列表中蛋白质的三维结构,这为在很大程度上治疗帕金森氏病和阿尔茨海默氏病等疾病提供了机会。

DeepMind特别为其算法感到自豪,该算法能够计算出冷却谷歌数据中心的最有效方式,该数据中心包含大约250万台计算机服务器。

DeepMind在2016年表示,它已经将谷歌的能源成本降低了40%,但一些内部人士表示,这种吹嘘过于夸张。

早在DeepMind出现之前,谷歌就一直在使用算法来优化其数据中心。

一名谷歌员工表示,“他们只想拥有一些所谓字母表中有价值的Prso”。

谷歌的母公司Alphabet为这些服务支付了DeepMind的费用。

DeepMind在2017年从Alphabet公司收集了5400万英镑。

这个数字与DeepMind的管理费用相比相形见绌。

那一年,它只在员工身上花了2亿英镑。

总体而言,DeepMind在2017年损失了2.82亿英镑。

尽管这对现金充裕的巨头来说微不足道,但其他亏损子公司已经吸引了Alphabet首席财务官RuthPorat的注意。

互联网服务提供商谷歌纤维(GoogleFibre)陷入财务困境,因为它已经明确表示,需要几十年才能获得投资回报。

私下里,人工智能研究人员都知道DeepMind最终是否会成为一家独立的公司。

DeepMind在推进人工智能作为其管理策略的一部分时非常谨慎,这也向当权者展示了它的声誉价值。

当谷歌被指控侵犯用户隐私和传播虚假新闻时,这一点尤其有价值。

DeepMind也很幸运地获得了最高级别的认可——拉里·佩奇(Larry Page),谷歌两位创始人之一,现任Alphabet首席执行官。

佩奇是哈萨比斯唯一的交集,可能是因为佩奇的父亲卡尔在20世纪60年代研究过神经网络。

佩奇说,在他职业生涯的早期,他已经建立了谷歌来建立一家人工智能公司。

DeepMind对出版管理的严格控制不符合公司盛行的学术精神。

一些研究人员抱怨他们的作品很难出版:他们在将作品提交给会议和期刊之前必须经过内部批准。

DeepMind认为,需要小心谨慎,以免吓跑公众,损害AGI的前景。

但是过度紧张可能会开始恶化学术氛围,削弱员工忠诚度。

在谷歌收购后的第五年,谁控制深度思维的问题变得至关重要。

该公司的创始人和早期员工即将获得股息,他们可以带着经济补偿离开(Hassabis的股票价值约1亿英镑)。

但一位接近该公司的消息人士称,Alphabet公司将创始人的收入分配推迟了两年。

鉴于此,哈萨比斯不太可能换工作。

他只对钱感兴趣,因为钱可以帮助他实现自己的人生。

然而,一些同事已经离开,自2019年初以来,三名人工智能工程师已经离开。

本·劳里(BenLaurie),世界上最著名的安全工程师之一,现已回到他的前雇主谷歌。

虽然这个数字很小,但是没有人应该离开公司,即使DeepMind提供了如此宝贵和令人兴奋的工作机会和丰厚的薪水。

到目前为止,谷歌没有过多干预DeepMind。

然而,最近的一个事件已经使人们开始怀疑DeepMind能保持其独立性多久。

DeepMind一直计划使用人工智能来改善医疗保健。

2016年2月,它成立了一个新的部门:DeepMindHealth。

该部门由该公司的联合创始人之一穆斯塔法苏利曼(MustafaSuleyman)领导。

苏莱曼的母亲是国民保健系统的护士。

他希望创建一个名为Streams的项目,当病人健康恶化时,该项目会警告医生。

DeepMind根据节目效果份额收取费用。

由于这项工作需要获取患者的敏感信息,苏莱曼成立了一个由英国医疗保健和技术行业精英组成的独立审查小组(IRP)。

DeepMind谨慎行事是明智的——英国信息专员后来发现其中一家合作医院违反了管理患者数据处理的法律。

然而,到2017年底,苏莱曼已经与四家大型国民保健服务医院签署了协议。

2018年11月8日,谷歌宣布成立自己的医疗保健部门——谷歌健康(GoogleHealth)。

五天后,宣布DeepMindHealth将并入其母公司。

深度思维似乎没有收到任何警告。

根据自由信息中心(FreedomofInformationAct)获得的信息,它仅提前三天就向合作医院发出了变更通知。

DeepMind拒绝透露合并讨论何时开始,但表示从通知到发布官方公告的短暂时间是为了确保信息的透明度。

苏莱曼在2016年写道:“在任何阶段,患者数据都不会与谷歌的账户、产品或服务相关联。

“他的诺言似乎被违背了。

(在回答1843年杂志的一个问题时,DeepMind说,“在这个阶段,我们的合同没有一个被转移到谷歌,他们只能在我们的合作伙伴同意的情况下转移合同。

流成为谷歌服务并不意味着患者数据可以用来提供其他谷歌产品或服务。

”)谷歌的兼并激怒了DeepMindHealth的员工。

据知情人士透露,一旦兼并完成,更多员工将计划离开公司。

IRP的一名成员米基布拉肯已经离开苏莱曼。

据几位知情人士透露,布莱肯于2017年12月辞职,因为他担心独立审查小组更多的是出于装饰目的,而不是处理信息隐私方面的漏洞。

当布雷肯问苏莱曼是否会将非执行董事的责任和治理权授予团队成员时,苏莱曼笑了。

(DeepMind的发言人表示,他们“不记得”该事件的存在)。

IRP负责人胡连辉(JulianHuppert)认为,该集团的管理“比布雷肯预期的更激进”,因为成员可以公开发言,而不受保密义务的约束。

该事件表明,DeepMind的外围操作容易受到谷歌的影响。

DeepMind在一份声明中说,“我们都同意,通过将各种力量结合在一起,可以增加资源。

“这引发了谷歌是否会将同样的逻辑应用于DeepMind的AGI作品的问题。

总的来说,DeepMind似乎取得了很大的进步。

它已经构建了可以学习执行超人任务的软件。

哈萨比斯经常引用雅达利的一款视频游戏《突破》。

玩家控制一个可以在屏幕底部水平移动的小平板,并用它将球弹回悬浮在屏幕上的正方形。当球击中广场时,它会摧毁他们。

当所有的棋子都被摧毁时,玩家获胜。

如果平板电脑没有收到球,玩家就输了。

没有人工指导,DeepMind的程序不仅学会了玩游戏,还研究了如何将球弹入方块后面的空空间,并多次弹开更多方块。

哈萨比斯说,这证明了强化学习的力量和深度思维(DeepMind)计算机程序超越自然的能力。

这一演示非常令人惊讶,但哈萨比斯仍有一些保留。

如果虚拟平板电脑稍微向上移动,程序将会失败。

DeepMind程序所学的技能非常有限——它甚至不能对环境的微小变化做出反应(比人类行走时对环境的微小影响小)——至少在没有数千轮强化学习的情况下是如此。

但现实世界已经内置了这样一个反应系统。

对于智能诊断,没有两个身体器官是完全相同的。

对于智能机器来说,没有两个引擎可以以相同的方式调节。

因此,将虚拟空中的完美程序发布到现实世界实际上充满了困难。

DeepMind很少谈论的第二个问题是,虚拟环境中的成功取决于奖励功能的存在:一个允许程序衡量其进度的信号。

该程序了解到,在广场顶部空之间发射一个球,使其反弹几次,可以提高得分。

DeepMind和AlphaGo的大部分工作是构建与这个复杂游戏兼容的附加功能。

不幸的是,现实世界并没有提供如此简单的回报。

进步很少用单一的分数来衡量。

即使有这些措施,政治挑战也会使问题复杂化。

为了协调气候问题的奖励信号(大气中百万分之二氧化碳粒子)和石油公司的奖励信号(股票价格),有必要同时满足许多动机冲突的人。

奖励信号通常非常微弱。

当人类大脑沉浸在任务中时,它基本上无法获得关于任务成功的直接反馈。

深度思维(DeepMind)深度思维(DeepMind)的精进学习之路在花费大量的计算机力量后,深度思维已经找到了解决这个问题的办法。

阿尔法围棋需要数千年的人类游戏时间来学习任何东西。

许多人工智能研究人员对此提出质疑:这种解决方案是不可持续的。

DeepMind承认这种模糊性。

它最近专注于星际争霸2,一个战略性的电脑游戏。

游戏早期做出的决定会对后期产生影响,这更接近于复杂的延迟反馈,类似于许多现实世界中的任务。

今年1月,DeepMind在一次演示中击败了一些世界顶尖的人类玩家。尽管许多功能仍然受到很大限制,但这仍然令人印象深刻。

该计划还开始通过遵循人工任务经理的反馈来学习奖励功能。

然而,将人类指令置于循环流程中可能会失去无人计算机处理带来的规模和速度优势。

DeepMind和现任及前任谷歌研究人员(由于严格的保密协议要求匿名)对DeepMind通过这些方法到达AGI的可能性表示怀疑。

这些人认为奖励信号的问题很难解决,因为它与模拟环境中的出色性能太相关。

然而,这种方法是DeepMind的核心。

它有一个内部排名列表,在这个列表中,相互竞争的程序团队争夺虚拟域的控制权。

哈萨比斯一直把生活视为一场游戏。

他职业生涯的很大一部分致力于制作游戏,而他的大部分闲暇时间都花在玩游戏上。

深度思维是他选择发展AGI的工具。

就像他的软件一样,哈萨比斯只能从他的经历中学习。

追逐AGI可能最终会导致迷失方向——尽管他们发明了一些有用的医疗技术,但他们超过了世界上最伟大的棋盘游戏玩家。

这些确实是重大的成就,但不是他所期望的。

但他仍然可以将AGI带入现实世界——远远超出谷歌眼前的控制。

如果德米夏萨比斯这样做,他将赢得最艰难的比赛。

未来智能实验室(Future Intelligence Laboratory)是人工智能、互联网和脑科学的跨学科研究机构,由人工智能科学家和科学院相关机构共同建立。

未来智能实验室的主要任务包括:建立人工智能系统的智商评价体系,发展世界人工智能的智商评价;开展互联网(市)云脑研究计划,构建互联网(市)云脑技术和企业地图集,为提高企业、行业和城市的智力水平服务。

发表评论