柯洁0:3负于alphago : ai认知智能让人类输得没脾气-亚博ag旗舰厅

发布时间：2017-05-27

【概要描述】

从4月10日应战，到5月22日晚赛前深夜发文《最后的对决》，柯洁代表的人类世界第一，赛前便被各方断言胜率为零。

“无论输赢，这都将是我与人工智能最后的三盘对局。”

“我会用我所有的热情去与它做最后的对决，不管面对再强大的对手——我也绝不会后退！至少这...最后一次...”

“可它始终都是冷冰冰的机器，与人类相比，我感觉不到它对围棋的热情和热爱，对它而言，它的热情——也只不过是运转速度过快导致cpu发热罢了。” 5月23日至27日，围棋峰会在乌镇召开。根据赛程安排，23日、25日以及27日，柯洁与alphago分别展开三场较量，获胜方将获得150万美元的巨额奖金。最终，柯洁0:3不敌alphago。而26日举行的团队赛中，五位世界冠军也惨遭团灭。

回顾：“下得很精彩”与“输得没脾气”

5月23日第一局，经过4小时17分37秒的鏖战，alphago执白以1/4子战胜柯洁，赛后发布会上，柯洁表示，“alphago是太厉害了，我输得没什么脾气”。作为一个职业棋手，如何在棋局中拿下对方赢得胜利是柯洁的使命。但他却不得不承认，ai进步速度太快了，alphago和去年相比判若两人，“当时觉得它的棋很接近人，现在感觉越来越像围棋上帝。”

“我希望我尽全力去拼每一盘，也希望自己给大家带来围棋的快乐。”柯洁透露，这三场比赛将是他与人工智能的最后3盘棋。“希望不留遗憾，下出好棋，让alphago主机更发烫一点也好。”

5月25日，中盘柯洁投子认负，却被deepmind创始人、alphago之父哈萨比斯誉为“逼出了alphago的极限”。柯洁直接挑起混战，展现人类棋手的最强实力，却在“当时认为自己离胜利很近了”的时候，由于太紧张而丢了本占上风的棋局。“可能这也是人类最大的一个弱点，我捂着胸口是想按着自己的心脏让它跳得慢一点。”

比赛开始一小时后，哈萨比斯发推特说：“难以置信！根据alphago的判断，柯洁今天表现完美！”在业内人士看来，柯洁发挥极其出色，前100步都和对手势均力敌。

有趣的是，本局alphago执黑，开局第一步没有按惯例走右上角，而是下在了右下小目，这在人类对局中被认为是“失礼”。局后deepmind创始人哈萨比斯特意就此向柯洁表示了歉意，解释说：“因为alphago不会分辨‘上’和‘下’，对它来说，棋盘是对称的。”

5月27日最后决战，弈至209手，柯洁拿起两颗棋子盘上示意认负。至此，人机大战三番棋结束，柯洁0:3负于alphago。

alphago 2.0 : 技术重大提升，脱离人类经验

围棋起源于中国，至今已有四千余年历史，一直以来被认为是世界上最复杂的棋类游戏，也是智慧的象征。如果说，是人类的智慧造就了alphago，那么alphago也将让我们重新认识智慧的边界。

alphago 1.0 版本主要结合了三种算法：蒙特卡洛树搜索监督学习增强学习。其中，蒙特卡洛树搜索是一种优化过的暴力计算；监督学习是通过学习3000万步人类棋谱，对六段以上职业棋手走棋规律进行模仿；而增强学习作为辅助算法，是两台alphago从自我对战中学习如何下棋。

deepmind团队透露，新的 alphago 程序运行在单个谷歌云服务器上，由 tpu 芯片进行计算处理。算法上也进行了革新，它所需的计算能力仅需与李世乭对战时的 10%，自我对弈能力更强。去年，alphago 的模型中有 12 层神经网络，而在以master 名义出战时，深度已有40层。

根据公开资料推测，此次alphago2.0的技术原理与之前有着巨大不同：一是放弃监督学习，不再使用人类棋谱进行训练。这意味着突破了“机器学习依赖优质数据”这一限制，走棋风格也将脱离人类经验。二是放弃蒙特卡洛树搜索，不再进行暴力计算。理论上，算法越聪明，就可以大大减少暴力计算，alphago 2.0 下棋的速度也印证了这一点。三则是极大强化了增强学习的作用，机器开始自我学习积累经验。

人机大战中，alphago 不断出现令人意想不到的走棋，跳出人类的思维定式，甚至完全颠覆人类对围棋的理解。发现一个有趣的现象，我国棋手开始尊称alphago为“阿老师”，也从侧面表明人类开始向机器学习，重新认识围棋。

alphago与金融科技

2016年3月，第一场alphago与李世石的人机大战开启了人们对人工智能的全新认识。2016年也被业界看作“认知计算元年”。放眼商业时代，金融行业被认为是“认知智能”最具前景的应用领域之一。创新工场董事长兼ceo李开复曾多次在公开场合看好“ai 金融”。

金融科技，也称为程序化交易或者量化投资，可以理解为人工智能在证券投资领域的一个子分支，或者其技术在证券投资领域的具体应用。

量化投资的关键点就在于策略模型的大量使用，即利用现代统计学、数学方法，借助计算机处理海量数据和信息，并严格按照机器所构建的数量化模型来指导投资决策，以获得稳健的持续的投资收益，与alphago有异曲同工之处。

一般来说，量化投资部由两部分组成，一部分是投研团队，另一部分是it团队，投研团队提出需求，it团队做出算法交易的模块，解决基金经理们的需求。现阶段量化投资策略开发方式为：研究组或者交易组提出思路→研究组论证，提出基本模型→模型拟合估计→回溯检验→小规模测试→实盘投资。

其好处在于可以克服人性弱点，做决策时不会像人类一样受情绪和心理因素的干扰。可同时运用多个策略模型，对全市场各种信息进行实时监控，一旦出现合适的机会，能瞬间下达交易指令。

比如cta基金的趋向性跟踪指标，其调整多空头寸的临界点是由特定计算机算法规则的，并且嗅觉灵敏，能在第一时间改变阵营，下手迅速，更善于承担人类不喜欢的空头角色。一般这类品种是通过量化手段不断交易，反复进行大概率获得正收益的策略，会设置最大回撤值，一旦到“止损线”就立刻止损，因此风险并不会太高。

然而，量化投资本身也存在着一定的缺陷，存在过度拟合的问题：所谓过度拟合，指的就是程序化交易中，对于样本数据描述的准确度很高，而对于样本外数据描述的准确度却很差。导致历史回测完美，而在实盘中失效。有时还可能导致黑天鹅事件，数据模型主要是根据历史数据来构建的，所以它吸收新信息的能力比较缓慢和迟钝，一旦外部环境发生变化或者发生某些重大事件，如基本面上的变化等，有效性就会大大受到影响。

如果将大量的数据放入alphago 中的核心的“深度神经网络算法（dnn算法）”，那就可以自动提取一些相关性，同时匹配结果。理论上可以弥补研究人员建立模型时，容易忽略一些变量，导致模型失效的问题，以及解决了回归分析中会产生的过度拟合。

人类可以充分利用这个工具，充当一个掌舵手，通过前瞻性和对市场非理性机会的把握，对重大政治事件背后的洞察力，来对策略进行调整，保证时效性，构建稳健的投资策略。

面对复杂棋局，人类频频陷入长考，但“机器智能，化繁为简”...

有人说，柯洁的热情败给了阿尔法的速度，你怎么看？

深圳市爱智慧科技有限公司（www.aitech.xin）是由成功的互联网团队发起的高科技公司，致力于推动人工智能在金融领域的应用。

发布时间：2017-05-27 15:55

从4月10日应战，到5月22日晚赛前深夜发文《最后的对决》，柯洁代表的人类世界第一，赛前便被各方断言胜率为零。

“无论输赢，这都将是我与人工智能最后的三盘对局。”

“我会用我所有的热情去与它做最后的对决，不管面对再强大的对手——我也绝不会后退！至少这...最后一次...”

“可它始终都是冷冰冰的机器，与人类相比，我感觉不到它对围棋的热情和热爱，对它而言，它的热情——也只不过是运转速度过快导致cpu发热罢了。” 5月23日至27日，围棋峰会在乌镇召开。根据赛程安排，23日、25日以及27日，柯洁与alphago分别展开三场较量，获胜方将获得150万美元的巨额奖金。最终，柯洁0:3不敌alphago。而26日举行的团队赛中，五位世界冠军也惨遭团灭。

回顾：“下得很精彩”与“输得没脾气”

5月23日第一局，经过4小时17分37秒的鏖战，alphago执白以1/4子战胜柯洁，赛后发布会上，柯洁表示，“alphago是太厉害了，我输得没什么脾气”。作为一个职业棋手，如何在棋局中拿下对方赢得胜利是柯洁的使命。但他却不得不承认，ai进步速度太快了，alphago和去年相比判若两人，“当时觉得它的棋很接近人，现在感觉越来越像围棋上帝。”

“我希望我尽全力去拼每一盘，也希望自己给大家带来围棋的快乐。”柯洁透露，这三场比赛将是他与人工智能的最后3盘棋。“希望不留遗憾，下出好棋，让alphago主机更发烫一点也好。”

5月25日，中盘柯洁投子认负，却被deepmind创始人、alphago之父哈萨比斯誉为“逼出了alphago的极限”。柯洁直接挑起混战，展现人类棋手的最强实力，却在“当时认为自己离胜利很近了”的时候，由于太紧张而丢了本占上风的棋局。“可能这也是人类最大的一个弱点，我捂着胸口是想按着自己的心脏让它跳得慢一点。”

比赛开始一小时后，哈萨比斯发推特说：“难以置信！根据alphago的判断，柯洁今天表现完美！”在业内人士看来，柯洁发挥极其出色，前100步都和对手势均力敌。

有趣的是，本局alphago执黑，开局第一步没有按惯例走右上角，而是下在了右下小目，这在人类对局中被认为是“失礼”。局后deepmind创始人哈萨比斯特意就此向柯洁表示了歉意，解释说：“因为alphago不会分辨‘上’和‘下’，对它来说，棋盘是对称的。”

5月27日最后决战，弈至209手，柯洁拿起两颗棋子盘上示意认负。至此，人机大战三番棋结束，柯洁0:3负于alphago。

alphago 2.0 : 技术重大提升，脱离人类经验

围棋起源于中国，至今已有四千余年历史，一直以来被认为是世界上最复杂的棋类游戏，也是智慧的象征。如果说，是人类的智慧造就了alphago，那么alphago也将让我们重新认识智慧的边界。

alphago 1.0 版本主要结合了三种算法：蒙特卡洛树搜索监督学习增强学习。其中，蒙特卡洛树搜索是一种优化过的暴力计算；监督学习是通过学习3000万步人类棋谱，对六段以上职业棋手走棋规律进行模仿；而增强学习作为辅助算法，是两台alphago从自我对战中学习如何下棋。

deepmind团队透露，新的 alphago 程序运行在单个谷歌云服务器上，由 tpu 芯片进行计算处理。算法上也进行了革新，它所需的计算能力仅需与李世乭对战时的 10%，自我对弈能力更强。去年，alphago 的模型中有 12 层神经网络，而在以master 名义出战时，深度已有40层。

根据公开资料推测，此次alphago2.0的技术原理与之前有着巨大不同：一是放弃监督学习，不再使用人类棋谱进行训练。这意味着突破了“机器学习依赖优质数据”这一限制，走棋风格也将脱离人类经验。二是放弃蒙特卡洛树搜索，不再进行暴力计算。理论上，算法越聪明，就可以大大减少暴力计算，alphago 2.0 下棋的速度也印证了这一点。三则是极大强化了增强学习的作用，机器开始自我学习积累经验。

人机大战中，alphago 不断出现令人意想不到的走棋，跳出人类的思维定式，甚至完全颠覆人类对围棋的理解。发现一个有趣的现象，我国棋手开始尊称alphago为“阿老师”，也从侧面表明人类开始向机器学习，重新认识围棋。

alphago与金融科技

2016年3月，第一场alphago与李世石的人机大战开启了人们对人工智能的全新认识。2016年也被业界看作“认知计算元年”。放眼商业时代，金融行业被认为是“认知智能”最具前景的应用领域之一。创新工场董事长兼ceo李开复曾多次在公开场合看好“ai 金融”。

金融科技，也称为程序化交易或者量化投资，可以理解为人工智能在证券投资领域的一个子分支，或者其技术在证券投资领域的具体应用。

量化投资的关键点就在于策略模型的大量使用，即利用现代统计学、数学方法，借助计算机处理海量数据和信息，并严格按照机器所构建的数量化模型来指导投资决策，以获得稳健的持续的投资收益，与alphago有异曲同工之处。

一般来说，量化投资部由两部分组成，一部分是投研团队，另一部分是it团队，投研团队提出需求，it团队做出算法交易的模块，解决基金经理们的需求。现阶段量化投资策略开发方式为：研究组或者交易组提出思路→研究组论证，提出基本模型→模型拟合估计→回溯检验→小规模测试→实盘投资。

其好处在于可以克服人性弱点，做决策时不会像人类一样受情绪和心理因素的干扰。可同时运用多个策略模型，对全市场各种信息进行实时监控，一旦出现合适的机会，能瞬间下达交易指令。

比如cta基金的趋向性跟踪指标，其调整多空头寸的临界点是由特定计算机算法规则的，并且嗅觉灵敏，能在第一时间改变阵营，下手迅速，更善于承担人类不喜欢的空头角色。一般这类品种是通过量化手段不断交易，反复进行大概率获得正收益的策略，会设置最大回撤值，一旦到“止损线”就立刻止损，因此风险并不会太高。

然而，量化投资本身也存在着一定的缺陷，存在过度拟合的问题：所谓过度拟合，指的就是程序化交易中，对于样本数据描述的准确度很高，而对于样本外数据描述的准确度却很差。导致历史回测完美，而在实盘中失效。有时还可能导致黑天鹅事件，数据模型主要是根据历史数据来构建的，所以它吸收新信息的能力比较缓慢和迟钝，一旦外部环境发生变化或者发生某些重大事件，如基本面上的变化等，有效性就会大大受到影响。

如果将大量的数据放入alphago 中的核心的“深度神经网络算法（dnn算法）”，那就可以自动提取一些相关性，同时匹配结果。理论上可以弥补研究人员建立模型时，容易忽略一些变量，导致模型失效的问题，以及解决了回归分析中会产生的过度拟合。

人类可以充分利用这个工具，充当一个掌舵手，通过前瞻性和对市场非理性机会的把握，对重大政治事件背后的洞察力，来对策略进行调整，保证时效性，构建稳健的投资策略。

面对复杂棋局，人类频频陷入长考，但“机器智能，化繁为简”...

有人说，柯洁的热情败给了阿尔法的速度，你怎么看？

深圳市爱智慧科技有限公司（www.aitech.xin）是由成功的互联网团队发起的高科技公司，致力于推动人工智能在金融领域的应用。

上一个: 爱智慧科技梁新刚：用ai轻咨询突破“算法壁垒”，引领传统行业拥抱人工智能

下一个: 无

上一个: 爱智慧科技梁新刚：用ai轻咨询突破“算法壁垒”，引领传统行业拥抱人工智能

下一个: 无