柯洁0:3负于alphago : ai认知智能让人类输得没脾气-亚博ag旗舰厅
- 发布时间:2017-05-27
【概要描述】
从4月10日应战,到5月22日晚赛前深夜发文《最后的对决》,柯洁代表的人类世界第一,赛前便被各方断言胜率为零。
“无论输赢,这都将是我与人工智能最后的三盘对局。”
“我会用我所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这...最后一次...”
“可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱,对它而言,它的热情——也只不过是运转速度过快导致cpu发热罢了。” 5月23日至27日,围棋峰会在乌镇召开。根据赛程安排,23日、25日以及27日,柯洁与alphago分别展开三场较量,获胜方将获得150万美元的巨额奖金。最终,柯洁0:3不敌alphago。而26日举行的团队赛中,五位世界冠军也惨遭团灭。
回顾:“下得很精彩”与“输得没脾气”
5月23日第一局,经过4小时17分37秒的鏖战,alphago执白以1/4子战胜柯洁,赛后发布会上,柯洁表示,“alphago是太厉害了,我输得没什么脾气”。作为一个职业棋手,如何在棋局中拿下对方赢得胜利是柯洁的使命。但他却不得不承认,ai进步速度太快了,alphago和去年相比判若两人,“当时觉得它的棋很接近人,现在感觉越来越像围棋上帝。”
“我希望我尽全力去拼每一盘,也希望自己给大家带来围棋的快乐。”柯洁透露,这三场比赛将是他与人工智能的最后3盘棋。“希望不留遗憾,下出好棋,让alphago主机更发烫一点也好。”
5月25日,中盘柯洁投子认负,却被deepmind创始人、alphago之父哈萨比斯誉为“逼出了alphago的极限”。柯洁直接挑起混战,展现人类棋手的最强实力,却在“当时认为自己离胜利很近了”的时候,由于太紧张而丢了本占上风的棋局。“可能这也是人类最大的一个弱点,我捂着胸口是想按着自己的心脏让它跳得慢一点。”
比赛开始一小时后,哈萨比斯发推特说:“难以置信!根据alphago的判断,柯洁今天表现完美!”在业内人士看来,柯洁发挥极其出色,前100步都和对手势均力敌。
有趣的是,本局alphago执黑,开局第一步没有按惯例走右上角,而是下在了右下小目,这在人类对局中被认为是“失礼”。局后deepmind创始人哈萨比斯特意就此向柯洁表示了歉意, 解释说:“因为alphago不会分辨‘上’和‘下’,对它来说,棋盘是对称的。”
5月27日最后决战,弈至209手,柯洁拿起两颗棋子盘上示意认负。至此,人机大战三番棋结束,柯洁0:3负于alphago。
alphago 2.0 : 技术重大提升,脱离人类经验
围棋起源于中国,至今已有四千余年历史,一直以来被认为是世界上最复杂的棋类游戏,也是智慧的象征。如果说,是人类的智慧造就了alphago,那么alphago也将让我们重新认识智慧的边界。
alphago 1.0 版本主要结合了三种算法:蒙特卡洛树搜索 监督学习 增强学习。其中,蒙特卡洛树搜索是一种优化过的暴力计算;监督学习是通过学习3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿;而增强学习作为辅助算法,是两台alphago从自我对战中学习如何下棋。
deepmind团队透露,新的 alphago 程序运行在单个谷歌云服务器上,由 tpu 芯片进行计算处理。算法上也进行了革新,它所需的计算能力仅需与李世乭对战时的 10%,自我对弈能力更强。去年,alphago 的模型中有 12 层神经网络,而在以master 名义出战时,深度已有40层。
根据公开资料推测,此次alphago2.0的技术原理与之前有着巨大不同:一是放弃监督学习,不再使用人类棋谱进行训练。这意味着突破了“机器学习依赖优质数据”这一限制,走棋风格也将脱离人类经验。二是放弃蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越聪明,就可以大大减少暴力计算,alphago 2.0 下棋的速度也印证了这一点。三则是极大强化了增强学习的作用,机器开始自我学习积累经验。
人机大战中,alphago 不断出现令人意想不到的走棋,跳出人类的思维定式,甚至完全颠覆人类对围棋的理解。发现一个有趣的现象,我国棋手开始尊称alphago为“阿老师”,也从侧面表明人类开始向机器学习,重新认识围棋。
alphago与金融科技
2016年3月,第一场alphago与李世石的人机大战开启了人们对人工智能的全新认识。2016年也被业界看作“认知计算元年”。放眼商业时代,金融行业被认为是“认知智能”最具前景的应用领域之一。创新工场董事长兼ceo李开复曾多次在公开场合看好“ai 金融”。
金融科技,也称为程序化交易或者量化投资,可以理解为人工智能在证券投资领域的一个子分支,或者其技术在证券投资领域的具体应用。
量化投资的关键点就在于策略模型的大量使用,即利用现代统计学、数学方法,借助计算机处理海量数据和信息,并严格按照机器所构建的数量化模型来指导投资决策,以获得稳健的持续的投资收益,与alphago有异曲同工之处。
一般来说,量化投资部由两部分组成,一部分是投研团队,另一部分是it团队,投研团队提出需求,it团队做出算法交易的模块,解决基金经理们的需求。现阶段量化投资策略开发方式为:研究组或者交易组提出思路→研究组论证,提出基本模型→模型拟合估计→回溯检验→小规模测试→实盘投资。
其好处在于可以克服人性弱点,做决策时不会像人类一样受情绪和心理因素的干扰。可同时运用多个策略模型,对全市场各种信息进行实时监控,一旦出现合适的机会,能瞬间下达交易指令。
比如cta基金的趋向性跟踪指标,其调整多空头寸的临界点是由特定计算机算法规则的,并且嗅觉灵敏,能在第一时间改变阵营,下手迅速,更善于承担人类不喜欢的空头角色。一般这类品种是通过量化手段不断交易,反复进行大概率获得正收益的策略,会设置最大回撤值,一旦到“止损线”就立刻止损,因此风险并不会太高。
然而,量化投资本身也存在着一定的缺陷,存在过度拟合的问题:所谓过度拟合,指的就是程序化交易中,对于样本数据描述的准确度很高,而对于样本外数据描述的准确度却很差。导致历史回测完美,而在实盘中失效。有时还可能导致黑天鹅事件,数据模型主要是根据历史数据来构建的,所以它吸收新信息的能力比较缓慢和迟钝,一旦外部环境发生变化或者发生某些重大事件,如基本面上的变化等,有效性就会大大受到影响。
如果将大量的数据放入alphago 中的核心的“深度神经网络算法(dnn算法)”,那就可以自动提取一些相关性,同时匹配结果。理论上可以弥补研究人员建立模型时,容易忽略一些变量,导致模型失效的问题,以及解决了回归分析中会产生的过度拟合。
人类可以充分利用这个工具,充当一个掌舵手,通过前瞻性和对市场非理性机会的把握,对重大政治事件背后的洞察力,来对策略进行调整,保证时效性,构建稳健的投资策略。
面对复杂棋局,人类频频陷入长考,但“机器智能,化繁为简”...
有人说,柯洁的热情败给了阿尔法的速度,你怎么看?
深圳市爱智慧科技有限公司(www.aitech.xin)是由成功的互联网团队发起的高科技公司,致力于推动人工智能在金融领域的应用。
- 发布时间:2017-05-27 15:55
从4月10日应战,到5月22日晚赛前深夜发文《最后的对决》,柯洁代表的人类世界第一,赛前便被各方断言胜率为零。
“无论输赢,这都将是我与人工智能最后的三盘对局。”
“我会用我所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这...最后一次...”
“可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱,对它而言,它的热情——也只不过是运转速度过快导致cpu发热罢了。” 5月23日至27日,围棋峰会在乌镇召开。根据赛程安排,23日、25日以及27日,柯洁与alphago分别展开三场较量,获胜方将获得150万美元的巨额奖金。最终,柯洁0:3不敌alphago。而26日举行的团队赛中,五位世界冠军也惨遭团灭。
回顾:“下得很精彩”与“输得没脾气”
5月23日第一局,经过4小时17分37秒的鏖战,alphago执白以1/4子战胜柯洁,赛后发布会上,柯洁表示,“alphago是太厉害了,我输得没什么脾气”。作为一个职业棋手,如何在棋局中拿下对方赢得胜利是柯洁的使命。但他却不得不承认,ai进步速度太快了,alphago和去年相比判若两人,“当时觉得它的棋很接近人,现在感觉越来越像围棋上帝。”
“我希望我尽全力去拼每一盘,也希望自己给大家带来围棋的快乐。”柯洁透露,这三场比赛将是他与人工智能的最后3盘棋。“希望不留遗憾,下出好棋,让alphago主机更发烫一点也好。”
5月25日,中盘柯洁投子认负,却被deepmind创始人、alphago之父哈萨比斯誉为“逼出了alphago的极限”。柯洁直接挑起混战,展现人类棋手的最强实力,却在“当时认为自己离胜利很近了”的时候,由于太紧张而丢了本占上风的棋局。“可能这也是人类最大的一个弱点,我捂着胸口是想按着自己的心脏让它跳得慢一点。”
比赛开始一小时后,哈萨比斯发推特说:“难以置信!根据alphago的判断,柯洁今天表现完美!”在业内人士看来,柯洁发挥极其出色,前100步都和对手势均力敌。
有趣的是,本局alphago执黑,开局第一步没有按惯例走右上角,而是下在了右下小目,这在人类对局中被认为是“失礼”。局后deepmind创始人哈萨比斯特意就此向柯洁表示了歉意, 解释说:“因为alphago不会分辨‘上’和‘下’,对它来说,棋盘是对称的。”
5月27日最后决战,弈至209手,柯洁拿起两颗棋子盘上示意认负。至此,人机大战三番棋结束,柯洁0:3负于alphago。
alphago 2.0 : 技术重大提升,脱离人类经验
围棋起源于中国,至今已有四千余年历史,一直以来被认为是世界上最复杂的棋类游戏,也是智慧的象征。如果说,是人类的智慧造就了alphago,那么alphago也将让我们重新认识智慧的边界。
alphago 1.0 版本主要结合了三种算法:蒙特卡洛树搜索 监督学习 增强学习。其中,蒙特卡洛树搜索是一种优化过的暴力计算;监督学习是通过学习3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿;而增强学习作为辅助算法,是两台alphago从自我对战中学习如何下棋。
deepmind团队透露,新的 alphago 程序运行在单个谷歌云服务器上,由 tpu 芯片进行计算处理。算法上也进行了革新,它所需的计算能力仅需与李世乭对战时的 10%,自我对弈能力更强。去年,alphago 的模型中有 12 层神经网络,而在以master 名义出战时,深度已有40层。
根据公开资料推测,此次alphago2.0的技术原理与之前有着巨大不同:一是放弃监督学习,不再使用人类棋谱进行训练。这意味着突破了“机器学习依赖优质数据”这一限制,走棋风格也将脱离人类经验。二是放弃蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越聪明,就可以大大减少暴力计算,alphago 2.0 下棋的速度也印证了这一点。三则是极大强化了增强学习的作用,机器开始自我学习积累经验。
人机大战中,alphago 不断出现令人意想不到的走棋,跳出人类的思维定式,甚至完全颠覆人类对围棋的理解。发现一个有趣的现象,我国棋手开始尊称alphago为“阿老师”,也从侧面表明人类开始向机器学习,重新认识围棋。
alphago与金融科技
2016年3月,第一场alphago与李世石的人机大战开启了人们对人工智能的全新认识。2016年也被业界看作“认知计算元年”。放眼商业时代,金融行业被认为是“认知智能”最具前景的应用领域之一。创新工场董事长兼ceo李开复曾多次在公开场合看好“ai 金融”。
金融科技,也称为程序化交易或者量化投资,可以理解为人工智能在证券投资领域的一个子分支,或者其技术在证券投资领域的具体应用。
量化投资的关键点就在于策略模型的大量使用,即利用现代统计学、数学方法,借助计算机处理海量数据和信息,并严格按照机器所构建的数量化模型来指导投资决策,以获得稳健的持续的投资收益,与alphago有异曲同工之处。
一般来说,量化投资部由两部分组成,一部分是投研团队,另一部分是it团队,投研团队提出需求,it团队做出算法交易的模块,解决基金经理们的需求。现阶段量化投资策略开发方式为:研究组或者交易组提出思路→研究组论证,提出基本模型→模型拟合估计→回溯检验→小规模测试→实盘投资。
其好处在于可以克服人性弱点,做决策时不会像人类一样受情绪和心理因素的干扰。可同时运用多个策略模型,对全市场各种信息进行实时监控,一旦出现合适的机会,能瞬间下达交易指令。
比如cta基金的趋向性跟踪指标,其调整多空头寸的临界点是由特定计算机算法规则的,并且嗅觉灵敏,能在第一时间改变阵营,下手迅速,更善于承担人类不喜欢的空头角色。一般这类品种是通过量化手段不断交易,反复进行大概率获得正收益的策略,会设置最大回撤值,一旦到“止损线”就立刻止损,因此风险并不会太高。
然而,量化投资本身也存在着一定的缺陷,存在过度拟合的问题:所谓过度拟合,指的就是程序化交易中,对于样本数据描述的准确度很高,而对于样本外数据描述的准确度却很差。导致历史回测完美,而在实盘中失效。有时还可能导致黑天鹅事件,数据模型主要是根据历史数据来构建的,所以它吸收新信息的能力比较缓慢和迟钝,一旦外部环境发生变化或者发生某些重大事件,如基本面上的变化等,有效性就会大大受到影响。
如果将大量的数据放入alphago 中的核心的“深度神经网络算法(dnn算法)”,那就可以自动提取一些相关性,同时匹配结果。理论上可以弥补研究人员建立模型时,容易忽略一些变量,导致模型失效的问题,以及解决了回归分析中会产生的过度拟合。
人类可以充分利用这个工具,充当一个掌舵手,通过前瞻性和对市场非理性机会的把握,对重大政治事件背后的洞察力,来对策略进行调整,保证时效性,构建稳健的投资策略。
面对复杂棋局,人类频频陷入长考,但“机器智能,化繁为简”...
有人说,柯洁的热情败给了阿尔法的速度,你怎么看?
深圳市爱智慧科技有限公司(www.aitech.xin)是由成功的互联网团队发起的高科技公司,致力于推动人工智能在金融领域的应用。
7*24小时服务热线
0755-28248002
地址:深圳市龙岗区荣德时代广场a座9楼
电子邮件:
亚博ag旗舰厅的版权所有 © 2020 深圳市爱智慧科技有限公司