百灵杯决赛第一局棋谱是什么-百灵杯决赛第一局棋谱
人机大战柯洁的故事
柯洁,1997年8月2日出生于中国浙江丽水,中国围棋职业九段棋手。
曾获20xx年全国少儿围棋锦标赛冠军、20xx年世界青少年围棋少年组冠军、第28届应氏杯世青赛围棋青年组冠军、20xx年10月第16届“阿含桐山杯”中国围棋快棋公开赛冠军。自20xx年1月至20xx年1月,夺得第2届百灵杯世界围棋公开赛冠军、第20届三星杯世界围棋公开赛冠军、第2届梦百合杯世界围棋公开赛冠军,成为世界上最年轻的围棋三冠王。20xx年3月,作为主帅的柯洁为中国队夺得第17届农心杯世界围棋团体锦标赛冠军;7月,和於之莹搭档夺得世界围棋混双赛冠军;12月,获第21届三星车险杯世界围棋大师赛三番棋决赛冠军,收获个人第四座世界冠军奖杯。20xx年5月23日,柯洁对战AlphaGo第一局,以1/4子败于AlphaGo。
围棋
中国围棋九段柯洁与围棋人工智能程序AlphaGo的人机大战昨天结束了首番棋的较量,执黑的柯洁战至收官,以四分之一子告负。虽然接下来还有两盘棋的机会,但柯洁赛后更多的是苦笑。和一年前那个意气风发的他相比,如今的柯洁虽然还是世界围棋第一人,却已经接受了人工智能胜过人类棋手的现实。
“10%的胜率”不是烟幕弹
人机大战前,众说纷纭。古力说,赢一盘可能性10%;聂卫平说,能赢一盘就是烧香了;柯洁自己说,一直在备战秘密招数。可惜首盘对决,柯洁以失败收场。
亮点更多来自序盘阶段。柯洁执黑先行,前四手棋下了两个三三。直接点三三,正是AlphaGo的标志性招法。柯洁选择“以彼之道,还施彼身”,却没能收获AlphaGo惊愕的表情。
面对柯洁的“先捞后洗”,AlphaGo高效率应对。“我印象最深的是那一手断。”柯洁赛后复盘有点震惊,“人类对局是不可能下的,否则就落了后手了。但后来分析是好棋,不但劫材多了,还兼顾了角,加固了自己,一石二鸟,实在下得太出色了。”
收放自如的`“上帝”
比赛终局,柯洁在裁判数子后被判四分之一子负。媒体询问是否差距不大,柯洁苦笑说,是机器只想赢这四分之一子。
一场人机大战,又是挠头又是苦笑的柯洁贡献了不少“表情包”。提及自己丰富的表情,柯洁自嘲说,为什么苦笑大家都懂的,“苦笑嘛,不是开心的笑。因为我很早就知道自己会输,对手的发挥基本是匀速的,有时候我有时间就在那里数一数子,知道落后这些目,就是追不回来。”
无论生活中还是比赛中,柯洁很少“服软”,这一次他多次表达“输得没脾气”。接下来的话也让现场棋迷没了脾气,“上一次(AI)还是很接近人的,现在越来越接近围棋上帝了。”
后两盘棋目标“让主机发烫”
AlphaGo的进步得到了其团队的证实。当创始人哈萨比斯介绍,新版AI的计算量只是早期的十分之一时,同在台上的柯洁面无表情。但随后他说,就像之前声明的那样,这三番棋后不会再与AI下棋。
据介绍,新版AI使用了10个专门计算单元TPU。此外哈萨比斯也证实,新版AlphaGo没有学习人类棋谱,它的“老师”就是它自己。
和一年前相比,柯洁早已不再称呼其“阿法狗”了。他说会把软件当成老师和学习的对象,但不会再对决了。“AI进步速度太快了,以后会更加完美。人工智能的未来,我认为会是更美好的。不过围棋我还是喜欢和人下,包括中国的、日本的AI,我未来都不会下了。”他说。
对首盘的表现,柯洁坦言有点不满,“自己虽然很拼,但还是出现了人类的遗憾。后面两盘,我希望不留遗憾,哪怕让AlphaGo的主机稍微发烫一下也好啊。”
接下来的25日和27日,AlphaGo和柯洁将完成最后两番对战,此外围棋峰会还将安排配对赛和团体赛。配对赛中,古力和连笑将分别与AlphaGo组队进行对抗。团体赛中,五位中国顶尖职业棋手将组成战团,以集体智慧对抗人工智能AlphaGo。
聂卫平:人机已不在一个档次
柯洁版人机大战的结果不出意料,看到柯洁的棋,名宿聂卫平的点评并不客气。
在官子阶段,执黑的柯洁仍未认输,但聂老判断胜负已分:“一直是白棋好,如果继续下究竟差多少,这要由AlphaGo来决定,为什么呢,就我对它下的棋观察,它只求安全稳健,并不追求最优秀的、最正确的下法,只追求简单。”谈到柯洁是从什么时候开始落后的,聂老说,大概开始不久柯洁就进入了落后的状态,由于AlphaGo的布局构思远胜于人类,柯洁实际上是不知不觉就中了“道”了。
回顾对局,聂老称:“今天这盘棋,AlphaGo有几步棋是完全超出我们职业棋手的预料,它的招当时看你觉得很奇怪,但确实有它好的地方。从这盘棋我感觉到柯洁和AlphaGo不是一个档次的棋手,是差档次的。”
是井山之幸还是日本围棋之不幸
人们谈论说,人还是那个人,狗不再是那只狗——
但这次,狗不再是那只狗,人也不是那个人了。
昨日下午,论智从中新网了解到,刚刚斩获人生第五冠的棋手柯洁在中国棋院宣布,将于明年四月再度对战围棋AI程序:
作为一名棋手,我还是很享受去挑战强大的对手。对我而言弈无止境,下棋是不断挑战自我的过程,下这样的棋是有意义的,是我人生中很宝贵的经历。
这是继今年五月在三番棋中败于AlphaGo后,柯洁首次重燃对AI的战意。
五冠王:柯洁的脱胎换骨
26日,首届新奥杯世界围棋公开赛五番棋决赛决胜局正式廊坊落下帷幕,柯洁执黑以3/4子险胜另一名中国选手彭立尧,将比分锁定在了3-2。这是新奥杯的首个世界冠军,同时也是柯洁的第五个个人世界冠军。至此,柯洁打破韩国“石佛”李昌镐的记录(21岁295天),成了世界上最年轻的“五冠王”,时年20岁146天。
2015年1月14日,第2届百灵杯决赛柯洁3-2邱峻;
2015年12月8日,第20届三星杯决赛柯洁2-0时越;
2016年1月5日,第2届MLILY梦百合杯决赛柯洁3-2胜李世石;
2016年12月8日,第21届三星杯决赛柯洁2-1胜柁嘉熹;
2017年11月26日,第1届新奥杯决赛柯洁3-2彭立尧。
综观柯洁这一年的成绩,除了在对阵AlphaGo一役上吃了大亏,他的总体表现可圈可点,但也不乏一些起起落落。AlphaGo事件后,柯洁曾以22连胜的成绩夺得媒体瞩目,成为继井山裕太(26连胜)、李昌镐(24连胜)之后的史上第三人。但在放出“和人下棋原来能这么轻松”的豪言后,从8月起他也有走下坡路的趋势,甚至在不久前让出了自己蝉联了38个月的世界第一的位置(8天后又夺回)。
虽然是一个靠AlphaGo起家的“过气网红”,但棋手柯洁对中国围棋的贡献是有目共睹的。围棋是一项高强度的脑力活动,柯洁是人,是人就意味着会妥协、有情感、状态会不稳定。这大半年来,无论是被棋院要求走穴表演,还是仍为AlphaGo一战心中耿耿,亦或是状态掉进了低谷,在夺得新奥杯冠军前,人们不知道他在赛前的战绩是2胜6负,也不清楚他心中的压抑。他在接受采访时表示:
今年刚开始期待很高,特别是刚开始跟AlphaGo下完棋后的连胜,以为没人能阻挡我了,但后来发现阻挡我的人还是很多的。后来我也看开了,努力过就没有遗憾。今年总的成绩还算满意。现在的柯洁,似乎已经不再是那个曾经口出狂言的世界第一人。天才还是天才,但是他也开始展现出自己作为职业棋手的一面。偶像负责吸引眼球,但棋手不能丢的是对于精益求精的追求。围棋世界胜败无常,你必须有好胜心,但你也要毫无包袱地正视自己的每一场胜利和失败。
吴清源杯:此狗非彼狗
看罢柯洁,让我们来看这一次的狗。
今天,第一届“吴清源杯”世界女子围棋赛新闻发布会在中国棋院举行,借着人工智能的势头,主办方又打出了人工智能围棋赛这样吸睛的招牌,来为真正的比赛主体——女子围棋赛造势助威。
一代棋圣,少小离家,随局动荡,最后魂归故里。想依靠围棋打造AI产业的福州市是这么煽情的。而柯洁和女棋手於之莹作为当前国内棋手中的****,这一次又被邀请担任形象大使。简而言之,这还是一场走穴表演。
在女子围棋赛举行期间,一场同期举办的人工智能围棋大赛也会拉开帷幕。据主办方介绍,比赛邀请了腾讯绝艺、天壤、台湾CGI、日本DeepZenGo等来自中、日、韩、欧美等国家和地区的多支AI队伍,届时柯洁将与上海人工智能初创公司天壤智能的AI程序——天壤一决高下。
新奥杯解说界面(天壤也可用作棋局分析)谈及天壤,人们会把它称为“人工智能界冉冉升起的一颗新星”,它也在本届新奥杯世界围棋比赛上担任了解说,但这个曾在比赛中有过不俗表现的AI并没有收获与其成绩相称的关注度。在“象屿杯”上,它搭档聂卫平负于台湾世界冠军王立诚和人工智能CGI;在龙星战上,它不敌DeepZenGo获得了季军。也许是国人更爱冠军,人们只在这两场比赛里记住了胜者CGI和绝艺。
由于这些原因,我们对天壤知之不多,但在“象屿杯”期间,“天壤”创始人薛贵荣曾透露了一些设计思路:
其实它就是以大量人类的棋谱为起点,然后用两个同样的系统不断对弈,产生人类未必熟悉的棋路。在这个过程中再进行不断地迭代,修正下棋的策略,达到棋力的提升。粗一看,它类似AlphaGo的强化学习,又似乎带有一些GAN的意味。据不可靠消息,天壤已经达到了AlphaGo Master的水平,但具体表现如何,我们还需要静待比赛给出答案。
此外,届时替天壤执子的不是“黄博士”二号,而是一个由福州大学自动化学院研发的机械臂,恐怕到时候柯洁需要克服的不只是对AI的心理阴影,还有面对一个机械对手的不适感。
AlphaGo:不与红尘为伍
相比圈内的浮躁,不再下围棋的AlphaGo前阵子在技术上实现了又一轮突破。
正如论智在AlphaZero一天攻陷3大游戏,这是RL的成就还是TPU的胜利?中提到的,无论是硬件水平过硬,还是算法性能出色,AlphaZero在只有游戏规则的前提下一天内就击败了3类游戏中的顶级“选手”,这本身就是一个非常了不起的成就。
这里,我们再对这个新贵进行一番梳理。
众所周知,AlphaGo依靠棋谱数据集和RL进行学习,而它的升级版AlphaGo Zero则更进一步,无需棋谱,仅靠自学就在短期内超越了前辈。这次的AlphaZero是AlphaGo Zero算法的通用版本,它也不再需要借用传统手工搜集整理的数据和游戏的特定技巧玩法进行学习,而是依靠DNN、蒙特卡洛树搜索算法和“白板”强化学习算法不断自我对弈,用评分系统不断训练自己在3种棋类游戏的棋局中占据优势,最后战胜对手。
在DeepMind的实验中,AlphaZero在4个小时内就学会了国际象棋,在2个小时内就学会了日本将棋,并在8个小时内精通了围棋。
AlphaZero国际象棋、将棋、围棋百场对局结果如上图所示,经过一天训练,它在百场比赛中击败了这些对手。它们分别是2016年TCEC冠军、今年在51场比赛中保持不败战绩的国际象棋AI程序Stockfish,2017年CSA世界冠军、日本将棋AI程序Elmo,以及DeepMind上一篇论文的主角、只训练了3天就超越AlphaGo(李世石版)的围棋AI程序AG0 3(AlphaGo Zero3天训练版)。
当然,AlphaZero也不完全是AlphaGo Zero的重制版,它也进行了不少升级:
AlphaGo Zero只会考虑输/赢两种结果,因此它会不断估计并优化胜率;而AlphaZero会估计和优化比赛结果,并考虑平局或其他潜在的情况。
由于无论怎么调整棋局方位,围棋的规则都不会发生变化,AlphaZero沿用了AlphaGo Zero的方法,会通过增加一些对称数据强化训练,并在蒙特卡洛树搜索期间随机调整棋盘角度进行评估。但考虑到国际象棋和将棋的规则是不对称的,AlphaZero没有增加训练数据,在搜索时也不会改变棋盘位置。
AlphaGo Zero算法提升自我的方式是不断迭代,它会计算每一次训练的表现,如果后一次比前一次更优,那后者会代替前者进行之后的自我对弈。而AlphaZero从头到尾只有一个神经网络,它只通过更新参数来完成自我更新,省去了评分步骤,也不统计最佳状态。
AlphaGo Zero通过贝叶斯优化调整搜索的超参数,而AlphaZero则重复使用相同的超参数,无需针对特定游戏做改变。当然,这一点也有例外,就是AlphaZero为了保证搜索会把噪声添加进之前的动作中,它与合理下法的数量成正比。
结语:浮躁的围棋与未来
纵观这整件事,可以发现这很明显这又是一起炒作,一个噱头,而我们年仅20岁的天才棋手柯洁又成了围棋行业、某些部门,甚至是某些观众的消费对象。
柯洁确实是历代棋手中的一个“异类”,作为这个时代围棋界的棋手,他除了需要取得成绩,还承担着宣传、发扬围棋的使命。和传统体育的没落一样,围棋的没落也许是这个时代的一个必然,人工智能在其中只是充当了催化剂的作用。为了挽救这个传承千年的文化游戏,我们能理解棋手们的苦心。今年10月份,当柯洁因活动过多状态不佳时,聂卫平聂老曾说了一段话:
各个行业的明星不少,但英雄却不多。什么是行业英雄?除了在个人技艺上出类拔萃之外,还要有社会责任感、爱心、善心,传播正能量。在这方面,柯洁做得非常不错,是围棋界的榜样。非常现实的一番评价,我们呼吁个体价值的实现,但是又对这种流传下来的牺牲小我拯救大我的做法无力辩驳。
日本围棋曾经如日中天,现在已经几乎丧失了全部活力。21世纪初,日本棋院曾出品动漫作品来吸引青少年学习围棋,这在当时确实起到了一点作用,但杯水车薪。前几年,韩国也曾推出一部以曹薰铉、李昌镐、李世石等棋手为原型的电视剧,起到了一些宣传效果。而现在,中国棋院只是针对现在的偶像经济打造了一个围棋偶像,说到底,大家都是为了围棋,为了拯救日薄西山的围棋。
可以说,柯洁的英雄形象是一些人刻意塑造的。他是一个不可多得的天才,也许能在围棋史上创造又一个伟大的神话,但他同时也只是一个普通的一流选手。围棋没有常胜者,天赋、智力、年龄、灵感……它需要棋手沉下心来,钻研努力。当一个天才被冠上人类最强智力去和机器比拼,当他需要履行使命频繁地去参加公益活动,这其实也在消费他的天赋,他是行业的牺牲品。获益者是谁?是围棋本身?是围棋从业人员?是围棋经济?还是AI?其实它们都是,甚至连我们这些普通人,也不能置身事外。
也许最看不惯的,是连冰冷蠢笨的机械臂都要借计算机的算力来踩上人类一脚。
除了吸引更多人关注围棋外,这样的炒作也带来了行业生存之本——资金,无论是人才、比赛还是赛制,虽然许多人一直在批判近年来围棋行业的混乱与浮躁,但饱汉怎知饿汉饥,这是围棋之幸?还是围棋之悲?
最后,让我们观看这几十年来世界top 10围棋棋手的演变视频,来纪念这个逐渐走向回忆的游戏。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。