优化的尽头
在企鹅与wsT合作之初就有了技术方面的共享,所以“小奥”的源代码,企鹅这边都是有的。
只不过,先前凌志的权限不够,而如今有了杨立飞的首肯,凌志也能访问到“小奥”的源代码了。
奥沙利文安排凌志和“小奥”重新来一场比赛,他想近距离观察一下小奥的发挥。
这场比赛的结果不出凌志预料,他输了。
“小奥”本身就是准度极高的aI机器人,在沉浸式表演赛结束之后,鹰方疑似又将它的内置算法优化了一下。
如今的“小奥”,近乎于没有短板!
凌志以正常的方式跟“小奥”打了两局,基本上都是长台被“小奥”抓住了机会,然后一杆超分。
当初,凌志在VR密室中,采用了炸散球堆然后一杆超分的方式赢下了一局比赛。
对待这种程度的对手,最好的取胜方式,就是不让对手上场!
可是,炸散球堆的方式并不能保证每一次都能有红球入袋。
如果是在正式比赛上,面对现在的“小奥”,凌志不可能有获胜的机会。
至少现在的他,想不到任何取胜的方式。
奥沙利文似乎知道凌志在想什么,他笑了笑,指着年轻时候的自己说道:
“其实它有一个很明显的缺陷,不知道你们发现没有?”
凌志三人沉默了一会儿,路锋试探着说道:
“我不确定这是否是缺陷,但我总觉得......在跟他打球的时候,我们几乎抓不到任何简单上手的机会。”
“它的防守十分严谨,很难找到它的破绽,而它每次上手,基本上都是抓住了我们的破绽!”
“所以它倒逼我们采取保守式打法,这样我们才能不给它留下简单上手的机会。可每当这种时候,它的打法会变得更加保守!”
“比如刚刚几局,要是凌志坚持贴球堆防守,我相信它也会跟着贴球堆,根本不会选择主动打开局面!”
“你说得没错。”
奥沙利文肯定了路锋的说法,
“我还以为你们会被它强大的球技所蒙蔽,还好,你们都还能保持清醒。”
“它最大的问题就是像你刚刚说的那样,路。”
“它能保证自己输不了,但是它没办法保证自己一定能赢!”
凌志若有所思地点了点头,奥沙利文一语中的,点出了问题的关键。
“小奥”的进攻无懈可击,防守也不会留下太多破绽,这种情况下,本身就立于不败之地。
它之所以能赢,主要还是抓住了对手留下的机会,而它自己却从来不会主动进攻难度球为自己创造出机会!
当然,这样的要求,或许对于aI来说有些苛刻,因为就连人类自己,都难以达到它的水平。
然而在人类的赛场之上,所有选手都会努力为自己创造出机会,没有人会采取消极打法。
这也是人类能不断进步的原因所在!
如果满足于aI现有的水平,那么它只会迟滞不前。
人类无法从aI的行为数据当中学习到更多的东西,而aI存在的意义,只是成为了一个不错的陪练而已。
然而台球圈子内的人都知道,如果对战双方实力差距巨大,那么实力较弱的那一方,其实并不能起到很好的练习效果。
因为本来说好的是一场博弈,可到头来却成了个人秀。
所以aI必须要有学习能力才可以!否则最后,只能当一个装饰用的花瓶。
凌志将自己的想法说了出来,奥沙利文点了点头:
“非常好,凌。看起来,邀请到你,是一个极其正确的选择!”
“没有没有,我才觉得十分荣幸呢。”
“那你觉得,如何才能提高它的进攻积极性呢?”
“我觉得可以选择性地让它进攻一些难度红球,不仅限于红球在袋口的那种......”
凌志和奥沙利文在球桌旁边讨论着这些技术性问题,路锋和汤开诚相视一笑,情不自禁地开始互相调侃:
“你能听懂么?老路。”
“我当然能,你呢?”
“我够呛,你知道的,我英语也就那样儿,要不是有手机充当翻译,我都不敢带学员走出国门。”
“其实我也没好多少,虽然凌志说的,我大概知道是什么意思,但他时不时会冒出来一些晦涩的专业术语,比如reinforcementlearning之类。”
路锋顿了顿,继续道:
“其实我听不懂倒还无所谓,但我惊讶的是,奥沙利文竟然在不断地点头!我都不知道,他到底是真懂还是在装懂......”
两位教练在场边聊得不亦乐乎,而场上的奥沙利文已经和凌志初步敲定出了一个方案。
凌志决定先调试一下“小奥”的源代码,看看效果怎样。