开启辅助访问
 找回密码
 立即注册

QQ登录

只需一步,快速开始

AI练成赌神,完败

  • ta_mind
    开心
    2017-3-25 23:19
  • classn_01: 3 classn_02

    [LV.2]偶尔看看I

    1万

    主题

    1万

    帖子

    3万

    积分

    论坛元老

    Rank: 8Rank: 8

    积分
    33237
    2019-7-20 13:03:11 | 显示全部楼层
    AI练成赌神,完败-y1.jpg

    AI练成赌神,完败德州扑克人类选手

    Facebook与卡内基梅隆大学合作开发的一款新型人工智能系统 Pluribus,在世界上最流行、最广泛的扑克游戏:六人无限注德州扑克 (Texas Hold'em poker) 中击败了顶级人类职业玩家。Pluribus 在“5 个 AI + 1 个人类玩家”和“1 个 AI + 5 个人类玩家”两种模式下都击败了职业玩家。

    该机器人一共击败了15名职业选手,其中包括2000年世界扑克锦标赛冠军克里斯“耶稣”弗格森和4次世界扑克巡回赛冠军达伦埃利亚斯。Facebook声称,Pluribus是第一个在基准游戏中持续击败2个人类玩家以上的人工智能。

    多年来,从国际象棋到星际争霸(Starcraft)之类的电子游戏,人工智能一直在击败人类玩家。不过既往均为“完全信息类”博弈,此次取胜是AI首次在“非完全博弈类”完全取胜。

    “完全信息类”博弈包括国际象棋、围棋等,它们的盘面信息都是公开的,对弈双方接收到的信息完全。在此类博弈中,AI 每次只需要根据当前盘面,搜索计算各种情况下自己的胜率。为了提高搜索效率,一般需要对搜索过程中产生的“博弈树”进行广度和深度剪枝。就是我们平常下棋时常说的算多远和算多准。

    “非完全信息类”博弈包括德州扑克、桥牌、麻将等游戏。以德州扑克为例,你不可能知道你对手所知道的所有信息,所以更难预测他们会做出什么样的动作,并且同时与你对战的玩家越多就越困难。这些制约因素使得电脑更难掌控扑克牌游戏规则。

    培训成本低廉

    在 8 天时间内,研究人员在 64 核服务器上培训了 Pluribus 的蓝图策略,所需内存不到 512 GB,而且没有使用 GPU。按照典型的云计算的成本估计,培训成本不到 150 美元。这与最近的其他人工智能项目突破形成了鲜明对比,这些突破通常需要花费数百万美元进行训练。

    在玩德州扑克时,Pluribus 运行在两个 CPU 上。相比之下,2016 年,AlphaGo 在与顶级围棋专业人士李世的比赛中,使用了 1,920 个 CPU 和 280 个 GPU 进行实时搜索。而且,Pluribus 使用不到 128 GB 的内存。

    在击败人类顶级玩家之后,研究人员担心 Pluribus 可能被用来掏空在线德州扑克公司的金库,因此决定不发布其代码。目前,Facebook 也没有计划去应用为六人扑克开发的技术。
    回复

    使用道具 举报

  • ta_mind
    开心
    2019-11-24 00:17
  • classn_01: 216 classn_02

    [LV.7]常住居民III

    3

    主题

    2509

    帖子

    9540

    积分

    论坛元老

    Rank: 8Rank: 8

    积分
    9540
    iloov|2019-7-21 08:39:01 | 显示全部楼层
    开平市哪种方法算卦比较准金坛市哪种方法算卦比较准石家庄哪种方法算卦比较准
    回复

    使用道具 举报

    网投领导者

    国际公司背景,资金安全有保障,公司信誉佳

    盘口多,走地多 NBA足球更是节节开盘 亚洲最大娱乐公司之一,信誉好
    在线客服
    QQ 290087180
    客服电话
    00886970314961
    手机网址
    发布 快速回复 返回顶部 返回列表