AI Poker Bot Pluribus ชนะคะแนนสูงสุดใน NLHE ผู้เล่นหลายคนเสียค่าใช้จ่ายเพียง $ 144

AI Poker Bot Pluribus ชนะคะแนนสูงสุดใน NLHE ผู้เล่นหลายคนเสียค่าใช้จ่ายเพียง $ 144

World Poker Tour กลับมาถ่ายทอดสดที่ฮาร์ดร็อคฮอลลีวูดท่ามกลางวิกฤตความปลอดภัย



บอร์ดบอทใหม่เพื่อเล่นถูกจัดตั้งขึ้นโดยทีมนักพัฒนาเดียวกันกับที่ให้ Libratus กลับมาในปี 2017 และคราวนี้มันเอาชนะทีมผู้เล่นโป๊กเกอร์ชั้นนำได้สำเร็จในการแข่งขัน NLHE หกมือ Facebook ทำงานร่วมกับนักวิจัยจากมหาวิทยาลัย Carnegie Mellon ซึ่งนำโดยอาจารย์ Tuomas Sandholm ของ CMU และ Noam Brown นักศึกษาระดับบัณฑิตศึกษาของเขาซึ่งจัดการสาธิตที่มีซูเปอร์คอมพิวเตอร์โป๊กเกอร์ AI รุ่นล่าสุดชื่อว่า “Pluribus” กับผู้เล่นชั้นนำในอุตสาหกรรม บอทสามารถเอาชนะคู่ต่อสู้ได้ซึ่งเป็นสิ่งที่ AI อื่นไม่เคยค้นพบมาก่อน (โปรแกรม AI ที่ผ่านมาสามารถชนะได้ในเกมโป๊กเกอร์ที่มีผู้เล่นสองคนเท่านั้น) คาดว่าผลลัพธ์ของโครงการนี้จะมีผลกระทบอย่างมากต่อการวิจัย AI และเกมโป๊กเกอร์เอง TrialsPoker ถูกมองว่าเป็นเกมที่เปิดโปงปัญหาของข้อมูลที่เป็นความลับดังนั้นนักวิจัยจึงใช้สิ่งนั้นเป็นปัญหาในการออกแบบและพัฒนาหน่วยสืบราชการลับปลอม ดังนั้นจึงไม่มีเครื่องจักรใดที่ประสบความสำเร็จอย่างมากในการเอาชนะผู้เล่นที่เป็นมนุษย์ในระบบ Texas Hold’em แบบไม่ จำกัด จำนวนผู้เล่นหลายคน (รูปแบบที่นิยมมากที่สุดในการเล่นโป๊กเกอร์) จนกระทั่ง Pluribus เข้ามา Pluribus ต่อสู้กับหนึ่งในมือโปรโป๊กเกอร์ที่ดีที่สุดในรูปแบบ 6-max NLHE โปรเซสเซอร์เป็นผู้เชี่ยวชาญระดับหกสูงสุดซึ่งได้รับรางวัลรวม 1 ล้านดอลลาร์จากโปรเจ็กต์โป๊กเกอร์มืออาชีพของพวกเขา พลูริบัสได้รับการทดสอบสองครั้งแยกกัน ในการทดลองครั้งแรกคนห้าคนที่มี AI หนึ่งคน (5H + 1AI) ถูกผูกติดกันในขณะที่ในการทดลองครั้งที่สองคนหนึ่งต้องเผชิญหน้ากับพลูริบัสทั้งห้ามุม (1H + 5AI) โดยคิดว่าเรือไม่ได้รับอนุญาตให้พูดและพวกเขา ไม่รู้จักเพื่อนร่วมทีมจึงป้องกันการประนีประนอม ผลการทดสอบสองครั้งพบว่าอัตราการชนะของพลูริบัสสูงกว่าอย่างมีนัยสำคัญเมื่อเทียบกับผู้ที่เล่นโป๊กเกอร์ ผู้เล่นบางคนที่เข้าร่วมการทดลอง ได้แก่ Anthony Gregg, Dong Kim, Greg Merson, Jacob Toole, Jason Les, Jimmy Chou, Linus Loeliger, Michael Gagliano, Nick Petrangelo, Sean Ruane, Seth Davies และ Trevor Savage และผู้เล่นอีกคนที่ใช้ a ชื่อเล่นระหว่างเล่น ในการทดลอง 5H + 1AI มีการเล่น 10,000 มือภายใน 12 วันในระหว่างการทดสอบ 1H + 5AI ผู้เล่นโป๊กเกอร์คาร์เรนอีเลียสและคริสเฟอร์กูสันเล่น 5,000 มือแข่งขันกับ Procurus ห้าสำเนา เมื่อผลลัพธ์ออกมาปรากฎว่าบอทสามารถตีผู้คนได้ด้วยเงินประมาณ 5 เหรียญต่อมือและประมาณ 1,000 เหรียญต่อชั่วโมงตามโพสต์บล็อก Facebook AI ของ Noam Brown วิดีโอสาธิต Pluribus vs Pros: ข้อดีของโป๊กเกอร์คิดอย่างไรกับ AI Pluribus นี่คือสิ่งที่ผู้เข้าร่วมการทดลองพูดเกี่ยวกับบอทโป๊กเกอร์ในปัจจุบัน Seth Davies: “สิ่งที่สร้างแรงบันดาลใจมากที่สุดในการเล่นกับ Pluribus คือการตอบสนองต่อนักวิ่งแถวหน้าอย่างเข้มงวด Pluribus ใช้จำนวนมากในการยกขนาดพรีฟล็อปการพยายามตอบสนองต่อเสียงกลางแจ้งเป็นความท้าทายที่สนุกกับเกมของมนุษย์ ” Jason Les: “มันเป็นมอนสเตอร์บลัฟเฟอร์ที่สมบูรณ์แบบผมว่ามันเป็นการบู๊ตที่มีประสิทธิภาพมากกว่าคนส่วนใหญ่และนั่นคือสิ่งที่ทำให้ยากที่จะเล่นกับมันคุณมักจะตกอยู่ในสถานการณ์ที่มีความกดดันมากมาย AI “ทำให้คุณเข้ามาและคุณจะรู้ว่ามันสนุกที่นี่” Jimmy Chou: “ทุกครั้งที่ฉันเล่นเรือฉันรู้สึกเหมือนได้รับสิ่งใหม่ ๆ เข้ามาในเกมของฉัน ในฐานะมนุษย์ฉันคิดว่าเรามีแนวโน้มที่จะทำให้เกมง่ายขึ้นทำให้เส้นทางใช้และจดจำได้ง่ายขึ้น บอทไม่ได้ใช้ “ทางลัดใด ๆ เหล่านี้และมีลำต้นของต้นไม้ที่มั่นคง / มั่นคงสำหรับการตัดสินใจทุกครั้ง” คริสเฟอร์กูสัน: “พลูริบัสเป็นศัตรูที่ยากที่สุดในการเล่นด้วยมันยากมากที่จะตรึงเขาด้วยมือใด ๆ เขายังทำได้ดีมากในการสร้างมูลค่าของการพนันในแม่น้ำเขาเก่งมากในการดึงคุณค่าจากความดีของเขาด้วยมือ” Darren Elias: “ฉันเป็นคนเดียวที่มีห้าเวอร์ชันนี้บอทโป๊กเกอร์ AI ซึ่งฉันจะเล่นทุกวันด้วยมือนับพันมันเติบโตอย่างรวดเร็วจากการเป็นผู้เล่นระดับต่ำไปจนถึงโป๊กเกอร์ระดับโลก ผู้เล่นในเวลาไม่กี่วันและหลายสัปดาห์นั่นเป็นเรื่องที่น่าสยดสยอง “Pluribus ใน Nutshell ตอนนี้ปลอดภัยที่จะกล่าวได้ว่าหนึ่งในผู้เล่นโป๊กเกอร์ชั้นนำไม่ได้เผชิญหน้ากับโป๊กเกอร์ แกนกลางของ Pluribus หรือแผนกลยุทธ์สร้างขึ้นจากการเล่นเองหรือแข่งขันกับมุมของตัวเอง นี่เป็นวิธีการเดียวกับที่ใช้ในการสร้าง OpenAI Five ซึ่งเป็นทีมจากเครือข่าย Network 5 แห่งที่ได้รับการฝึกฝนมาอย่างเท่าเทียมกัน 55 ปีและสามารถเอาชนะทีม eSports มืออาชีพในวิดีโอเกม Dota 2 ได้ Pluribus ฝึกฝนตัวเองตั้งแต่เริ่มต้นโดยใช้การเพิ่มประสิทธิภาพการเรียนรู้แบบหนึ่งที่คล้ายกับ แอปพลิเคชัน Go AI ของ DeepMind AlphaZero เริ่มต้นด้วยการเล่นโป๊กเกอร์ที่ผิดปกติและปรับปรุงเมื่อตัดสินใจว่ากลยุทธ์ใดจะได้เงินมากที่สุด หลังจากเล่นแต่ละมือเธอจะจำการเต้นรำที่เธอเคยเล่นและคิดว่าเธอสามารถทำเงินได้มากมายจากการกระทำต่างๆเช่นการตื่นนอนแทนที่จะยึดติดกับการเดิมพัน หากวิธีการอื่นนำไปสู่ข้อสรุปก็มีแนวโน้มที่จะกำหนดสิ่งเหล่านั้นในสถานการณ์ในอนาคต ด้วยการเล่นโป๊กเกอร์หลายล้านล้านมือที่แข่งขันกัน Pluribus ได้คิดค้นกลยุทธ์แรกที่ตามมาในเกม จากการตัดสินใจทั้งหมดที่เกิดขึ้น Pluribus เปรียบเทียบสถานะของเกมกับระบบของเกมและประเมินความคืบหน้าเล็กน้อยเพื่อดูว่าเกมเล่นอย่างไร จากนั้นจะตัดสินใจว่าสามารถปรับปรุงได้หรือไม่ ด้วยการเรียนรู้ด้วยตัวเองโดยไม่มีการจัดวางของมนุษย์ Pluribus ใช้ระบบบางอย่างที่ผู้เล่นที่เป็นมนุษย์ไม่คิดจะใช้ ความสำเร็จของพลูริบัสส่วนใหญ่เกิดจากประสิทธิภาพ เมื่อเล่นโป๊กเกอร์มันจะทำงานบนหน่วยประมวลผลกลาง (ซีพียู) สองหน่วยซึ่งแตกต่างจากซีพียู 100 ตัวของ Libratus และ Go bot ตัวแรกของ DeepMind ซึ่งใช้ PCU ประมาณสองพันเครื่องเมื่อพวกเขาเข้าถึงผู้เล่นอันดับต้น ๆ เมื่อพลูริบัสเล่นแบบแข่งขันมันจะปรบมือในเวลาประมาณ 20 วินาทีซึ่งเกือบจะเร็วพอ ๆ กับผู้เล่นทักษะมนุษย์ ข้อดีอีกอย่างของ Pluribus คือซอฟต์แวร์ที่ทำงานบนเซิร์ฟเวอร์รายปีมีค่าใช้จ่ายเพียง $ 144 เมื่อเปรียบเทียบแล้ว Libratus ได้รับการขัดเกลาด้วยคอมพิวเตอร์มูลค่า 9.65 ล้านเหรียญมันแพงเกินไปที่จะรัน แน่นอนว่าการทดลองนี้ไม่ได้ จำกัด เฉพาะโป๊กเกอร์ แม้ว่าจะเป็นสิ่งที่ยอดเยี่ยมในการเอาชนะโป๊กเกอร์มนุษย์ที่เก่งที่สุดในเกมหกมือ แต่ก็แสดงให้เห็นว่าพลังของคอมพิวเตอร์สามารถมีจุดประสงค์ที่แตกต่างจากการเล่นไพ่ ผลการวิจัยชี้ให้เห็นถึงความจริงที่ว่า AI สามารถทำงานในระดับที่สูงขึ้นของมนุษยชาติในกรณีที่มีการเรียนรู้ในระดับสูงและขาดการเข้าถึงข้อมูลและสามารถนำไปใช้ที่ใดก็ได้ตั้งแต่ธนาคารเพื่อการลงทุนและระบบการสื่อสารไปจนถึงเทคโนโลยีรถยนต์ขับเคลื่อนด้วยตนเอง . Pluribus กำลังเข้าร่วมส่วนหนึ่งของเกมเช่น Chess and Go ซึ่งเป็นสองเกมที่ผู้เล่นทั่วโลกพ่ายแพ้ต่อภาพลวงตาของ Kwayaka: https://science.sciencemag.org/content/early/2019/07/10/science aay2400


ปอยเปต คาสิโน
เกมส์ยิ่งปลา คาสิโน ได้เงินจริงไหม
เล่น คาสิโน
คาสิโน191
คาสิโน 88

Leave a Reply

Your email address will not be published. Required fields are marked *