หลังจากเล่นหมากรุกและก่อนสมองอันโอชะของเรา AI กำลังมาสำหรับเกมวางแผนทางสังคม – และมันก็เป็นชัยชนะ

นับตั้งแต่คอมพิวเตอร์หมากรุก Deep Blue เอาชนะ Garry Kasparov แชมป์หมากรุกโลกในปี 1997 ปัญญาประดิษฐ์ได้มีอิทธิพลเหนือมนุษย์มากขึ้นในเกม ‘ฝ่ายตรงข้าม’ ไม่กี่เกม ซึ่งเป็นเกมที่ปฏิสัมพันธ์ของมนุษย์มีบทบาทจำกัด อย่างไรก็ตาม ขณะนี้ กลุ่มนักวิจัยได้เปิดเผย AI ใหม่ที่พยายามขยายกลุ่มเกมที่คอมพิวเตอร์สามารถเอาชนะคุณได้
ใน กระดาษ (เปิดในแท็บใหม่) เผยแพร่ในสัปดาห์นี้ นักวิจัยเปิดตัว Cicero ซึ่งเป็น AI ที่ได้รับการฝึกฝนให้ชนะเกม Diplomacy ซึ่งเป็นเกมกระดานที่มีผู้เล่น 7 คนซึ่ง “ในแต่ละเทิร์น ผู้เล่นทุกคนมีส่วนร่วมใน […] การสนทนาในรูปแบบอิสระกับผู้อื่นในระหว่างช่วงการเจรจา” ก่อนที่จะดำเนินการ ระยะการสนทนานั้นเป็นสิ่งที่ทำให้ความพยายามของ Cicero แตกต่างจาก AI อื่นๆ
กระดาษระบุว่า “ความก้าวหน้าของ AI ก่อนหน้านี้เกือบทั้งหมด” อยู่ในเกม “ผู้เล่นสองคนที่มีผลรวมเป็นศูนย์” ซึ่งการได้เปรียบตนเองทำให้ผู้เล่นอีกฝ่ายเสียเปรียบโดยตรง ในเกมเหล่านั้น – Chess, StarCraft, Go และ Poker – AI สามารถเรียนรู้กลยุทธ์ที่ดีที่สุดโดยการเล่นกับตัวเองในรูปแบบที่เรียกว่า ‘การเล่นด้วยตัวเอง’ ในที่สุดก็จะพบกับวิธีการที่ไม่สามารถเอาชนะได้ในเกมที่สมดุล ในตัวอย่างเหล่านี้ ความซับซ้อนของเกมนั้นไม่สำคัญ สิ่งสำคัญคือการสื่อสารไม่ใช่กลไกหลักของเกม และการกระทำแต่ละอย่างพยายามทำให้ผู้เล่นอีกคนกลับไปสู่เป้าหมายของตน
นั่นไม่ใช่ความจริงสำหรับ Diplomacy ซึ่งเป็นเกมที่การสนทนาระหว่างผู้เล่นมีความสำคัญ (หากไม่สำคัญทั้งหมด) และการได้รับผลประโยชน์ไม่จำเป็นต้องเป็นอันตรายต่อฝ่ายตรงข้าม ที่นี่เล่นเอง “สร้างภาษาที่ไม่สามารถตีความได้” นั่นเป็นอุปสรรคสำคัญในการเอาชนะ เนื่องจากการไม่เปิดเผยตัวตนเป็นกุญแจสำคัญในการทดลองที่ยุติธรรม การสื่อสารระหว่างผู้เล่นต้องขึ้นอยู่กับสถานะของเกมหรือเหตุการณ์ที่เกิดขึ้นแล้ว และถ้า Cicero ลื่นล้ม โอกาสที่จะถูกตรวจพบเนื่องจากไม่สามารถอธิบายข้อผิดพลาดได้
อย่างไรก็ตาม สิ่งสำคัญยิ่งกว่านั้นคือความสามารถในการสร้างความไว้วางใจกับผู้เล่นคนอื่นๆ ในทางทฤษฎี แนวคิดดังกล่าวอาจแปลกสำหรับซิเซโร แต่การจะประสบความสำเร็จได้นั้นจำเป็นต้องสร้าง “ความสามารถในการให้เหตุผลเกี่ยวกับความเชื่อ เป้าหมาย และความตั้งใจของผู้อื่น” เช่นเดียวกับ “ความสามารถในการโน้มน้าวใจและสร้างความสัมพันธ์ผ่านบทสนทนา”
ในการก่อตั้งซิเซโร นักวิจัยได้นำชุดข้อมูลของเกมการทูตที่ขับเคลื่อนด้วยบทสนทนามากกว่า 40,000 เกมจากเวอร์ชันออนไลน์ของเกม จากนั้น แบบจำลองการสนทนาพื้นฐานจะได้รับการฝึกอบรมในบันทึกการสนทนาของ Diplomacy และจากนั้นได้รับการฝึกฝนให้คาดการณ์ข้อความตามอาร์เรย์ของข้อมูลเกม ในที่สุด ซิเซโรได้รับการฝึกฝนให้ “ใช้ประโยชน์” ข้อมูลในข้อความเมื่อตัดสินใจเกี่ยวกับการกระทำครั้งต่อไป ในขณะเดียวกันก็ให้เหตุผลว่าผู้เล่นคนอื่นอาจพยายามทำอะไร
ในที่สุด ซิเซโรก็ได้เข้าสู่ลีกออนไลน์โดยไม่ระบุชื่อซึ่งเริ่มตั้งแต่เดือนสิงหาคมถึงตุลาคม 2022 โดยเล่นทั้งหมด 40 เกม อยู่ใน 10% แรกของผู้ที่เล่นมากกว่าหนึ่งครั้ง และเป็นอันดับสองจากผู้เล่น 19 คนที่เล่นมากกว่า ห้าเกม โดยรวมแล้ว ซิเซโรเป็นผู้ชนะทัวร์นาเมนต์ โดยมีคะแนนเฉลี่ยมากกว่าสองเท่าจากคู่แข่ง 82 คน
อาจไม่ใช่การทำลายล้างอย่างสมบูรณ์ แต่เป็นความพยายามที่ชนะการแข่งขันสำหรับ AI ซึ่งวางรากฐานที่สำคัญสำหรับความพยายามที่คล้ายกันในอนาคต สำหรับตอนนี้ อาจจำกัดอยู่แค่การทูตเท่านั้น แต่ทำให้ฉันรู้สึกว่าเทคโนโลยีที่คล้ายกับ Cicero สักวันหนึ่งอาจนำไปสู่เกมอย่าง Settlers of Catan หรือแม้แต่วิดีโอเกมหักมุมทางสังคมอย่าง Town of Salem หรือ Among Us ตอนนี้ นั่น จะเป็นซู
ต้องการฝึกฝนก่อนเจ้าเหนือหัว AI ใหม่ของเราหรือไม่ นี่คือ เกมกระดานที่ดีที่สุด ข้างนอกนั้น.