บทเรียนการตัดสินใจจากหมากรุกออนไลน์

0

[ad_1]

ฟิกเกอร์กระดาษทำงาน w30002

เอ็มการตัดสินใจใดๆ เกี่ยวข้องกับการเลือกจากตัวเลือกที่ซับซ้อน และอาจเป็นเรื่องยากที่จะประเมินคุณค่าของทางเลือกแต่ละทาง ใน ความซับซ้อนและทางเลือก (เอกสารการทำงาน NBER 30002) ยูวัล ซาลันต์ และ Jörg L. Spenkuch ใช้ข้อมูลหมากรุก 227 ล้านครั้งบนเซิร์ฟเวอร์หมากรุกออนไลน์เพื่อศึกษาว่าความซับซ้อนส่งผลต่อคุณภาพของการตัดสินใจอย่างไร พวกเขาพบว่าตัวเลือกที่เหมาะสมที่สุดที่ซับซ้อนนั้นถูกเลือกน้อยกว่าทางเลือกอื่นๆ ที่เหมาะสมที่สุดเช่นกันแต่ง่ายกว่า

นักวิจัยได้นำเสนอรูปแบบการเลือกโดยแต่ละตัวเลือกมีทั้งคุณค่าที่แท้จริงและความซับซ้อนในระดับหนึ่ง ผู้มีอำนาจตัดสินใจมีทักษะในการประเมินคุณค่าของตัวเลือกแต่ละอย่าง บางทีอาจมาจากสติปัญญาหรือประสบการณ์ พวกเขาสามารถประเมินมูลค่าของตัวเลือกได้อย่างแม่นยำที่มีความซับซ้อนจนถึงระดับทักษะ แต่พวกเขาจะประเมินค่าของตัวเลือกที่มีความซับซ้อนเกินความสามารถโดยผิดพลาดเท่านั้น ผู้มีอำนาจตัดสินใจปฏิบัติตามกระบวนการที่เรียกว่า “ความพึงพอใจ” แทนที่จะประมาณค่าของตัวเลือกทั้งหมดแล้วเลือกตัวเลือกสูงสุด ผู้พึงพอใจจะกำหนดระดับความทะเยอทะยานหรือค่าต่ำสุดที่พวกเขาต้องการค้นหา และยอมรับตัวเลือกแรกที่มีมูลค่าที่ประมาณการเกิน

ผู้เล่นดูเหมือนจะ “พอใจ” โดยเลือกการเคลื่อนไหวที่ง่ายกว่าเมื่อเทียบกับท่าที่มีคุณค่าเท่ากันแต่ซับซ้อนกว่า และทำผิดพลาดมากขึ้นเมื่อชุดตัวเลือกรวมการเคลื่อนไหวที่ซับซ้อนมากขึ้น

นักวิจัยทดสอบทฤษฎีนี้โดยใช้ข้อมูลจาก Lichess ซึ่งเป็นแพลตฟอร์มหมากรุกออนไลน์ยอดนิยม ข้อมูลของพวกเขาครอบคลุมเกมหมากรุกที่เล่นโดยมนุษย์ทั้งหมดที่ใช้ในการกำหนดอันดับผู้เล่นระหว่างเดือนมกราคม 2013 ถึงสิงหาคม 2020

หมากรุกเป็นสภาพแวดล้อมที่เป็นธรรมชาติในการเรียนรู้ทางเลือกระหว่างตัวเลือกที่ซับซ้อน ในแต่ละเทิร์น ผู้เล่นจะเลือกจากชุดการเคลื่อนไหวที่มีอยู่ แต่ละคนมีค่าวัตถุประสงค์ ไม่ว่าจะเป็นการอนุญาตให้ผู้เล่นปัจจุบันบังคับให้ชนะหากเธอเล่นอย่างเหมาะสม ไม่ว่าคู่ต่อสู้ของเธอจะทำอะไร ยอมให้คู่ต่อสู้ของเธอบังคับให้ชนะ หรืออนุญาตให้ผู้เล่นทั้งสองบังคับให้เสมอกัน แม้ว่าจะเป็นไปไม่ได้ในการคำนวณที่จะจำแนกการเคลื่อนไหวในช่วงต้นเกมว่าชนะ แพ้ หรือเสมอ แต่อัลกอริธึมของคอมพิวเตอร์ได้จำแนกการเคลื่อนไหวทั้งหมดเมื่อเหลือไม่เกินหกชิ้น นักวิจัยศึกษาหมากรุก endgames ซึ่งพวกเขาสามารถระบุข้อผิดพลาดที่เกิดขึ้นได้อย่างชัดเจนเมื่อผู้เล่นเผชิญกับการกำหนดค่าของกระดานที่อนุญาตให้ชนะอย่างน้อยหนึ่งครั้งและแพ้หรือเสมออย่างน้อยหนึ่งครั้ง

นอกจากค่าวัตถุประสงค์แล้ว ท่าหมากรุกยังมีการวัดความซับซ้อนตามวัตถุประสงค์ ท่าชนะและท่าแพ้มี “ความลึกในการคู่ครอง” (DTM) ซึ่งเป็นจำนวนเทิร์นที่น้อยที่สุดที่ผู้เล่นคนใดคนหนึ่งสามารถบังคับให้ชนะหรือถูกบังคับให้แพ้ นักวิจัยให้เหตุผลว่ายิ่ง DTM ของการเคลื่อนไหวสูงเท่าไหร่ ก็ยิ่งยากที่จะระบุว่าเป็นการเคลื่อนไหวที่แพ้หรือชนะ

ข้อผิดพลาดเกิดขึ้นได้บ่อยขึ้นเมื่อการเคลื่อนไหวมีความซับซ้อนมากขึ้น ผู้เล่นมีโอกาสน้อยที่จะเลือกการเคลื่อนไหวที่ชนะหากมันซับซ้อนกว่า และพวกเขามีโอกาสน้อยที่จะเลือกท่าที่แพ้อย่างผิด ๆ ถ้ามันซับซ้อนน้อยกว่า เป็นผลให้เกิดข้อผิดพลาดมากขึ้นเมื่อการเคลื่อนไหวที่มีอยู่มีความซับซ้อนมากขึ้น รูปแบบการเลือกเหล่านี้ไม่สอดคล้องกับผู้เล่นที่ประเมินการเคลื่อนไหวที่เป็นไปได้ทั้งหมดและเลือกรูปแบบที่พวกเขาเห็นว่าดีที่สุด แต่สอดคล้องกับความพึงพอใจ

ทักษะชดเชยค่าใช้จ่ายของความซับซ้อน ประมาณ 1.5 เปอร์เซ็นต์ของรอบหมากรุกในชุดข้อมูลที่วิเคราะห์นั้นเล่นโดยผู้เล่นที่มีชื่อเช่นปรมาจารย์ระดับชาติและปรมาจารย์ ผู้เล่นเหล่านี้ทำผิดพลาดน้อยกว่าคนอื่น ๆ แต่เมื่อทุกการเคลื่อนไหวที่ชนะที่มีอยู่นั้นซับซ้อนเพียงพอ เกมหมากรุกบน Lichess อยู่ภายใต้การควบคุมเวลาที่แตกต่างกัน และเวลาในการตัดสินใจที่มากขึ้นจะช่วยชดเชยค่าใช้จ่ายของความซับซ้อนสำหรับคุณภาพการเลือก โดยผู้เล่นที่ดีกว่าจะได้ประโยชน์มากกว่า

สุดท้ายนี้ นักวิจัยได้พิจารณาว่าความซับซ้อนของชุดตัวเลือกที่มีอยู่โดยรวมส่งผลต่อการตัดสินใจอย่างไร พวกเขาพบว่าองค์ประกอบของชุดตัวเลือก ไม่ได้ส่งผลต่อคุณภาพของชุดตัวเลือก ข้อผิดพลาดเกิดขึ้นได้น้อยกว่าเมื่อท่าชนะถูกเพิ่มเข้าไปในชุดของท่าเคลื่อนไหวที่มีอยู่ ในขณะที่มันกลายเป็นเรื่องปกติมากขึ้นด้วยการเสมอหรือแพ้เพิ่มเติม ถือครองส่วนแบ่งของการเคลื่อนไหวแต่ละประเภทคงที่ไม่มีหลักฐานว่าผู้เล่นทำผิดพลาดมากขึ้นเมื่อชุดตัวเลือกเติบโตขึ้น

— ลูซี่ อี. เพจ

[ad_2]

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *