วิธีสังเกตการโกงที่อาจเกิดขึ้น


เมื่อไม่กี่ปีที่ผ่านมา เว็บไซต์หมากรุก Chess.com ได้สั่งห้ามนาย Hans Niemann ปรมาจารย์ของสหรัฐฯ ชั่วคราว เนื่องจากเล่นหมากรุกออนไลน์ โดยที่เว็บไซต์ต้องสงสัยว่าถูกแนะนำโดยโปรแกรมคอมพิวเตอร์ มีรายงานว่าก่อนหน้านี้ได้สั่งห้าม Maxim Dlugy ที่ปรึกษาของเขา
และที่ Sinquefield Cup เมื่อต้นเดือนนี้ แชมป์โลก Magnus Carlsen ได้ลาออกโดยไม่มีความคิดเห็นหลังจากเล่นเกมที่แย่กับ Niemann วัย 19 ปี เขาได้กล่าวว่านี่เป็นเพราะเขาเชื่อว่า Niemann ยังคงโกงต่อไปเมื่อเร็ว ๆ นี้
ผู้เข้าร่วมอีกคนคือ Ian Nepomniachtchi ปรมาจารย์ชาวรัสเซีย เรียกว่า ผลงานของ Niemann “น่าประทับใจมากกว่า” ในขณะที่ Nieman ยอมรับว่าบางครั้งโกงในเกมออนไลน์ก่อนหน้านี้ เขาปฏิเสธอย่างแข็งขันว่าไม่เคยโกงในการแข่งขันหมากรุกสด

แต่ Chess.com ซึ่งเป็นเว็บไซต์หมากรุกที่ใหญ่ที่สุดในโลก ตัดสินได้อย่างไรว่าผู้เล่นอาจโกง? มันไม่สามารถแสดงให้โลกเห็นรหัสที่ใช้ ไม่เช่นนั้นพวกขี้โกงจะรู้วิธีหลีกเลี่ยงการตรวจจับอย่างแน่นอน เว็บไซต์ระบุว่า:
แม้ว่าการพิจารณาทางกฎหมายและในทางปฏิบัติจะป้องกันไม่ให้ Chess.com เปิดเผยชุดข้อมูล ตัวชี้วัด และการติดตามทั้งหมดที่ใช้ในการประเมินเกมในเครื่องมือการเล่นที่ยุติธรรมของเรา เราสามารถพูดได้ว่าหัวใจหลักของระบบ Chess.com คือแบบจำลองทางสถิติที่ประเมิน ความน่าจะเป็นที่ผู้เล่นที่เป็นมนุษย์จะจับคู่ตัวเลือกอันดับต้นๆ ของเอ็นจิ้น และแซงหน้าผู้เล่นหมากรุกที่ยิ่งใหญ่ที่สุดในประวัติศาสตร์ที่ได้รับการยืนยันแล้ว
โชคดีที่การวิจัยสามารถให้ความกระจ่างว่าเว็บไซต์อาจใช้แนวทางใด
มนุษย์กับ AI
เมื่อบริษัท AI DeepMind พัฒนาโปรแกรม AlphaGo ซึ่งสามารถเล่นเกมกลยุทธ์ Go ได้ ได้รับการสอนให้คาดการณ์ว่าการเคลื่อนไหวใดที่มนุษย์จะทำจากตำแหน่งที่กำหนด
การทำนายการเคลื่อนไหวของมนุษย์เป็นปัญหาการเรียนรู้ภายใต้การดูแล ซึ่งเป็นส่วนสำคัญของการเรียนรู้ของเครื่อง จากตัวอย่างตำแหน่งต่างๆ จากเกมของมนุษย์ (ชุดข้อมูล) และตัวอย่างการเคลื่อนไหวของมนุษย์จากแต่ละตำแหน่งดังกล่าว (ป้ายกำกับ) อัลกอริทึมการเรียนรู้ของเครื่องสามารถฝึกให้คาดการณ์ป้ายกำกับที่จุดข้อมูลใหม่ได้ ดังนั้น DeepMind ได้สอน AI ให้ประเมินความน่าจะเป็นที่มนุษย์จะย้ายจากตำแหน่งที่กำหนด
AlphaGo เอาชนะคู่แข่งอย่าง Lee Sedol ได้อย่างโด่งดังในปี 2017 หนึ่งในการเคลื่อนไหวที่โด่งดังของ AI ในเกมคือ “Move 37” ตามที่หัวหน้านักวิจัย David Silver ระบุไว้ในสารคดี AlphaGo “AlphaGo กล่าวว่ามีความเป็นไปได้ 1/10,000 ที่ผู้เล่นที่เป็นมนุษย์จะเล่น Move 37”

ดังนั้นตามแบบจำลองการเรียนรู้ของเครื่องของผู้เล่น Go ของมนุษย์ ถ้าคุณเห็นคนเล่น Move 37 มันจะเป็นหลักฐานว่าพวกเขาไม่ได้คิดขึ้นมาเอง แต่แน่นอนว่ามันจะไม่เป็นข้อพิสูจน์ มนุษย์คนใด สามารถ ทำให้การเคลื่อนไหวนั้น
เพื่อให้มั่นใจมากว่ามีคนโกงเกม คุณต้องดูการเคลื่อนไหวมากมาย ตัวอย่างเช่น นักวิจัยได้ตรวจสอบจำนวนการเคลื่อนไหวจากผู้เล่นที่สามารถวิเคราะห์ร่วมกันเพื่อตรวจจับความผิดปกติได้
Chess.com ใช้การเรียนรู้ของเครื่องอย่างเปิดเผยเพื่อคาดการณ์ว่าการเคลื่อนไหวใดที่มนุษย์สามารถทำได้ในตำแหน่งที่กำหนด อันที่จริงแล้ว มันมีโมเดลผู้เล่นหมากรุกชื่อดังที่แตกต่างกันหลายแบบ และคุณสามารถเล่นกับพวกเขาได้จริงๆ สันนิษฐานว่ามีการใช้แบบจำลองที่คล้ายกันเพื่อตรวจจับการโกง
การศึกษาเมื่อเร็ว ๆ นี้ชี้ให้เห็นว่านอกเหนือจากการทำนายแนวโน้มที่มนุษย์จะทำการเคลื่อนไหวบางอย่างแล้วยังเป็นสิ่งสำคัญที่จะต้องพิจารณาว่าการเคลื่อนไหวนั้นดีเพียงใด สิ่งนี้ตรงกับคำแถลงของ Chess.com ที่ประเมินว่าการเคลื่อนไหว “เกิน … ยืนยันการเล่นที่สะอาด” จากผู้ยิ่งใหญ่หรือไม่
แต่คุณจะวัดได้อย่างไรว่าการเคลื่อนไหวไหนดีกว่าท่าอื่น? ในทางทฤษฎี ตำแหน่งหมากรุกคือ “ชนะ” (คุณสามารถรับประกันได้ว่าชนะ), “แพ้” (ผู้เล่นคนอื่นทำได้) หรือ “เสมอ” (ไม่สามารถทำได้) และการเคลื่อนไหวที่ดีจะเป็นการเคลื่อนไหวที่ไม่ได้ผล ตำแหน่งของคุณแย่ลง แต่ในความเป็นจริง แม้ว่าคอมพิวเตอร์จะคำนวณและเลือกการเคลื่อนไหวในอนาคตได้ดีกว่ามนุษย์มาก แต่สำหรับหลาย ๆ ตำแหน่งแล้ว พวกเขาก็ไม่สามารถบอกได้อย่างแน่นอนว่าตำแหน่งนั้นชนะ แพ้ หรือเสมอกัน และแน่นอนว่าพวกเขาไม่สามารถพิสูจน์ได้ – โดยทั่วไปการพิสูจน์จะต้องมีการคำนวณมากเกินไป ตรวจสอบทุกส่วนของแผนผังเกมแบบเอ็กซ์โพเนนเชียล
ดังนั้น สิ่งที่ผู้คนและคอมพิวเตอร์ทำคือใช้ “heuristics” (การเดาแบบกล้าแสดงออก) เพื่อประเมิน “คุณค่า” ของตำแหน่งต่างๆ – ประมาณการว่าผู้เล่นคนใดที่พวกเขาคิดว่าจะชนะ นอกจากนี้ยังสามารถใช้เป็นปัญหาการเรียนรู้ของเครื่องโดยที่ชุดข้อมูลมีตำแหน่งกระดานจำนวนมากและป้ายกำกับคือผู้ชนะ ซึ่งจะฝึกอัลกอริทึมเพื่อทำนายว่าใครจะเป็นผู้ชนะจากตำแหน่งที่กำหนด
โดยทั่วไปแล้ว โมเดลการเรียนรู้ของเครื่องที่ใช้เพื่อจุดประสงค์นี้จะคิดเกี่ยวกับการเคลื่อนไหวที่เป็นไปได้อีกสองสามอย่างถัดไป พิจารณาว่าตำแหน่งใดที่ผู้เล่นทั้งสองสามารถเข้าถึงได้ และจากนั้นใช้ “ความรู้สึกนึกคิด” เกี่ยวกับตำแหน่งในอนาคตเหล่านั้นเพื่อแจ้งการประเมินตำแหน่งปัจจุบันของพวกเขา

แต่ใครจะชนะจากตำแหน่งที่กำหนดขึ้นอยู่กับว่าผู้เล่นเก่งแค่ไหน ดังนั้นการประเมินโมเดลของเกมใดเกมหนึ่งจะขึ้นอยู่กับว่าใครกำลังเล่นเกมที่กำหนดให้เป็นชุดข้อมูลการฝึก โดยทั่วไปแล้ว เมื่อนักวิจารณ์หมากรุกพูดถึง “มูลค่าเป้าหมาย” ของตำแหน่งต่างๆ พวกเขาหมายถึงใครที่น่าจะชนะจากตำแหน่งที่กำหนดเมื่อทั้งสองฝ่ายกำลังเล่นโดย AI หมากรุกที่ดีที่สุดที่มีอยู่ แต่การวัดมูลค่านี้ไม่ได้มีประโยชน์เสมอไปเมื่อพิจารณาถึงตำแหน่งที่ผู้เล่นที่เป็นมนุษย์จะต้องดำเนินการในท้ายที่สุด ดังนั้นจึงไม่ชัดเจนว่า Chess.com (หรือเรา) ควรพิจารณาอะไรเป็น “การเคลื่อนไหวที่ดี”
ถ้าฉันโกงหมากรุกและทำตามคำแนะนำของกลไกหมากรุก มันอาจไม่ช่วยให้ฉันชนะด้วยซ้ำ การเคลื่อนไหวเหล่านั้นอาจเป็นการโจมตีที่ยอดเยี่ยมที่ไม่เคยเกิดขึ้นกับฉัน ดังนั้นฉันจะทำลายมันเว้นแต่ฉันจะขอให้กลไกหมากรุกเล่นเกมที่เหลือให้ฉัน (Lichess.org บอกฉันว่าฉันเล่นเกมบลิทซ์มาแล้ว 3,049 เกมในขณะที่เขียน และคะแนน ELO ที่ไม่ค่อยดีที่ 1632 ของฉันหมายความว่าคุณสามารถคาดหวังให้ฉันพลาดกลวิธีดีๆ ด้านซ้ายและขวา)
การตรวจจับการโกงเป็นเรื่องยาก หากคุณกำลังเล่นออนไลน์และสงสัยว่าคู่ต่อสู้ของคุณโกงหรือไม่ คุณจะไม่สามารถบอกได้อย่างมั่นใจจริงๆ เพราะคุณไม่เคยเห็นเกมของมนุษย์หลายล้านเกมที่เล่นด้วยสไตล์ที่แตกต่างอย่างสิ้นเชิง เป็นปัญหาที่โมเดลแมชชีนเลิร์นนิงที่ได้รับการฝึกฝนด้วยข้อมูลจำนวนมากมีข้อได้เปรียบอย่างมาก ในที่สุด พวกเขาอาจมีความสำคัญต่อความสมบูรณ์ของหมากรุกอย่างต่อเนื่อง
Michael K. Cohen ผู้สมัครระดับปริญญาเอกสาขาวิศวกรรมศาสตร์ มหาวิทยาลัยอ๊อกซฟอร์ด
บทความนี้เผยแพร่ซ้ำจาก The Conversation ภายใต้สัญญาอนุญาตครีเอทีฟคอมมอนส์ อ่านบทความต้นฉบับ