คุณลักษณะของมนุษย์ในการเรียนรู้หมากรุกเครือข่ายประสาท: ศึกษา


ตีพิมพ์ในวารสาร ‘Proceedings of the National Academy of Sciences (PNAS) เมื่อวันที่ 14 พฤศจิกายน ผลการศึกษาเผยให้เห็นว่า AlphaZero เอ็นจินเครือข่ายประสาทเทียมเรียนรู้หมากรุกด้วยการเล่นกับตัวเอง และชนะเกมกับผู้เล่นหมากรุกชั้นนำที่เป็นมนุษย์ได้อย่างน่าเชื่อถือ ทีมนักวิจัยกล่าวว่าความสามารถในการแปลความหมายโครงข่ายประสาทเทียมเป็นพื้นที่การวิจัยที่ครอบคลุมแนวทางและความท้าทายที่หลากหลาย ความสนใจของเราในการเปิดใช้งานเครือข่ายที่เกี่ยวข้องกับแนวคิดของมนุษย์หมายความว่าเรามุ่งเน้นที่คำอธิบายตามแนวคิดเป็นหลัก

วิธีการตามแนวคิดใช้แนวคิดที่มนุษย์เข้าใจได้เพื่ออธิบายการตัดสินใจของโครงข่ายประสาทแทนการใช้คุณสมบัติอินพุต (เช่น พิกเซล) ดังที่เห็นในการอ้างอิง คำอธิบายตามแนวคิดได้ถูกนำมาใช้อย่างประสบความสำเร็จในโดเมนทางวิทยาศาสตร์และการแพทย์ที่ซับซ้อน 20-27 และในการทำงานพร้อมกันกับตัวแทนที่ได้รับการฝึกฝนให้เล่นเกมกระดาน Hex รวมถึงในการศึกษาตัวแทน Go-playing โดยใช้แนวคิดที่ได้มาจากคำอธิบายประกอบภาษาธรรมชาติ คล้ายกับวิธีการป้อนข้อมูลตามคุณลักษณะต่างๆ วิธีการแนวคิดยังแสดงถึงความสัมพันธ์เท่านั้นและไม่ใช่สาเหตุ แม้ว่าจะมีวิธีการตามแนวคิดเชิงสาเหตุ แต่งานนี้เน้นที่การวิเคราะห์โดยไม่สันนิษฐานว่ากราฟเชิงสาเหตุอาจแสดงถึงกลไกภายในอย่างไม่ถูกต้อง ขั้นตอนสำคัญสำหรับวิธีการเหล่านี้คือการดำเนินการตามแนวคิดที่มนุษย์เข้าใจได้ วิธีการหนึ่งที่ใช้กันทั่วไป เช่น การกำหนดแนวคิดด้วยชุดของแบบอย่าง อย่างไรก็ตาม ในกรณีของหมากรุก เราไม่จำเป็นต้องเริ่มใหม่ตั้งแต่ต้น แนวคิดมาตรฐานหลายอย่าง (เช่น ความปลอดภัยของกษัตริย์หรือความได้เปรียบทางวัตถุ) ได้แสดงออกแล้วในฟังก์ชันที่เรียบง่ายและง่ายต่อการคำนวณภายในกลไกหมากรุกสมัยใหม่

จากการวิเคราะห์พบว่า แม้ว่า AlphaZero จะไม่เคยสังเกตเกมหมากรุกของมนุษย์ แต่คุณลักษณะหลายอย่างของผู้เล่นหมากรุกที่เป็นมนุษย์นั้นสามารถแยกแยะได้จากการฝึกฝนของ AlphaZero การวิเคราะห์กลยุทธ์การเปิดโครงข่ายประสาทเทียมพบว่า AlphaZero จำกัดความเป็นไปได้ให้แคบลงอย่างรวดเร็วจากช่วงเริ่มต้นของการเคลื่อนไหวที่เป็นไปได้ ตามที่ผู้เขียน การค้นพบนี้ชี้ให้เห็นว่า AlphaZero มีความสามารถในการเรียนรู้ทักษะที่ค่อนข้างรวดเร็วในช่วงระยะเวลาการฝึกอบรมที่ยาวนาน

(เรื่องราวนี้ไม่ได้รับการแก้ไขโดยเจ้าหน้าที่ Devdiscourse และสร้างขึ้นโดยอัตโนมัติจากฟีดที่รวบรวมไว้)



Source link

About Author