ลืมหมากรุกไปได้เลย DeepMind ฝึก AI ใหม่ในการเล่นฟุตบอล

ทริสตัน กรีน* กล่าวว่านี่เป็นส่วนหนึ่งของการฝึก AI เพื่อควบคุมหุ่นยนต์ในโลกแห่งความเป็นจริง
นักวิจัยจาก DeepMindห้องทดลอง AI ชั้นนำของสหราชอาณาจักรได้ละทิ้งเกมหมากรุกอันสูงส่งและไปเพื่อความสุขที่มากขึ้น: ฟุตบอล
เมื่อวานนี้ บริษัทในเครือของ Google ได้เผยแพร่รายงานการวิจัยและโพสต์ในบล็อกที่มีรายละเอียดเกี่ยวกับความน่าจะเป็นของระบบประสาท (NPMP) ซึ่งเป็นวิธีการที่ตัวแทนปัญญาประดิษฐ์สามารถเรียนรู้การใช้งานร่างกายได้
ตามโพสต์บล็อก:
NPMP คือโมดูลควบคุมมอเตอร์เอนกประสงค์ที่แปลงความตั้งใจของมอเตอร์ในขอบเขตสั้นเป็นสัญญาณควบคุมระดับต่ำ และได้รับการฝึกแบบออฟไลน์หรือผ่าน RL โดยเลียนแบบข้อมูลการจับการเคลื่อนไหว (MoCap) ที่บันทึกด้วยเครื่องติดตามของมนุษย์หรือสัตว์ที่ทำการเคลื่อนไหว น่าสนใจ.
ขึ้นหน้า
โดยพื้นฐานแล้ว ทีม DeepMind ได้สร้างระบบ AI ที่สามารถเรียนรู้วิธีการทำสิ่งต่างๆ ภายในเครื่องจำลองฟิสิกส์ได้โดยการดูวิดีโอของเจ้าหน้าที่คนอื่นๆ ที่ทำงานเหล่านั้น
และแน่นอน ถ้าคุณมีเครื่องยนต์ฟิสิกส์ขนาดยักษ์และหุ่นยนต์อยากรู้อยากเห็นจำนวนไม่รู้จบ สิ่งเดียวที่ต้องทำคือสอนวิธีเลี้ยงลูกและยิง:
ตามรายงานการวิจัยของทีม:
เราปรับทีมตัวแทนให้เล่นฟุตบอลจำลองผ่านการเรียนรู้การเสริมกำลัง โดยจำกัดพื้นที่ของโซลูชันให้เท่ากับการเคลื่อนไหวที่เป็นไปได้ซึ่งเรียนรู้โดยใช้ข้อมูลการจับการเคลื่อนไหวของมนุษย์
ความเป็นมา: เพื่อที่จะฝึก AI ให้ทำงานและควบคุมหุ่นยนต์ในโลก นักวิจัยต้องเตรียมเครื่องจักรให้พร้อมสำหรับความเป็นจริง
และนอกการจำลองสถานการณ์ อะไรก็เกิดขึ้นได้
เจ้าหน้าที่ต้องรับมือกับแรงโน้มถ่วง พื้นผิวที่ลื่นโดยไม่คาดคิด และการรบกวนโดยไม่ได้ตั้งใจจากสารอื่นๆ
จุดประสงค์ของการฝึกไม่ใช่เพื่อสร้างนักฟุตบอลที่ดีขึ้น — Cristiano Ronaldo ไม่มีอะไรต้องกลัวสำหรับหุ่นยนต์ในตอนนี้ — แต่แทนที่จะช่วยให้ AI และนักพัฒนาหาวิธีเพิ่มประสิทธิภาพความสามารถของตัวแทนในการทำนายผลลัพธ์
เมื่อ AI เริ่มการฝึก มันแทบจะไม่สามารถเคลื่อนย้ายอวาตาร์ฮิวแมนนอยด์ตามฟิสิกส์ไปรอบสนามได้
แต่ด้วยการให้รางวัลแก่ตัวแทนทุกครั้งที่ทีมทำประตูได้ โมเดลดังกล่าวสามารถดึงตัวเลขและดำเนินการได้ภายในเวลาประมาณ 50 ชั่วโมง
หลังจากฝึกฝนมาหลายวัน AI จะเริ่มทำนายว่าลูกบอลจะไปทางไหนและตัวแทนคนอื่นๆ จะตอบสนองต่อการเคลื่อนไหวของลูกบอลอย่างไร
ตามกระดาษ:
ผลที่ได้คือทีมผู้เล่นฟุตบอลฮิวแมนนอยด์ที่ประสานงานกันซึ่งแสดงพฤติกรรมที่ซับซ้อนในระดับต่างๆ คำนวณโดยการวิเคราะห์และสถิติต่างๆ รวมถึงที่ใช้ในการวิเคราะห์กีฬาในโลกแห่งความเป็นจริง
งานของเราเป็นการสาธิตที่สมบูรณ์ของการตัดสินใจแบบบูรณาการที่เรียนรู้ในหลายระดับในสภาพแวดล้อมแบบหลายตัวแทน
ด่วน
งานนี้เริดมาก
แต่เราไม่แน่ใจนักว่ามันแสดงถึง “การสาธิตที่สมบูรณ์” ของสิ่งใดสิ่งหนึ่ง
เห็นได้ชัดว่าโมเดลนี้สามารถใช้ตัวแทนที่เป็นตัวเป็นตนได้
แต่บนพื้นฐานของ เห็นได้ชัดว่าเลือกเชอร์รี่ GIF ในบล็อกโพสต์ งานนี้ยังคงอยู่ในขั้นตอนการจำลองอย่างลึกซึ้ง
สิ่งสำคัญที่สุดคือ AI ไม่ได้ “เรียนรู้” วิธีเล่นฟุตบอล
เป็นการเคลื่อนไหวที่ดุดันภายในขอบเขตของการจำลอง
นั่นอาจดูเหมือนเป็นเรื่องเล็กน้อย แต่ผลลัพธ์ค่อนข้างชัดเจน:
ตัวแทน AI ข้างต้นดูน่ากลัวอย่างยิ่ง
ฉันไม่รู้ว่ามันวิ่งหนีอะไร แต่ฉันแน่ใจว่ามันเป็นสิ่งที่น่ากลัวที่สุดเท่าที่เคยมีมา
มันเคลื่อนไหวเหมือนมนุษย์ต่างดาวที่สวมชุดมนุษย์เป็นครั้งแรกเพราะว่า AI ไม่สามารถเรียนรู้ได้จากการดูไม่เหมือนมนุษย์
ระบบเช่น DeepMind ที่ฝึกฝนการแยกวิเคราะห์วิดีโอหลายพันชั่วโมงและโดยพื้นฐานแล้วจะแยกข้อมูลการเคลื่อนไหวเกี่ยวกับเรื่องที่พวกเขาพยายาม “เรียนรู้”
อย่างไรก็ตาม แทบจะแน่นอนว่าโมเดลเหล่านี้จะแข็งแกร่งขึ้นเมื่อเวลาผ่านไป
เราได้เห็นแล้วว่า Boston Dynamics สามารถทำอะไรกับอัลกอริธึมการเรียนรู้ของเครื่องและการออกแบบท่าเต้นที่ตั้งโปรแกรมไว้ล่วงหน้า
เป็นเรื่องที่น่าสนใจที่จะเห็นว่าโมเดลที่ปรับเปลี่ยนได้ เช่น รุ่นที่พัฒนาโดย DeepMind จะได้ผลหรือไม่ เมื่อพวกเขาก้าวข้ามสภาพแวดล้อมในห้องปฏิบัติการและไปสู่การใช้งานหุ่นยนต์จริง
*ทริสตัน กรีน ครอบคลุมความก้าวหน้าของปัญญาประดิษฐ์ที่เน้นมนุษย์เป็นศูนย์กลาง การเมือง เรื่องแปลก กัญชา และการเล่นเกมสำหรับ The Next Web
บทความนี้ปรากฏตัวครั้งแรกที่ thenextweb.com