Hacker News

ตรงกันข้าม "หมากรุกระดับปรมาจารย์โดยไม่ต้องค้นหา" (2024)

ตรงกันข้าม "หมากรุกระดับปรมาจารย์โดยไม่ต้องค้นหา" (2024) การวิเคราะห์ Contra ที่ครอบคลุมนี้นำเสนอการตรวจสอบโดยละเอียดของ c — Mewayz Business OS

1 นาทีอ่าน

Mewayz Team

Editorial Team

Hacker News

ตรงกันข้าม "หมากรุกระดับปรมาจารย์โดยไม่ต้องค้นหา" (2024): เหตุใดการจดจำรูปแบบเพียงอย่างเดียวจึงสั้น

บทความของ Google DeepMind ในปี 2024 ที่อ้างว่าหมากรุกระดับปรมาจารย์โดยไม่มีอัลกอริธึมการค้นหาแบบดั้งเดิม จุดประกายความสงสัยในชุมชนการวิจัย AI ที่เกิดขึ้นในทันทีและเป็นที่ยอมรับ ข้อโต้แย้งที่ตรงกันข้ามเผยให้เห็นข้อจำกัดพื้นฐานในการทดแทนการจดจำรูปแบบดิบสำหรับการวิเคราะห์อย่างเป็นระบบ - บทเรียนที่ขยายขอบเขตไปไกลกว่าหมากรุกไปสู่ระบบอัตโนมัติทางธุรกิจ กรอบการตัดสินใจ และวิธีที่แพลตฟอร์มอย่าง Mewayz สถาปนิกเวิร์กโฟลว์อัจฉริยะสำหรับผู้ใช้มากกว่า 138,000 ราย

เอกสารต้นฉบับอ้างสิทธิ์อะไรจริงๆ?

การวิจัยดั้งเดิมซึ่งนำโดย Aram Ebrahimi และเพื่อนร่วมงานที่ Google DeepMind เสนอว่าโมเดลหม้อแปลงขนาดใหญ่เพียงพอที่ได้รับการฝึกฝนเกี่ยวกับตำแหน่งหมากรุก และการประเมินของพวกเขาสามารถเล่นในระดับปรมาจารย์ระดับสูงโดยไม่ต้องใช้อัลกอริธึมการค้นหาที่ชัดเจน เช่น minimax หรือการค้นหาแบบต้นไม้มอนติคาร์โล ซึ่งแตกต่างจากเครื่องยนต์เช่น Stockfish หรือ AlphaZero ซึ่งสำรวจตำแหน่งในอนาคตหลายพันล้านตำแหน่งก่อนที่จะเลือกการเคลื่อนไหว วิธีการนี้อาศัยโครงข่ายประสาทเทียมที่ทำการคาดการณ์แบบ single-pass โดยพื้นฐานแล้ว "เข้าใจ" การเคลื่อนไหวที่ดีที่สุดจากการจดจำรูปแบบเพียงอย่างเดียว

คำกล่าวอ้างมีความชัดเจน: หากแบบจำลองสามารถดูดซับความเข้าใจตำแหน่งจากข้อมูลการฝึกอบรมได้เพียงพอ การคำนวณแบบ brute-force อาจไม่จำเป็น ผลลัพธ์การวัดประสิทธิภาพเบื้องต้นดูมีแนวโน้มดี โดยโมเดลได้รับการจัดอันดับ Elo ในช่วงระดับปรมาจารย์ภายใต้เงื่อนไขการทดสอบเฉพาะ

เหตุใดการค้นหาข้อโต้แย้งของนักวิจารณ์จึงไม่เคยถูกกำจัดอย่างแท้จริง?

อาร์กิวเมนต์ตรงกันข้ามที่น่าสนใจที่สุดมุ่งเป้าไปที่หลักฐานกลางของบทความนี้ หม้อแปลงไฟฟ้าได้รับการฝึกฝนในตำแหน่งนับล้านที่ประเมินโดย Stockfish ซึ่งเป็นกลไกที่ต้องอาศัยการค้นหาเชิงลึกเป็นอย่างมาก นักวิจารณ์ยืนยันว่าแบบจำลองนี้ไม่ได้กำจัดการค้นหา มันกลั่นมัน การค้นหาถูกโหลดไว้ล่วงหน้าในข้อมูลการฝึกอบรม แทนที่จะดำเนินการในเวลาอนุมาน

"การอ้างว่าโมเดลเล่นหมากรุก 'โดยไม่ต้องค้นหา' ในขณะที่ฝึกโมเดลโดยใช้ผลลัพธ์ของเครื่องมือค้นหาก็เหมือนกับการอ้างว่าคุณไขเขาวงกตโดยไม่มีแผนที่ - หลังจากจดจำวิธีแก้ปัญหาที่คนอื่นพบโดยใช้แผนที่"

ความแตกต่างนี้มีความสำคัญอย่างมาก โมเดลเรียนรู้การแสดงผลการค้นหาแบบบีบอัด ไม่ใช่ความเข้าใจตำแหน่งที่เป็นอิสระ ลบสัญญาณการฝึกที่ได้รับจากการค้นหา และประสิทธิภาพก็ลดลง สิ่งนี้มีความคล้ายคลึงกันโดยตรงในระบบธุรกิจอัจฉริยะ: เครื่องมือการตัดสินใจที่ขับเคลื่อนด้วย AI จะดีพอ ๆ กับการวิเคราะห์อย่างเป็นระบบที่ฝังอยู่ในขั้นตอนการฝึกอบรม

💡 คุณรู้หรือไม่?

Mewayz ทดแทนเครื่องมือธุรกิจ 8+ รายการในแพลตฟอร์มเดียว

CRM · การออกใบแจ้งหนี้ · HR · โปรเจกต์ · การจอง · อีคอมเมิร์ซ · POS · การวิเคราะห์ แผนฟรีใช้ได้ตลอดไป

เริ่มฟรี →

การจดจำรูปแบบที่บริสุทธิ์นั้นพังทลายลงในทางปฏิบัติที่ไหน?

การทดสอบเชิงประจักษ์โดยนักวิจัยอิสระเผยให้เห็นโหมดความล้มเหลวที่สำคัญซึ่งเกณฑ์มาตรฐานเดิมไม่ชัดเจน:

ตำแหน่งทางยุทธวิธีเชิงลึก: โมเดลพลาดการผสมผสานที่ต้องใช้การคำนวณมากกว่า 4-5 การเคลื่อนไหวอย่างต่อเนื่อง โดยที่เครื่องยนต์แบบเดิมมีความเป็นเลิศผ่านแผนผังการค้นหาที่ชัดเจน

สถานการณ์ตอนจบเกมแบบใหม่: ตำแหน่งที่อยู่นอกการกระจายการฝึกเผยให้เห็นความสามารถของโมเดลในการให้เหตุผลจากหลักการแรกๆ ซึ่งนำไปสู่ข้อผิดพลาดเบื้องต้นที่ไม่มีปรมาจารย์ที่เป็นมนุษย์คนใดจะทำได้

ความแข็งแกร่งของฝ่ายตรงข้าม: เมื่อฝ่ายตรงข้ามจงใจนำเกมไปยังตำแหน่งที่ผิดปกติ Elo ของแบบจำลองลดลงอย่างมาก เป็นการแนะนำการท่องจำมากกว่าความเข้าใจที่แท้จริง

ความสม่ำเสมอภายใต้แรงกดดัน: แม้ว่าประสิทธิภาพโดยเฉลี่ยจะดูเหมือนเป็นระดับปรมาจารย์ ความแปรปรวนนั้นสูงกว่าปรมาจารย์ที่เป็นมนุษย์หรือโปรแกรมค้นหามาก โดยมีข้อผิดพลาดร้ายแรงเกิดขึ้นในอัตราที่ไม่เข้ากันกับการเล่นปรมาจารย์ที่แท้จริง

การปรับขนาดความซับซ้อนของตำแหน่ง: เมื่อความซับซ้อนของบอร์ดเพิ่มขึ้น ช่องว่างระหว่างโมเดลที่ไม่ต้องใช้การค้นหาและเอ็นจิ้นที่ใช้การค้นหาก็กว้างขึ้นแบบทวีคูณแทนที่จะเป็นเชิงเส้น

การอภิปรายนี้มีความหมายต่อระบบธุรกิจที่ขับเคลื่อนด้วย AI อย่างไร

ข้อโต้แย้งเรื่องหมากรุกโดยไม่ต้องค้นหาเผยให้เห็นความตึงเครียดที่เป็นหัวใจสำคัญของการใช้งาน AI สมัยใหม่ การจดจำรูปแบบและการวิเคราะห์อย่างเป็นระบบไม่สามารถใช้แทนกันได้ - เป็นสิ่งเสริมกัน ระบบที่มีประสิทธิภาพสูงสุดผสมผสานการตอบสนองที่รวดเร็วตามสัญชาตญาณเข้ากับเหตุผลที่มีโครงสร้าง

All Your Business Tools in One Place

Stop juggling multiple apps. Mewayz combines 207 tools for just $19/month — from inventory to HR, booking to analytics. No credit card required to start.

Try Mewayz Free →

ลองใช้ Mewayz ฟรี

แพลตฟอร์มแบบออล-อิน-วันสำหรับ CRM, การออกใบแจ้งหนี้, โครงการ, HR และอื่นๆ ไม่ต้องใช้บัตรเครดิต

เริ่มจัดการธุรกิจของคุณอย่างชาญฉลาดวันนี้

เข้าร่วมธุรกิจ 30,000+ ราย แผนฟรีตลอดไป · ไม่ต้องใช้บัตรเครดิต

พบว่าสิ่งนี้มีประโยชน์หรือไม่? แบ่งปันมัน

พร้อมนำไปปฏิบัติแล้วหรือยัง?

เข้าร่วมธุรกิจ 30,000+ รายที่ใช้ Mewayz แผนฟรีตลอดไป — ไม่ต้องใช้บัตรเครดิต

เริ่มต้นทดลองใช้ฟรี →

พร้อมที่จะลงมือทำหรือยัง?

เริ่มต้นทดลองใช้ Mewayz ฟรีวันนี้

แพลตฟอร์มธุรกิจแบบครบวงจร ไม่ต้องใช้บัตรเครดิต

เริ่มฟรี →

ทดลองใช้ฟรี 14 วัน · ไม่ต้องใช้บัตรเครดิต · ยกเลิกได้ทุกเมื่อ