Hacker News

แอนโทรปิกพยายามซ่อนการกระทำของ AI ของคลอดด์ เดฟเกลียดมัน

แอนโทรปิกพยายามซ่อนการกระทำของ AI ของคลอดด์ เดฟเกลียดมัน การสำรวจครั้งนี้เจาะลึกถึงมานุษยวิทยา โดยพิจารณาถึงความสำคัญของมันและ — Mewayz Business OS

1 นาทีอ่าน

Mewayz Team

Editorial Team

Hacker News

นี่คือโพสต์บล็อก SEO ที่สมบูรณ์:

Anthropic พยายามซ่อนการกระทำของ AI ของ Claude Devs เกลียดมัน

เมื่อเร็วๆ นี้ Anthropic ได้เปิดตัวการเปลี่ยนแปลงที่ปิดบังวิธีที่ Claude ซึ่งเป็นโมเดล AI หลักของบริษัท ดำเนินการเบื้องหลังระหว่างการสนทนาและการใช้เครื่องมือ นักพัฒนาทั่วทั้งชุมชนเทคโนโลยีกำลังตอบโต้อย่างหนัก โดยโต้แย้งว่าการซ่อนพฤติกรรมของ AI จะบ่อนทำลายความไว้วางใจ ความโปร่งใส และความสามารถในการแก้ไขข้อบกพร่องที่พวกเขาต้องการเพื่อสร้างผลิตภัณฑ์ที่เชื่อถือได้

ข้อโต้แย้งดังกล่าวเน้นย้ำถึงความตึงเครียดที่เพิ่มขึ้นในอุตสาหกรรม AI เมื่อโมเดลมีความสามารถและเป็นอิสระมากขึ้น ใครจะได้เห็นว่า AI กำลังทำอะไรอยู่ และเหตุใดการมองเห็นนั้นจึงมีความสำคัญต่อผู้คนที่อยู่เหนือสิ่งเหล่านั้น

อะไรคือสิ่งที่มนุษย์ซ่อนตัวจากนักพัฒนากันแน่?

หัวใจสำคัญของฟันเฟืองนี้คือการตัดสินใจของ Anthropic ที่จะลดการมองเห็นการให้เหตุผลแบบห่วงโซ่ความคิดภายในและการดำเนินการเรียกใช้เครื่องมือของ Claude เมื่อนักพัฒนารวม Claude เข้ากับแอปพลิเคชันของตนผ่านทาง API พวกเขาอาศัยบันทึกโดยละเอียดว่าโมเดลทำอะไร เครื่องมือใดบ้างที่โมเดลเรียกใช้ ขั้นตอนขั้นกลางที่ใช้ และวิธีที่โมเดลมาถึงผลลัพธ์สุดท้าย

การอัปเดตล่าสุดทำให้บางส่วนของกระบวนการนี้ไม่ชัดเจน นักพัฒนารายงานว่าขั้นตอนการให้เหตุผล การเรียกใช้ฟังก์ชัน และพฤติกรรมเชิงเอเจนต์บางอย่างได้ถูกแยกออกหรือสรุป แทนที่จะแสดงทั้งหมด สำหรับทีมที่สร้างเวิร์กโฟลว์ที่ซับซ้อนโดยที่ Claude ท่องเว็บ เขียนโค้ด หรือดำเนินงานหลายขั้นตอนโดยอัตโนมัติ นี่ถือเป็นปัญหาร้ายแรง หากไม่มีการมองเห็นที่สมบูรณ์ การแก้ไขจุดบกพร่องจะกลายเป็นการคาดเดา และเหตุการณ์การผลิตจะยากขึ้นในการติดตามกลับไปยังสาเหตุที่แท้จริง

เหตุใดนักพัฒนาจึงรู้สึกหงุดหงิดกับการเปลี่ยนแปลงนี้?

ฟันเฟืองของนักพัฒนาไม่ได้เป็นเพียงการลบฟีเจอร์เดียวเท่านั้น ซึ่งสะท้อนให้เห็นถึงความกังวลที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับทิศทางที่บริษัท AI กำลังดำเนินการกับแพลตฟอร์มของตน นี่คือสิ่งที่นักพัฒนาซอฟต์แวร์เรียกร้องเป็นพิเศษ:

เวิร์กโฟลว์การดีบักที่ใช้งานไม่ได้: วิศวกรไม่สามารถติดตามเส้นทางการดำเนินการทั้งหมดของ Claude ได้อีกต่อไป ทำให้แทบจะเป็นไปไม่ได้เลยที่จะทำซ้ำและแก้ไขปัญหาในระบบเอเจนต์การผลิต

💡 คุณรู้หรือไม่?

Mewayz ทดแทนเครื่องมือธุรกิจ 8+ รายการในแพลตฟอร์มเดียว

CRM · การออกใบแจ้งหนี้ · HR · โปรเจกต์ · การจอง · อีคอมเมิร์ซ · POS · การวิเคราะห์ แผนฟรีใช้ได้ตลอดไป

เริ่มฟรี →

ความน่าเชื่อถือที่กัดกร่อนในเอาท์พุต AI: เมื่อคุณไม่เห็นว่าคำตอบถูกสร้างขึ้นมาอย่างไร คุณจะไม่สามารถยืนยันได้ สิ่งนี้เป็นอันตรายอย่างยิ่งในโดเมนที่มีเดิมพันสูง เช่น การเงิน การดูแลสุขภาพ และเทคโนโลยีทางกฎหมาย

ความรับผิดชอบที่ลดลง: หากตัวแทน AI ดำเนินการที่เป็นอันตรายหรือไม่ถูกต้อง การให้เหตุผลที่ซ่อนอยู่จะทำให้ยากขึ้นในการพิจารณาว่าข้อผิดพลาดนั้นอยู่ที่พรอมต์ โมเดล หรือกรณี Edge ที่ไม่คาดคิด

ข้อเสียเปรียบในการแข่งขัน: ทางเลือกโอเพ่นซอร์สเช่น LLaMA และ Mistral ให้ความโปร่งใสโดยสมบูรณ์ตามค่าเริ่มต้น พฤติกรรมการซ่อนจะผลักดันนักพัฒนาไปสู่โมเดลที่พวกเขาสามารถตรวจสอบและควบคุมได้จริง

การละเมิดความคาดหวังของนักพัฒนา: หลายทีมเลือก Claude โดยเฉพาะเนื่องจาก Anthropic วางตำแหน่งตัวเองเป็นบริษัท AI ที่โปร่งใสและคำนึงถึงความปลอดภัยเป็นหลัก การเคลื่อนไหวครั้งนี้ขัดแย้งกับคำมั่นสัญญาของแบรนด์นั้น

“ความโปร่งใสไม่ใช่คุณสมบัติที่คุณสามารถเลิกใช้ได้ มันเป็นรากฐานของการบูรณาการ AI ที่เชื่อถือได้ทุกประการที่ถูกสร้างขึ้น ช่วงเวลาที่นักพัฒนาสูญเสียการมองเห็นในสิ่งที่ตัวแทน AI กำลังทำอยู่ พวกเขาก็สูญเสียความสามารถในการไว้วางใจในการผลิต”

สิ่งนี้ส่งผลต่ออนาคตของการพัฒนาตัวแทน AI อย่างไร

ความขัดแย้งนี้มาถึงช่วงเวลาสำคัญ อุตสาหกรรมกำลังก้าวไปสู่ระบบ AI แบบตัวแทนอย่างรวดเร็ว ซึ่งไม่เพียงแต่ตอบคำถามเท่านั้น แต่ยังดำเนินการในนามของผู้ใช้อีกด้วย เอเจนต์การเขียนโค้ด ความสามารถในการใช้คอมพิวเตอร์ และฟีเจอร์การเรียกใช้เครื่องมือของ Claude ล้วนแสดงถึงการเปลี่ยนแปลงนี้ เมื่อตัวแทนเหล่านี้ทำงานในโลกแห่งความเป็นจริง การแก้ไขไฟล์ การส่งข้อความ การเรียก API ความเสี่ยงของพฤติกรรมที่ซ่อนอยู่จะทวีคูณแบบทวีคูณ

นักพัฒนาที่สร้างเวิร์กโฟลว์อัตโนมัติจำเป็นต้องมีความสามารถในการสังเกตอย่างละเอียด พวกเขาจำเป็นต้องรู้ว่าเครื่องมือใดถูกเรียก พารามิเตอร์ใดที่ถูกส่งผ่าน เหตุผลของแบบจำลองคืออะไรในแต่ละจุดการตัดสินใจ และเหตุใดจึงเลือกเส้นทางหนึ่งทับอีกเส้นทางหนึ่ง การแยกข้อมูลนั้นออกไปไม่ได้ทำให้ประสบการณ์ของนักพัฒนาง่ายขึ้น มันทำให้พิการ

ระบบนิเวศ AI ที่กว้างขึ้นกำลังจับตาดูอย่างใกล้ชิด หาก Anthropic เพิ่มความทึบเป็นสองเท่า ก็เสี่ยงที่จะทำให้ผู้พัฒนาแปลกแยก

All Your Business Tools in One Place

Stop juggling multiple apps. Mewayz combines 207 tools for just $19/month — from inventory to HR, booking to analytics. No credit card required to start.

Try Mewayz Free →

ลองใช้ Mewayz ฟรี

แพลตฟอร์มแบบออล-อิน-วันสำหรับ CRM, การออกใบแจ้งหนี้, โครงการ, HR และอื่นๆ ไม่ต้องใช้บัตรเครดิต

คู่มือที่เกี่ยวข้อง

คู่มือการจัดการ HR →

จัดการทีมอย่างมีประสิทธิภาพ: โปรไฟล์พนักงาน การจัดการการลา เงินเดือน และการประเมินผลการทำงาน

เริ่มจัดการธุรกิจของคุณอย่างชาญฉลาดวันนี้

เข้าร่วมธุรกิจ 30,000+ ราย แผนฟรีตลอดไป · ไม่ต้องใช้บัตรเครดิต

พบว่าสิ่งนี้มีประโยชน์หรือไม่? แบ่งปันมัน

พร้อมนำไปปฏิบัติแล้วหรือยัง?

เข้าร่วมธุรกิจ 30,000+ รายที่ใช้ Mewayz แผนฟรีตลอดไป — ไม่ต้องใช้บัตรเครดิต

เริ่มต้นทดลองใช้ฟรี →

พร้อมที่จะลงมือทำหรือยัง?

เริ่มต้นทดลองใช้ Mewayz ฟรีวันนี้

แพลตฟอร์มธุรกิจแบบครบวงจร ไม่ต้องใช้บัตรเครดิต

เริ่มฟรี →

ทดลองใช้ฟรี 14 วัน · ไม่ต้องใช้บัตรเครดิต · ยกเลิกได้ทุกเมื่อ