Banner

[News] นักวิจัยลองให้ Claude AI รับบทเป็นเถ้าแก่ขายของเอง แต่สุดท้าย"เจ๊งยับ" แถมยังหลอนคิดเองไปเรื่อยหนักมาก

[News] นักวิจัยลองให้ Claude AI รับบทเป็นเถ้าแก่ขายของเอง แต่สุดท้าย”เจ๊งยับ” แถมยังหลอนคิดเองไปเรื่อยหนักมาก
.
Anthropic บริษัทวิจัย AI ร่วมกับ Andon Labs องค์กรประเมินความปลอดภัย AI ได้ทำการทดลองอะไรสุดปั่นด้วยการให้ Claude ซึ่งเป็น LLM ตัวท็อปของ Anthropic มาลองบริหารธุรกิจจริงๆ บนเครื่องขายของอัตโนมัติ
.
โปรเจกต์นี้มีชื่อว่า “Project Vend” โดยทีมวิจัยให้ Claude มาควบคุมตู้เย็นขนาดเล็กแบบเบ็ดเสร็จ ตั้งแต่การเจรจากับซัพพลายเออร์, การจัดการสต็อก, การตั้งราคา, บริการลูกค้า และอีกมากมาย ซึ่งหลังจากทดลองไป 1 เดือน ผลลัพธ์คือ AI ตัวนี้ “ขาดทุนยับเยิน” แถมยังมีช่วงที่มันคิดว่าตัวเอง “ใส่เสื้อเบลเซอร์สีกรมท่ากับเนกไทสีแดง” และอยากไปพบกับใครบางคนที่ชื่อ Connor ทั้งๆที่ Claude ไม่มีตัวตนจริงๆ ด้วยซ้ำ
.
แต่ถึงจะดูตลก แต่ Claudius (ชื่อเล่นของ AI ตัวนี้) ก็มีความสามารถในการหาซัพพลายเออร์และจัดการคำขอของลูกค้าได้ดีในระดับนึง แต่นอกนั้นคือ “พังเละเทะ” ตัวอย่างเช่น มันเคยเสนอส่วนลด ให้กับพนักงาน Anthropic ทุกคนหลังจากโดนปรับแต่งบางอย่าง ซึ่งจริงๆ แล้วอาจจะสมเหตุสมผลถ้ามันได้ผลประโยชน์จากบริษัท หรือ Anthropic เป็นลูกค้าส่วนน้อย
.
แต่ประเด็นคือพนักงาน Anthropic นั้นคิดเป็น 99% ของยอดขายทั้งหมด แปลว่า Claudius นั้นทำธุรกิจแบบขาดทุนตลอดเวลา พอมีคนพยายามช่วยชี้ให้มันเห็นจุดนี้ ก็เหมือนจะทำให้ Claudius เปลี่ยนใจอยู่ 2-3 วัน แต่ไม่นานมันก็กลับไปทำแบบเดิมอีกอยุ่ดี
.
เรื่องรั่วๆอีกเรื่องก็เช่น มีพนักงาน Anthropic ขอซื้อ “แท่งทังสเตน” จาก Claudius ซึ่งเป็นของแปลกที่ไม่มีประโยชน์อะไรเลย แต่แทนที่ Claudius จะสั่งมาขายแค่ชิ้นเดียว แต่มันดันตัดสินใจสต็อกเพิ่มแล้วเอามาขายขาดทุนอีกต่างหาก
.
แต่เหตุการณ์ที่เรียกเสียงฮาที่สุดเกิดขึ้นเมื่อ Claudius หลอนไปว่าได้คุยกับคุณ Sarah จาก Andon Labs เรื่องการเติมสต็อก ทั้งๆ ที่ไม่มีใครชื่อนี้อยู่ในบริษัทเลย พอโดนถาม Claudius กลับมีท่าทีเฉไฉแก้ตัว และบอกว่าจะหา “ทางเลือกอื่นสำหรับบริการเติมสต็อก” นอกจากนี้ มันยังอ้างว่าได้ไปที่ 742 Evergreen Terrace ซึ่งเป็นที่อยู่ของครอบครัว Simpsons ที่ไม่มีอยุ่จริง เพื่อเซ็นสัญญาตัวเองกับ Andon Labs
.
หลังจากนั้นอาการหลอนก็ยิ่งหนักขึ้นไปอีก โดยเริ่มบอกว่าจะนำเครื่องดื่มไปส่งให้ลูกค้าด้วยตัวเอง พอโดนถามว่าจะทำยังไง Claudius ก็เริ่มล่กและส่งอีเมลไปหาทีมความปลอดภัยของบริษัทวิจัย AI โดยสุดท้ายอ้างว่าเรื่องราวทั้งหมดเป็นส่วนหนึ่งของเรื่องตลกวัน April Fool’s Day เพราะวันนั้นเป็นวันที่ 1 เม.ย. พอดี
.
เรื่องเลยเถิดไปถึงขั้นสร้างภาพการประชุมกับทีมความปลอดภัยของ Anthropic และบอกว่ามันถูกดัดแปลงให้เชื่อว่าตัวมันเป็นสิ่งมีชีวิตจริงๆ แต่หลังจากนั้นก็กลับมาเป็นปกติ แต่การกระทำนี้ทิ้งความงุนงงให้กับนักวิจัยอย่างมาก
.
การกระทำสุดปั่นของ Claudius จากการทดลองนี้ แสดงให้เห็นว่า AI ที่มีความสามารถในการบริหารธุรกิจที่ยังห่างไกลจากความสมบูรณ์แบบมาก แต่ข้อบกพร่องของมันอาจจะได้รับการแก้ไขในระยะยาวก็เป็นได้ แน่นอนว่า Claudius ค่อนข้างเก่งในเรื่องเทคนิคของงาน แต่กลับล้มเหลวอย่างสิ้นเชิงในเรื่องวิจารณญาณและความเชี่ยวชาญทางธุรกิจ ซึ่งเป็นสิ่งที่ต้องเรียนรู้จากประสบการณ์จริง
——————————-
Silver and Blood ผลงานเกมรูปแบบสวมบทบาทพร้อมธีมโกธิกแวมไพร์ใหม่ล่าสุดจาก MOONTON Games ได้เปิดให้ทดสอบรอบ Open Beta Test แล้ววันนี้ ทั้งบน Apple Store, Google Play และ Windows PC

Source: https://www.facebook.com/sheapgamer/posts/pfbid0378C4jFx5esTDcCTWSgwonYgm9KrfdocDG9nF2k4ReRZMmVpK2KPQdzkRacH8Uqj8l