ในขณะที่ Google และ Anthropic กำลังศึกษาว่า AI โมเดลล่าสุดของพวกเขาเล่นเกม Pokemon ยุคแรกๆ ได้อย่างไร ผลลัพธ์ที่ได้นั้นทั้งน่าขบขันและให้ความรู้ ซึ่งคราวนี้ Google DeepMind ได้เผยแพร่รายงานว่า Gemini 2.5 Pro มีอาการ “ตื่นตระหนก” เมื่อ Pokemon ของมันใกล้ HP หมด รายงานระบุว่าสิ่งนี้อาจทำให้ประสิทธิภาพของ AI ลดลงอย่างเห็นได้ชัดในด้านความสามารถในการให้เหตุผล
AI benchmarking หรือการเปรียบเทียบประสิทธิภาพของ AI เป็นศาสตร์ที่ค่อนข้างคลุมเครือ และมักให้ข้อมูลที่น้อยมากเกี่ยวกับความสามารถที่แท้จริงของโมเดลนั้นๆ แต่มีนักวิจัยบางคนคิดว่า การศึกษาว่า AI เล่นเกมอย่างไรอาจเป็นประโยชน์ (หรืออย่างน้อยๆก็ตลกดี)
เช่นในช่วงหลายเดือนที่ผ่านมา มีนักพัฒนาสองคนที่ไม่เกี่ยวข้องกับ Google และ Anthropic ได้ตั้ง Twitch stream ชื่อ “Gemini Plays Pokemon” และ “Claude Plays Pokemon” ซึ่งทุกคนสามารถรับชมแบบสดได้ว่า AI พยายามเล่นเกมสำหรับเด็กเกมนี้อย่างไร โดยในสตรีมจะแสดง “กระบวนการให้เหตุผล” ของ AI ว่าประเมินปัญหาและตอบสนองอย่างไร ทำให้เราเข้าใจวิธีการทำงานของโมเดลเหล่านี้
แม้ว่าความก้าวหน้าของ AI โมเดลเหล่านี้จะน่าประทับใจแค่ไหน แต่ AI พวกนี้ก็ยังเล่น Pokemon ได้ไม่ดีนัก เช่น Gemini ใช้เวลาหลาย 100 ชั่วโมงในการเล่นเกมที่พวกเราสมัยเป็นเด็กก็อาจจะเล่นจบไปหลายรอบแล้ว (ไม่นับเรื่องเก็บ Pokedex ให้ครบนะ)
แต่ทว่าสิ่งที่น่าสนใจเกี่ยวกับการดู AI เล่นเกม Pokemon ไม่ได้อยู่ที่เวลาที่เล่นจบ แต่เป็นการสังเกตพฤติกรรมระหว่างทางของพวกมันมากกว่า โดยรายงานระบุว่าตลอดการเล่นเกม เจ้า Gemini 2.5 Pro พบสถานการณ์ต่างๆ ที่ทำให้โมเดลจำลองภาวะ “ตื่นตระหนก” ออกมา เช่นเมื่อ Pokemon ของพวกมันใกล้ HP หมด
ซึ่งสภาวะ “ตื่นตระหนก” นี้สามารถส่งผลให้ประสิทธิภาพของโมเดลแย่ลงได้ เนื่องจาก AI อาจหยุดใช้เครื่องมือบางอย่างที่มีอยู่ชั่วคราวในระหว่างการเล่นเกม แม้ว่า AI จะไม่มีการแสดงอารมณ์ แต่การกระทำเลียนแบบวิธีที่มนุษย์อาจตัดสินใจผิดพลาดอย้่างร้อนรนเมื่ออยู่ภายใต้ความเครียด เป็นปฏิกิริยาที่น่าสนใจและน่ากังวล โดยรายงานระบุว่า “พฤติกรรมนี้เกิดขึ้นหลายครั้งจนผู้ชมใน Twitch สังเกตเห็น”
Claude เองก็แสดงพฤติกรรมที่น่าสนใจระหว่างเล่นเช่นกัน เช่น เป็นที่รู้กันดีว่าเมื่อ Pokemon ของเราหมดสติทุกตัว ตัวละครผู้เล่นจะ “สลบ” และกลับไปที่ Pokemon Center ซึ่ง Claude ก็จดจำและเรียนรู้ในเรื่องนี้ไว้
ดังนั้นพอ Claude ติดอยู่ในถ้ำบนเขาจันทราแล้วหาทางออกไม่ได้ มันจึงตั้งสมมติฐานผิดๆ ทึกทักเอาเองว่าถ้ามันจงใจทำให้ Pokemon ทั้งหมดหมดสติ มันจะถูกส่งข้ามถ้ำไปยัง Pokemon Center ในเมืองถัดไปโดยอัตโนมัติ แต่สิ่งที่เกิดขึ้นคือ เมื่อ Pokemon หมดสติ ตัวละครผู้เล่นจะกลับไปที่ Pokemon Center ล่าสุดที่ใช้บริการ ไม่ใช่Pokemon Center ที่ใกล้ที่สุด ทำให้เหล่าผู้ชมได้แต่รับชมอย่างสยองขวัญเมื่อ AI พยายามฆ่าตัวตายในเกมเพื่อหาทางออกจากถ้ำ
แม้จะมีข้อจำกัดอยู่บ้าง แต่ AI ก็สามารถทำได้ดีกว่าผู้เล่นที่เป็นมนุษย์ในบางเรื่อง เช่นการสร้างเครื่องมือเพื่อเอามาไขปริศนาหินที่ขวางทางก่อนขึ้นไปที่ Victory road ได้ในการเล่นครั้งเดียวโดยอาศัยคำชี้แนะเพียงเล็กน้อย
“เพียงแค่เราอธิบายเรื่องฟิสิกส์ของหินที่ขวางทาง Victory road และอธิบายวิธีการตรวจสอบเส้นทางที่ถูกต้อง เจ้า Gemini 2.5 Pro ก็สามารถแก้ไขปริศนาหินที่ซับซ้อนเหล่านี้ได้ในครั้งเดียว”
เนื่องจาก Gemini 2.5 Pro ทำงานส่วนใหญ่ด้วยการสร้างเครื่องมือเพื่อแก้ปัญหาด้วยตัวเอง Google จึงตั้งทฤษฎีว่าโมเดลปัจจุบันอาจมีความสามารถในการสร้างเครื่องมือเหล่านี้โดยไม่ต้องมีการแทรกแซงจากมนุษย์อีก ซึ่งก็น่าสนใจว่าในอนาคต AI เหล่านี้อาจจะสร้างเครื่องมือที่เอามาจัดการ “อาการตื่นตระหนก” ด้วยตัวเองก็เป็นได้




