ทำไมรัฐบาลสหรัฐฯ จึงสั่งปิดใช้งานโมเดล AI Claude รุ่นล่าสุดของ Anthropic

เมื่อวันที่ 12 มิถุนายน ห้องปฏิบัติการปัญญาประดิษฐ์ (AI) Anthropic ได้ระงับการเข้าถึงโมเดล Claude รุ่นล่าสุด ได้แก่ Fable 5 และ Mythos 5 ซึ่งเพิ่งเปิดตัวไปเมื่อสามวันก่อนหน้านั้น

การดำเนินการดังกล่าวเป็นการตอบสนองต่อ "คำสั่งควบคุมการส่งออก" จากรัฐบาลสหรัฐฯ ที่ห้ามมิให้บุคคลใดก็ตามที่ไม่ใช่พลเมืองสหรัฐฯ ใช้โมเดลเหล่านี้

Mythos คือโมเดลที่ทรงพลังที่สุด หรือ "ล้ำหน้าที่สุด" ของ Anthropic เมื่อประกาศเปิดตัวโมเดลนี้ครั้งแรกในเดือนเมษายน บริษัทกล่าวว่ามันเก่งเกินกว่าที่จะปล่อยออกมาให้ใช้งานทันที ดังนั้นจึงได้เปิดให้องค์กรจำนวนหนึ่ง (ส่วนใหญ่เป็นบริษัทเทคโนโลยีในสหรัฐฯ) ใช้เพื่อแก้ไขจุดอ่อนในระบบดิจิทัลที่สำคัญ

Fable คือโมเดลพื้นฐานเดียวกัน แต่มีมาตรการป้องกันเพิ่มเติมเพื่อป้องกันไม่ให้ถูกนำไปใช้เพื่อวัตถุประสงค์ด้านความปลอดภัยทางไซเบอร์ ซึ่งนี่คือสิ่งที่ถูกปล่อยให้สาธารณะใช้งานเมื่อสัปดาห์ที่แล้ว แต่แล้วก็ถูกปิดตัวลงแทบจะในทันที

บริษัท Anthropic และรัฐบาลทรัมป์ขัดแย้งกัน
นับตั้งแต่ต้นปี 2025 บริษัท Anthropic และรัฐบาลทรัมป์ได้เผชิญหน้ากันในความขัดแย้งที่ทวีความรุนแรงขึ้นเรื่อยๆ รัฐบาลกล่าวหา Anthropic ว่าสร้าง “AI ที่ตื่นตัวทางสังคม” (woke AI) และเรียกดาริโอ อโมเดอี ประธานเจ้าหน้าที่บริหารว่าเป็น “คนบ้าคลั่งทางอุดมการณ์” (ideological lunatic)

ความขัดแย้งในช่วงแรกเกี่ยวข้องกับกฎระเบียบด้าน AI และนโยบายการส่งออกเซมิคอนดักเตอร์ ความขัดแย้งทวีความรุนแรงขึ้นเมื่อ Anthropic ปฏิเสธที่จะอนุญาตให้เพนตากอนหรือกระทรวงกลาโหมใช้โมเดลของตนสำหรับการเฝ้าระวังภายในประเทศและระบบอาวุธที่ทำงานอัตโนมัติอย่างเต็มรูปแบบ

กระทรวงกลาโหมตอบโต้ด้วยการขู่ว่าจะกำหนดให้บริษัท Anthropic เป็น "ความเสี่ยงในห่วงโซ่อุปทาน" ซึ่งการจัดประเภทดังกล่าวจะบังคับให้ผู้รับเหมาทางทหารต้องตัดความสัมพันธ์กับบริษัทนี้

จุดอ่อนที่แฮ็กเกอร์อาจใช้ (Jailbreaks)
รัฐบาลสหรัฐฯ ยังไม่ได้แถลงเหตุผลอย่างเป็นทางการสำหรับคำสั่งเมื่อสัปดาห์ที่แล้ว แต่ Anthropic ระบุว่าเชื่อว่ารัฐบาลรับรู้ถึงการเจลเบรก: วิธีการหลีกเลี่ยงมาตรการป้องกันใน Fable ที่ป้องกันการใช้คุณสมบัติที่ทรงพลังที่สุดเพื่อจุดประสงค์ที่ชั่วร้าย

มาตรการป้องกันเหล่านี้จะจำแนกคำขอของผู้ใช้ว่าเป็นปลอดภัยหรือไม่ปลอดภัยก่อนที่จะส่งต่อไปยังโมเดล AI เมื่อถูกกระตุ้น มาตรการป้องกันจะเปลี่ยนเส้นทางคำขอไปยังโมเดลที่มีประสิทธิภาพน้อยกว่า

ความกังวลของรัฐบาล ตามที่ Anthropic กล่าวคือ มาตรการป้องกันอาจถูกหลีกเลี่ยงเพื่อดึงข้อมูลที่เป็นประโยชน์สำหรับการโจมตีทางไซเบอร์

มาตรการป้องกันสำหรับโมเดลภาษาขนาดใหญ่ไม่ได้สมบูรณ์แบบเสมอไป ส่วนใหญ่ขึ้นอยู่กับความสามารถของโมเดลเองในการตีความเจตนาของผู้ใช้ในการส่งคำขอ

นอกเหนือจากความยากลำบากโดยธรรมชาติของงานนี้แล้ว ชุมชนออนไลน์ขนาดใหญ่ (ซึ่งเพื่อนร่วมงานของผมและผมเรียกว่า Undersphere) กำลังทำงานอย่างหนักเพื่อหลีกเลี่ยงมาตรการป้องกัน AI บริษัท Anthropic ยอมรับว่า “การป้องกันการเจลเบรก (Jailbreaks เกิดขึ้นเมื่อแฮกเกอร์ใช้ประโยชน์จากช่องโหว่ในระบบ AI เพื่อหลีกเลี่ยงหลักเกณฑ์ด้านจริยธรรมและดำเนินการที่ถูกจำกัด) อย่างสมบูรณ์แบบนั้นเป็นไปไม่ได้สำหรับผู้ให้บริการโมเดลใด ๆ ในปัจจุบัน”

Anthropic กล่าวว่างานวิจัยที่อยู่เบื้องหลังคำสั่งของรัฐบาลดูเหมือนจะผลิตโดยวิศวกรของ Amazon ซึ่งเป็นทั้งคู่แข่งของ Anthropic และเป็นผู้ลงทุนรายใหญ่

แต่การเจลเบรกนี้ไม่ใช่กรณีเดียวที่เกี่ยวข้อง ภายใน 48 ชั่วโมงหลังจากการเปิดตัว Fable นักวิจัยที่ใช้นามแฝงว่า “Pliny the Liberator” ได้เผยแพร่สิ่งที่พวกเขาระบุว่าเป็นข้อความแจ้งเตือนระบบทั้งหมดของ Fable 5 ไปยัง X และที่เก็บข้อมูล GitHub

ข้อความแจ้งเตือนของระบบเป็นชุดคำสั่งที่ซ่อนอยู่ ซึ่งช่วยกำหนดพฤติกรรมของโมเดล AI ยังไม่ชัดเจนว่าความรู้เกี่ยวกับข้อความแจ้งเตือนของระบบในเกม Fable จะถูกนำไปใช้ในทางปฏิบัติได้อย่างไร แต่ก็ได้รับความสนใจในโลกใต้ดิน (Undersphere)

เรื่องน่าประหลาดใจ – และปริศนาที่ยังคงอยู่
ปัญหาที่สำคัญที่สุดในการสร้างโมเดลภาษาขนาดใหญ่ เช่น Fable ให้ปลอดภัย คือเราไม่รู้แน่ชัดว่ามันทำงานอย่างไร ตามที่ แมกซิมิเลียน เคซี นักเศรษฐศาสตร์และผู้เชี่ยวชาญด้านการเรียนรู้ของเครื่องจากมหาวิทยาลัยอ็อกซ์ฟอร์ดกล่าว พวกมันทำงานได้ดีกว่าที่ “ควรจะเป็น” มาก

โมเดลภาษาขนาดใหญ่มีพารามิเตอร์ภายในหลายพันล้านตัว และได้รับการฝึกฝนด้วยข้อมูลจำนวนมหาศาลโดยใช้วิธีการเรียนรู้ของเครื่อง ตามที่เคซีกล่าว เราคาดหวังว่าระบบดังกล่าวจะ “โอเวอร์ฟิต” (overfitted) นั่นคือ เก่งในการจำลองรูปแบบในข้อมูลการฝึกฝน แต่ไม่เก่งในการสรุปผลไปยังสถานการณ์ใหม่ๆ

อย่างไรก็ตาม ระบบสมัยใหม่ เช่น Claude และ ChatGPT ดูเหมือนจะสามารถสรุปผลได้ Kasy เปรียบเทียบการพัฒนา AI สมัยใหม่กับการเล่นแร่แปรธาตุ นั่นคือ ประสบความสำเร็จผ่านการลองผิดลองถูก ยังไม่ได้วางรากฐานบนทฤษฎีที่เป็นระบบ

ด้วยเหตุนี้ พฤติกรรมของโมเดล AI จึงไม่โปร่งใสแม้แต่กับผู้สร้างของมันเอง

ควบคุมได้ยาก
ความไม่โปร่งใสของเทคโนโลยีเป็นเหตุผลสำคัญประการหนึ่งที่ทำให้การควบคุมเป็นเรื่องยาก รัฐบาลขาดการเข้าถึงข้อมูล โครงสร้างพื้นฐาน และความเชี่ยวชาญที่จำเป็นต่อการประเมินโมเดล AI ระดับแนวหน้าอย่างเป็นอิสระ

คำสั่งบริหารล่าสุดของรัฐบาลสหรัฐฯ เกี่ยวกับความปลอดภัยของ AI ที่เผยแพร่เมื่อสองสัปดาห์ก่อน สะท้อนให้เห็นถึงความเข้าใจในเรื่องนี้ เนื่องจากรัฐบาลตระหนักถึงศักยภาพของโมเดล AI ระดับแนวหน้า จึงเปลี่ยนจากท่าทีที่ไม่เข้าไปแทรกแซงในตอนแรก มาเป็นการขอให้ผู้พัฒนาแบ่งปันโมเดลของตนเพื่อตรวจสอบก่อนเผยแพร่

ข้อเรียกร้องดังกล่าวเป็นการยอมรับโดยปริยายว่ารัฐบาลไม่ไว้วางใจบริษัทต่างๆ ในการประเมินอย่างครบถ้วนและครอบคลุมว่าโมเดลของตนเองสามารถทำอะไรได้บ้าง และอาจถูกนำไปใช้ในทางที่ผิดได้อย่างไร สาธารณชนเห็นน้อยกว่านั้น และผลที่ตามมานั้นวัดได้ นั่นคือการสำรวจใน 25 ประเทศเมื่อปีที่แล้วพบว่า โดยรวมแล้ว ผู้คนกังวลเกี่ยวกับ AI มากกว่าตื่นเต้นกับมันถึงสองเท่า

อนาคตของความปลอดภัยของ AI
AI เป็นเทคโนโลยีที่ถูกโฆษณาเกินจริงอย่างมาก แต่ก็ไม่ต้องสงสัยเลยว่ามันทรงพลังและคาดเดาไม่ได้อย่างยิ่ง เป็นที่เข้าใจได้ว่า การผสมผสานนี้เป็นอันตรายอย่างมาก

เราไม่สามารถพึ่งพากฎระเบียบได้ เนื่องจากเทคโนโลยีจะพัฒนาเร็วกว่าที่กฎระเบียบจะปรับตัวได้ เราไม่สามารถพึ่งพามาตรการป้องกันได้ เพราะมันจะถูกละเลยไป

เราต้องการกรอบการกำกับดูแลที่สร้างขึ้นเพื่อรองรับสถานการณ์เช่นนั้น กรอบที่สามารถคาดการณ์และแก้ไขผลที่ตามมาจากการล้มเหลวได้

กรอบดังกล่าวต้องเป็นกรอบระดับโลก มีส่วนร่วม และตั้งอยู่บนพื้นฐานของความไว้วางใจซึ่งกันและกัน ซึ่งเป็นสิ่งที่รัฐบาลสหรัฐฯ ชุดปัจจุบันแสดงให้เห็นถึงความสามารถในการสร้างขึ้นมาได้น้อยมาก

บทความของ ฟรานเชสโก ไบโล (Francesco Bailo) อาจารย์อาวุโสสาขาการวิเคราะห์ข้อมูลในสังคมศาสตร์ รองผู้อำนวยการศูนย์ปัญญาประดิษฐ์ ความน่าเชื่อถือ และธรรมาภิบาล มหาวิทยาลัยซิดนีย์ เผยแพร่ใน The Conversation (Creative Commons licence)

Photo - ดาริโอ อโมเดอี ซีอีโอของ Anthropic โบกมือขณะกล่าวสุนทรพจน์ต่อผู้ชมในระหว่างการบรรยายเรื่องปัญญาประดิษฐ์ (AI) ในการประชุมประจำปีของเวทีเศรษฐกิจโลก (WEF) ที่เมืองดาวอส เมื่อวันที่ 23 มกราคม 2025 (Photo by FABRICE COFFRINI / AFP)