AI Cybersecurity ก้าวกระโดดครั้งใหญ่! AISI เผย Claude Mythos และ GPT-5.5 ทะลุทุกมาตรฐาน ส่วน Microsoft MDASH ใช้ AI 100+ ตัวค้นพบ 16 ช่องโหว่ร้ายแรง

วงการ AI Cybersecurity กำลังเกิดการเปลี่ยนแปลงครั้งสำคัญ — จากรายงานของ AISI (AI Security Institute) ของสหราชอาณาจักรและผู้เล่นหลักในวงการ ทั้ง Anthropic, OpenAI และ Microsoft ต่างเปิดเผยความก้าวหน้าครั้งใหญ่ของ AI ด้านความปลอดภัยไซเบอร์

ช่วงไม่กี่วันที่ผ่านมาเป็นประวัติศาสตร์ของ AI Cybersecurity: Claude Mythos, GPT-5.5 และ Microsoft MDASH ต่างสร้างสถิติใหม่ในการค้นหาช่องโหว่และป้องกันภัยคุกคาม

AISI เผย AI Cybersecurity พัฒนาเร็วเกินคาด

รายงานล่าสุดจาก AISI (AI Security Institute) ของสหราชอาณาจักรเปิดเผยข้อมูลที่น่าตกใจ: ความสามารถของ AI ในงานไซเบอร์ซีเคียวริตี้กำลังพัฒนาอย่างรวดเร็วเกินกว่าที่ใครคาดการณ์

Timeline การพัฒนา

ประเด็นสำคัญ: AISI ยอมรับว่างานทดสอบในชุด Narrow Cyber Suite ที่ยาวที่สุดคือ 12 ชั่วโมง ยังสั้นเกินไปสำหรับ Claude Mythos และ GPT-5.5 ที่ทำคะแนนได้เกือบ 100% ในทุกงาน

ข้อจำกัดในการทดสอบ

AISI ตั้งข้อสังเกตว่าการทดสอบของพวกเขาใช้ งบ Token แค่ 2.5M ต่องาน และ Scaffold ระดับพื้นฐาน ซึ่ง intentionally ทำให้คะแนนต่ำกว่าความเป็นจริง — หากไม่มีข้อจำกัดนี้ ค่า Time Horizon จะคำนวณไม่ได้เลยเพราะคะแนนสูงเกินไป

"Our tasks are also not long enough to determine how sharply the models' reliability would deteriorate at higher task lengths." — AISI รายงานว่าแม้แต่งาน 12 ชั่วโมงก็สั้นเกินไปสำหรับโมเดลรุ่นใหม่

Claude Mythos Preview — ก้าวกระโดดของ Anthropic

Anthropic เปิดตัว Claude Mythos Preview ซึ่งเป็นโมเดล AI ที่เน้นความปลอดภัยไซเบอร์โดยเฉพาะ โดยบริษัทอ้างว่ามัน "อันตรายเกินกว่าจะปล่อยสู่สาธารณะ" จึงให้เข้าถึงได้เฉพาะพาร์ทเนอร์ที่ได้รับเชิญผ่าน Project Glasswing

ผลการทดสอบจาก XBOW

XBOW บริษัท Offensive Security ได้ทดสอบ Claude Mythos Preview อย่างละเอียด และพบว่า: ทีม XBOW ให้ความเห็นว่า "This is a lot closer to 'just go and find something' than anything I've seen so far"

GPT-5.5 กับ Trusted Access for Cyber

OpenAI ก็ไม่หยุดนิ่งเช่นกัน — เปิดตัว GPT-5.5 with Trusted Access for Cyber และ GPT-5.5-Cyber ซึ่งเป็นโมเดลที่ถูกเทรนมาเฉพาะด้านความปลอดภัย

Daybreak Security AI

พร้อมกันนั้น OpenAI เปิดตัว Daybreak โครงการริเริ่มด้าน AI Cybersecurity ที่ใช้ Codex Security AI Agent เพื่อ:

สร้าง Threat Model จากโค้ดขององค์กร
ค้นหา Attack Paths ที่เป็นไปได้
Validate ช่องโหว่
Automate การตรวจจับช่องโหว่ที่มีความเสี่ยงสูง

Daybreak ใช้โมเดล AI หลายตัวร่วมกัน (Multi-Model) และทำงานร่วมกับพาร์ทเนอร์ด้านความปลอดภัยทั้งภาครัฐและเอกชน

OpenAI ยืนยันว่ากำลังเตรียม "deploy increasingly more cyber-capable models" — นั่นหมายถึงโมเดลที่ทรงพลังกว่าเดิมกำลังจะมา

Microsoft MDASH — ระบบ AI Agent 100+ ตัวค้นหาช่องโหว่

Microsoft เปิดตัวระบบใหม่ที่เรียกว่า MDASH (Multi-model Agentic Scanning Harness) ซึ่งสร้างโดยทีม Autonomous Code Security (ACS) ซึ่งรวมสมาชิกจากทีมที่ชนะรางวัล 29.5 ล้านดอลลาร์จาก DARPA AI Cyber Challenge

MDASH ทำงานอย่างไร?

ระบบ MDASH ประกอบด้วย 4 ขั้นตอนหลัก:

ผลลัพธ์ที่น่าประทับใจ

Found Vulnerabilities

4 ร้ายแรงระดับ Critical ใน Windows Kernel TCP/IP และ IKEv2

Planted Bugs Test

21/21

พบครบ 21 จุด Zero False Positives

CyberGym Score

88.45%

อันดับ 1 บน Leaderboard สูงกว่าอันดับ 2 ถึง 5 จุด

MDASH ใช้ AI มากกว่า 100 specialized agents ที่ทำงานร่วมกันแบบ Ensemble ใช้โมเดลที่หลากหลาย — บางตัวเป็น Heavy Reasoner, บางตัวเป็น Cost-effective Debater — เพื่อค้นหา ถกเถียง และพิสูจน์ช่องโหว่ตั้งแต่ต้นจนจบ

ผลกระทบต่ออุตสาหกรรม

ข้อกังวลสำคัญ: หาก AI สามารถเจาะระบบได้เก่งเท่าหรือเก่งกว่ามนุษย์ในอีกไม่กี่เดือนข้างหน้า — ใครจะเป็นฝ่ายใช้มันก่อนกันแน่?

สรุป

สามเหตุการณ์ในสัปดาห์เดียวกันแสดงให้เห็นชัดเจนว่า AI Cybersecurity กำลังก้าวจากงานวิจัยสู่การใช้งานจริง:

AISI ยืนยันว่า AI รุ่นใหม่พัฒนาความสามารถไซเบอร์เร็วกว่าที่คาดการณ์ไว้มาก
Anthropic และ OpenAI เปิดตัวโมเดลความปลอดภัยที่ทรงพลังที่สุดเท่าที่เคยมีมา
Microsoft ใช้ Multi-Agent AI System ค้นหาช่องโหว่ระดับ Production ได้จริง

การแข่งขันด้าน AI Cybersecurity กำลังจะร้อนแรงขึ้นอย่างแน่นอน — และนี่อาจเป็นเพียงจุดเริ่มต้นเท่านั้น

ที่มา: AISI — How fast is autonomous AI cyber capability advancing? | The Verge — OpenAI Daybreak | XBOW — Mythos Evaluation | Microsoft Security Blog | The Verge — AI Cybersecurity updates

มุมมองของผู้เขียน: AI ด้าน Cybersecurity ก้าวกระโดด ทั้ง Claude Mythos และ GPT-5.5 ที่ทะลุทุกมาตรฐาน แต่ยิ่ง AI แกร่งเท่าไหร่ ดาบสองคมก็ยิ่งคมมากขึ้น สำหรับคนไทยและองค์กรไทย นี่เป็นสัญญาณว่าระบบรักษาความปลอดภัยที่เคยใช้ได้ อาจต้องอัปเกรดเพื่อรับมือกับภัยคุกคามยุค AI