Physical AI — เมื่อ “มือ” คือหุ่นยนต์จริง
harness ชุดเดิมยังใช้ได้เมื่อ “มือ” ของ agent เป็นหุ่นยนต์จริง — แต่ลูป perceive → policy → act ตอนนี้ลงมือในโลกกายภาพที่ ย้อนกลับไม่ได้ บทนี้: vision-language-action (VLA) models, safety envelope, และ teleoperation fallback — และทำไม Permissions กับ Verify ยิ่งคอขาดบาดตาย
พูดแบบเข้าใจง่าย
ลูปยังเหมือนเดิม (gather → act → verify → repeat) เปลี่ยนแค่ act = การเคลื่อนไหวจริง ปี 2025–2026 หัวใจของหุ่นยนต์อัจฉริยะคือ VLA models ที่รวม การมองเห็น + ภาษา + การกระทำ ไว้ในโมเดลเดียว (perceive → reason → act) เรียนรู้ policy ที่ปรับตัวกับสถานการณ์ใหม่ได้
ของใหม่ที่ harness ต้องเพิ่มเมื่อมือเป็นของจริง:
- Safety envelope — ขีดจำกัด แข็ง ที่ตรวจ ก่อน act และตรวจจาก เซนเซอร์จริง ไม่ใช่ความมั่นใจของ policy (เช่น “ห้ามขยับถ้ามีคนในระยะ X”)
- Teleoperation fallback — เมื่อไม่มั่นใจหรือ envelope สะดุด → หยุดแล้วยกให้มนุษย์คุม
- Verify = เซนเซอร์จริง — ไม่ใช่คำว่า “เสร็จแล้ว” ของ policy · Permissions = ขีดจำกัดทางกายภาพ
เหตุผลที่ทุกอย่างเข้มขึ้น: ในโลกกายภาพ ไม่มีปุ่ม undo — ความผิดพลาดของ policy กลายเป็นการชนจริง
ในระบบของเรา — ผู้ช่วยจัดการแล็บกลายเป็นหุ่นตรวจม้านั่งแล็บ
ลูปนี้คือลูปเดียวกับที่เราสร้างมาตั้งแต่บทที่ 03 ทุกบทเรียนยังใช้: grounding (เซนเซอร์จริง), permissions (envelope), verify (ตรวจผลจริง ไม่ใช่คำพูดของ policy), การคุมลูป, observability — เพียงแต่ เดิมพันสูงขึ้นมาก เพราะความผิดพลาดเกิดในวัตถุจริง
ทำพลาด vs ทำถูก
ลองเอง — safety envelope
สรุปบทที่ 18
- ลูปเดิม (perceive→policy→act) แต่ act = การเคลื่อนไหวจริงที่ย้อนไม่ได้
- VLA models รวมการมองเห็น+ภาษา+การกระทำไว้ในโมเดลเดียว
- เพิ่ม safety envelope (ขีดจำกัดแข็งจากเซนเซอร์จริง) + teleop fallback
- Permissions & Verify ยิ่งคอขาดบาดตาย เมื่อความผิดพลาดเกิดในโลกกายภาพ
📋 build-your-harness checklist · บรรทัดที่ 17 “เมื่อ act เป็นกายภาพ: safety envelope จากเซนเซอร์จริง · teleop fallback · verify จากเซนเซอร์ ไม่ใช่ความมั่นใจของ policy”