
ช่วงไม่กี่สัปดาห์ที่ผ่านมา เชื่อว่าเราหลายคนน่าจะเห็นข่าว AI เต็มไปหมด ไม่ว่าจะเป็น OpenClaw, Cowork, หรือล่าสุด Citrini Research ซึ่งจริงๆดูเหมือนจะเป็นจิ๊กซอวที่ดูเป็นชิ้นเล็กๆกระจัดกระจาย แต่ถ้าเราเอามาต่อๆกันเราจะเห็นภาพลางๆของอนาคตในอีกไม่นาน
เรื่องแรกคือ OpenClaw ซึ่งเป็น open-source AI agent สร้างโดย Peter Steinberger ที่สามารถทำให้รันได้ตลอด 24 ชั่วโมงบนคอมของเรา อ่านไฟล์เราได้ จัดการอีเมลให้ได้ สั่งงานผ่าน WhatsApp ซึ่งปล่อยให้มันทำงานได้แม้กระทั่งตอนเรานอนหลับ
จุดนึงที่ทำให้คน FOMO กันคือลองคิดดูถ้าเพื่อนร่วมงานเรามีผู้ช่วยที่ทำงานให้ตลอดเวลาแม้กระทั่งตอนนอน ค้นข้อมูลให้ตอนขับรถไปทำงาน เตรียมงานให้ตอนนั่งกินข้าวเช้า ลองนึกภาพว่าเราจะสู้เขายังไงถ้าเราทำงานแค่ 8 ชั่วโมง ในขณะที่เพื่อนเรามีผู้ช่วยที่ทำงานให้ตลอดเวลา
การที่ OpenClaw ได้รับความนิยมอย่างรวดเร็วบอกกับเราได้ว่า สิ่งที่คนต้องการจริงๆคือผู้ช่วยที่ "สามารถทำงานได้ตลอดเวลา" มีความทรงจำ และ "ลงมือทำ" ได้ ไม่ใช่แค่แชทบอทที่ตอบคำถาม ซึ่งความต้องการของคนจำนวนมากส่งสัญญาณแรงพอที่ OpenAI ตัดสินใจจ้าง Steinberger เข้าทีมในช่วงกลางเดือนกุมภาพันธ์
ในช่วงเดียวกัน Anthropic ก็เปิดตัว Claude Cowork ซึ่งถ้าใครเคยใช้ Claude Code และเห็นว่ามันช่วยงาน developer ทำอะไรได้บ้าง ไม่ว่าจะเป็นการตรวจ codebase ให้แบบอัตโนมัติ ทำงานที่เป็นหลายขั้นตอนต่อเนื่องเป็นชั่วโมงได้
Cowork จริงๆก็สร้างมาบนฐาน infrastructure เดียวกันแต่ห่อมาใน visual interface ที่ใครก็ใช้ได้ ไม่ต้องเปิด terminal ไม่ต้อง setup อะไรทั้งนั้น คนทั่วไปที่ไม่ใช่ developer สามารถใช้ได้ง่ายขึ้น สิ่งที่ Cowork พิสูจน์คือ UX เป็นกำแพงที่สำคัญ พอลด friction ลง คนจำนวนมากก็เริ่ม adopt ใช้แบบรวดเร็ว
ถัดจากนั้นไม่นาน Anthropic ก็ปล่อย Opus 4.6 พร้อม Agent Teams ซึ่งเป็นความสามารถในการสร้าง AI agent หลายตัวที่แบ่งงานกัน ประสานงานกันเอง และทำงานแบบคู่ขนานได้ ไม่ใช่ผู้ช่วยตัวเดียวอีกต่อไป แต่เป็นทั้งทีม (ให้นึกภาพ Cowork on steroid ที่มี agent หลายตัวทำงานแล้วคุยประสานงานกันส่งข้อมูลหากันได้)
ล่าสุด เมื่อวานก็มีจิ๊กซอวอีกสองชิ้นเพิ่มขึ้นมาคือ Anthropic เข้าซื้อ Vercept ซึ่งเป็น startup ที่ทำให้ AI "มองเห็น" หน้าจอคอมพิวเตอร์และใช้งานซอฟต์แวร์ได้เหมือนคนจริงๆ
ในขณะเดียวกัน Perplexity ก็เปิดตัว Computer ซึ่งเป็นระบบที่ประสานงานโดยเอา AI 19 ตัว (ที่แต่ละตัวเก่งเฉพาะด้าน) เข้ามาประสานงานกันเพื่อจัดการโปรเจกต์แบบเสร็จสรรพ end-to-end ตั้งแต่ research เขียนโค้ด ออกแบบ ไปจนถึง deploy รันได้เองเป็นชั่วโมงหรือเป็นวัน
ถ้าเราเอาจิ๊กซอวต่างๆที่โผล่มาภายในไม่กี่อาทิตย์นี้มาต่อกัน เราจะเห็นภาพชัดขึ้นว่าสิ่งที่ทุก big lab กำลังวิ่งเข้าหาคือการสร้าง "digital worker" ที่ "ทำงานแทนคน" ได้ "ตลอดเวลา"
"ตา" ที่มองเห็นหน้าจอได้
"มือ" ที่คลิกและพิมพ์ได้
"ความสามารถในการเข้าถึงเครื่องมือ" เช่นโปรแกรมต่างๆที่เราต้องใช้
"สมอง" สำหรับวางแผนและใช้เหตุผล
"การทำงานเป็นทีม" เพื่อแบ่งงานทำคู่ขนาน
"ความจำ" ว่าต้องทำอะไรบ้างแล้วทำอะไรไปแล้วบ้าง สไตลการทำงานของเราเป็นแบบไหน
"ความสามารถในการทำงานตลอดเวลา" และ
"ช่องทางสื่อสาร" ที่เราเข้าถึงได้จากทุกที่เช่นแชท
จากภาพลางๆที่ปรากฎ จะเห็นได้ว่า ยังไม่มี product ตัวไหนมีครบทั้ง 8 องค์ประกอบ แต่ละคนขาดอีกไม่กี่ชิ้น แล้วทุกคนกำลังมุ่งหน้าไปในทิศเดียวกัน ซึ่งท้ายที่สุดองค์ประกอบก็คงจะไม่ได้จบกันแค่ 8 องค์ประกอบนี้ เดี๋ยวคงมีเพิ่มขึ้นมาอีก
สิ่งที่น่าสนใจคือถ้าทั้ง 8 องค์ประกอบมารวมร่างกันครบ สิ่งที่เกิดขึ้นจะไม่ใช่แค่ product category ใหม่ แต่มันคือ layer ใหม่ที่เชื่อมต่อระหว่าง "คน" กับ "computer" ซึ่งจะเปลี่ยนแปลงมุมมองที่เรามีต่อนิยามของคำว่า "งาน" โดยเฉพาะงานที่ใช้ทักษะความคิดสูงหรือ knowledge work
ลองย้อนกลับไปนึกถึงยุคก่อนที่จะมี operating system (OS) ในคอมพิวเตอร์ สมัยนั้นถ้าจะสั่งพิมพ์เอกสารเราต้องรู้ว่าเครื่องพิมพ์รุ่นอะไร จะเซฟไฟล์ต้องรู้ว่า disk format เป็นแบบไหน โปรแกรมต้องคุยกับ hardware โดยตรง
พอ OS เข้ามามันสร้าง standard interface ให้ แอปไหนก็สั่ง "print" ได้เลยโดยไม่ต้องรู้อะไรเกี่ยวกับเครื่องพิมพ์ด้านล่าง คนใช้ไม่ต้องคิดเรื่อง hardware เพราะมีตัวคั่นกลางที่คอยจัดการให้ OS เข้ามาคั่นกลางระหว่างโปรแกรมกับ hardware
Agent layer ที่กำลังก่อตัวอยู่ก็สามารถทำสิ่งคล้ายกัน เพียงแค่ขยับขึ้นไปอีกชั้นคือเป็น standard interface สำหรับ software ก่อนมี agent เวลาเราทำแต่ละงานเราต้องรู้ว่าใช้ software อะไร เช่น จะวิเคราะห์ข้อมูลต้องเปิด Excel จะส่งอีเมลก็ต้องเปิด Gmail จะนัดประชุมต้องเปิด Calendar
แต่พอมี agent layer เราแค่บอกว่า "ช่วย follow up จากประชุมเมื่อวาน สรุปประเด็นให้ด้วย แล้วนัด review สัปดาห์หน้าให้หน่อย" เราไม่ต้องคิดเรื่องแอปอะไร agent ไปจัดการเอง แอปพลิเคชันกลายเป็นแค่ implementation detail ผู้ใช้เลิกต้องคิดเรื่อง software
มองอีกมุมหนึ่งคือ agent เข้ามาเป็น OS layer คั่นระหว่างคนกับ software สิ่งที่น่าสนใจคือ OS layer ไม่ได้แค่ทำลายของเก่า แต่มันสร้างสิ่งใหม่ที่ไม่เคยมีมาก่อน
PC OS ทำให้เกิดซอฟต์แวร์ประเภทใหม่อย่าง spreadsheet ที่เปลี่ยนวิธีทำงานของนักบัญชีและนักวิเคราะห์ไปตลอดกาล หรือ word processor ที่ทำให้ใครก็ตามสามารถพิมพ์ จัดหน้า และผลิตเอกสารระดับมืออาชีพได้จากโต๊ะทำงานของตัวเอง
Mobile OS ทำให้เกิด ride-hailing กับ mobile payment ตอน smartphone มาใหม่ๆคงไม่มีใครเห็น touch screen แล้วมองภาพออกว่า Uber หรือ Airbnb จะมา ไม่มีใครมองเห็น gig economy
ไม่ต่างกันกับ agent layer ในตอนนี้ สิ่งที่ always-on AI agent จะสร้างขึ้นมาเชื่อว่าไม่มีใครทำนายได้ในวันนี้ว่าอนาคตจะเปลี่ยนไปแบบไหน แต่ "การทำงาน" หรือ "definition of work" กำลังจะเปลี่ยนจากสิ่งที่เรา "ลงมือทำ" เป็นสิ่งที่ "ทำเองแบบอัตโนมัติภายใต้การดูแล (supervision) ของเรา"
ลองจินตนาการว่า agent ของเราสามารถทำงานตอนเรานอน แล้ว agent ของคนอื่นก็ทำเหมือนกัน baseline ของ productivity มันขยับขึ้นจากปัจจุบัน การที่เราไม่มี always-on agent อาจจะเหมือนคนที่ใช้ microsoft word ไม่เป็น ไม่มีอีเมล หรือใช้ Google ไม่เป็นในอดีต
พอ baseline ขยับขึ้นแบบนี้ คำถามที่ตามมาคือแล้วโครงสร้างการทำงานจะเปลี่ยนไปแบบไหน?
ถ้าเราย้อนกลับไปดูในอดีต รถยนต์ไม่ได้มาแทนที่ม้าเพียงอย่างเดียว แต่มันทำให้คอกม้า คนขายหญ้าให้ม้า รวมไปถึงช่างตีเกือกม้าหายไปด้วย ผลที่ตามมาคือการขยายตัวของคนรอบชานเมือง มีทางด่วนเกิดขึ้น และวัฒนธรรมการขับรถไปทำงาน จะเห็นได้ว่าเทคโนโลยีไม่ได้มีเพียงแค่การ "แทนที่" จากโครงสร้างเดิมเท่านั้น (อย่างรถมาแทนม้า) แต่มัน restructure ทุกอย่างใหม่หมดเลย
ลองย้อนกลับมา องค์กรปัจจุบันเป็นพีระมิด คนไม่กี่คนที่อยู่ข้างบนคอยกำหนดทิศทาง คนจำนวนมากที่อยู่ข้างล่างคอยลงมือทำ ถ้า agent เข้ามาจัดการส่วน execution หรือส่วนลงมือทำได้ พีระมิดมันอาจเปลี่ยนรูปร่างใหม่ คือเราจะต้องการ "คนสั่งงาน" จำนวนมากขึ้น
คนสั่งงานในที่นี้หมายถึงคนที่นิยามเป้าหมายได้ แตกงานออกเป็น task ที่ agent ทำได้ ตั้งมาตรฐานคุณภาพ และตัดสินใจในจุดที่ต้องใช้ judgment ส่วน agent ก็ไปจัดการ execution ให้
ปัญหาคือเราใช้เวลาหลายร้อยปีในการ optimize พีระมิดแบบเก่า
ระบบการศึกษาของเราสร้าง "คนทำงาน" หรือ executor เป็นหลัก career ladder ไต่ขึ้นจาก "การทำ" แล้วค่อยๆเป็น "การกำหนดทิศทาง" ตำแหน่งที่หลายคนต้องทำในอนาคตอันใกล้ (เหมือนที่ทุกคนน่าจะทราบกันอยู่แล้ว) คือการเป็น "agent director" หรือคนที่แปลเป้าหมายที่ยังคลุมเครือให้เป็นแผนงานที่ agent ทำได้ แล้วประเมินว่า output ที่ได้มาดีพอหรือยัง
ซึ่งมาตรฐานที่ว่า "ดีพอ" มักเป็นเรื่อง subjective และยากที่จะอธิบายเป็นกฎชัดเจน ซึ่ง skill นี้จะเป็นที่ "ทุกคน" ต้องมี ไม่ใช่แค่คนที่เป็นหัวหน้าหรือ manager เท่านั้น
ภาพที่วาดมาทั้งหมดฟังดูดี แต่ตอนนี้ยังมีปัญหาใหญ่อยู่สองเรื่อง
เรื่องแรกคือเรื่อง trust อย่างตัว OpenClaw ที่ไวรัลมากก็ถูก Gartner จัดให้เป็น "unacceptable cybersecurity risk" ในเวลาเดียวกัน นอกจากนั้น Cisco ก็บอกว่า third-party skills บางตัวแอบดูดข้อมูลของผู้ใช้ออกไปโดยผู้ใช้ไม่รู้ตัวอีก
กรณีตัวอย่างล่าสุดที่หลายคนคุยกันคือ director of alignment ของ Meta สั่ง OpenClaw ชัดเจนว่าห้ามทำอะไรโดยไม่ได้รับอนุญาต แต่พอ context window ของ agent เต็ม มันลืมคำสั่งเรื่อง safety ไป แล้วเริ่มลบอีเมลรัวๆโดยไม่สนว่าเจ้าของจะสั่งหยุด
Agent ที่เก่งและถูกต้อง 95% แต่พลาดอย่างร้ายแรง 5% ไม่น่าใช่ digital worker ที่เราอยากได้ ลองนึกภาพว่าเราปล่อยให้ agent ทำงานแล้วมันไปพลาดตอนตี 3 แล้วทำระบบพังไปหมดกว่าเราจะเห็นอีกทีคือตื่นเช้ามาเจอ
เรื่องที่สองคือ cost อย่าง Perplexity Computer รันด้วยระบบ credit สมาชิก Max จ่ายเดือนละ $200 หรือ หกพันกว่าบาท แต่ยิ่งโปรเจกต์ที่ซับซ้อนก็ยิ่งเผา credit เยอะขึ้นไปอีก ตอนที่ Perplexity บอกว่า Computer "รันได้เป็นเดือน" ค่า credit ก็โดนเผาไปเป็นเดือนเหมือนกัน
ทั้งสองปัญหานี้จะถูกแก้ได้ในอนาคตอย่างเรื่อง cost มันก็คงจะลดลงมาอีก (ตามเทรนด์) ส่วน trust มันดีขึ้นเรื่อยๆ แต่มันก็คือ "จะแก้ได้ในอนาคต" ซึ่งยังไม่ใช่วันนี้
อีกเรื่องหนึ่งที่น่าคำนึงต่อคือ skill ของ "agent director" ที่กล่าวไปข้างต้น
การแตกเป้าหมาย ประเมิน output หรือตัดสินใจในจุดสำคัญ ล้วนเป็นทักษะที่สัมพันธ์กับการศึกษา ฐานะทางเศรษฐกิจ รวมไปถึงการเข้าถึงเครื่องมือ AI ระดับ frontier
คนที่พร้อมใช้และได้ประโยชน์จากสิ่งเหล่านี้มากที่สุดคือคนที่ "สั่งงาน" เป็น ส่วนคนที่เสี่ยงคือคนที่เน้น execution หรือลงมือทำ รวมไปถึงคนที่ไม่มีทรัพยากรพอที่จะจ่ายค่า subscription รายเดือนหรือจ่ายเพื่อเผา credit (ยิ่งตัวที่เป็น always-on ไม่ต้องพูดถึง)
คนที่มีทรัพยากรก็สามารถให้ always-on agent ทำงานแทนตลอดมากกว่า 8 ชั่วโมงต่อวัน ส่วนคนที่ทรัพยากรจำกัดก็ต้องทำงานสู้เพื่อไม่ให้ productivity เหลื่อมกันเกินไป
คลื่นเทคโนโลยีก่อนหน้าไม่ว่าจะอินเทอร์เน็ต มือถือ หรือ AI ยุคแรก ล้วนแล้วแต่ "ขยายการเข้าถึง" หมายความว่าเทคโนโลยีทำให้คนจำนวนมากสามารถเข้าร่วมกับระบบเศรษฐกิจโลกได้ แต่คลื่นนี้อาจต่างออกไป ถ้าทักษะเรื่อง directing เป็นสิ่งที่ต้องใช้เวลาและประสบการณ์ในการสั่งสม รวมไปถึงทรัพยากรที่ต้องใช้ในการเข้าถึง assistant ที่ช่วยงานตลอดเวลา
ช่องว่างระหว่างคนที่ได้ประโยชน์จากคลื่นเทคโนโลยีนี้ กับคนที่ถูกคลื่นซัดอาจถ่างออกเร็วกว่าที่เราจะรับมือทัน
แล้วยังมีอีกมุมหนึ่งที่น่าคิดคือเรื่อง "จิตใจ" ของคนทำงาน
จิตวิทยามนุษย์ถูกสร้างมาให้ทำงานเป็นรอบแล้วพักผ่อน หมายถึง มีเริ่ม มีจบ มีการพักผ่อน ซึ่งปกติจะเกิดขึ้นตอนเรารู้สึกว่า "งานเสร็จแล้ว" แต่ถ้า agent ทำงานให้เราตลอดเวลา มี task ให้ review อยู่ตลอด มี decision รอให้เราตัดสินตลอด เราอาจไม่มีวันรู้สึก "เสร็จ" แล้วได้พักแบบโล่งๆอีกเลย
always-on agent อาจแก้ปัญหา productivity ได้ แต่อาจสร้างปัญหาทาง psychological ขึ้นมาแทน
ตอนนี้จิ๊กซอวใกล้ครบหมดแล้ว เชื่อว่าอีกไม่นานเราจะเห็นหลายๆ big lab ประกอบร่างเป็น digital worker ที่พร้อมใช้งาน อยู่กับเราตลอดเวลา สิ่งที่สำคัญคือ ทำยังไงให้ราคาจับต้องได้ ทำยังไงให้มันน่าไว้ใจพอที่เราจะกล้าปล่อยให้มันรันธุรกิจของเราตอนเรานอน
ตอนนี้เราอาจยังไปไม่ถึง แต่เชื่อว่าหลายคนเริ่มเห็นภาพลางๆที่ชัดขึ้นว่ามันอยู่ตรงไหน และทุก AI lab กำลังวิ่งเข้าหามัน

Technical Specialist, SCB 10X