ช่วงต้นเดือนสิงหาคม 2022 ชาวไทยจำนวนมากได้เข้าไปเล่น ‘AI วาดภาพ’ ของ Midjourney ในแพลตฟอร์ม Discord ซึ่งหลักๆ แล้วทำงานด้วยการพิมพ์ /imagine ลงไปก่อน แล้วใส่คำสั่งให้มันวาดอะไรก็ได้ อยู่ที่จินตนาการของเรา (ส่วนใครอยากเข้าไปเล่น ก็ลองค้นตามเน็ตว่าเข้าไปยังไง มีทั้งข้อเขียนและวิดีโอสอนมากมาย)
Midjourney นั้นโด่งดังมาก จนหลายคนอาจลืมไปว่าในช่วงเดือนมิถุนายนปีนี้ก็เคยมี AI ที่ชื่อว่า Dall-E Mini ที่ดังในแวดวง ‘คนเล่นเน็ต’ ในต่างประเทศพอควร (แต่ในไทยไม่ดัง) และที่ Midjourney นั้น ‘ดัง’ กว่า ส่วนหนึ่งก็เพราะภาพที่มันวาดออกมามัน ‘สวย’ กว่า และสามารถทำภาพให้ละเอียดขึ้น ขยายภาพใหญ่ ใช้เป็นภาพโปรไฟล์ได้ด้วย
เราอยากให้ลืมๆ อะไรพวกนี้ไปก่อน แล้วถอยมาดู ‘ภาพใหญ่’ ของปรากฏการณ์ ‘AI วาดภาพ’ ที่ ณ ตอนนี้น่าจะเรียกได้เต็มปากแล้วว่าเป็นเทคโนโลยีที่ ‘เกิด’ ในสายตาของสาธารณชนประจำปีนี้
ตัวเทคโนโลยีนี้ชื่อทางการของมันคือ เทคโนโลยี ‘แปลงข้อความเป็นภาพ’ (Text-to-Image) จริงๆ มันไม่ใช่เทคโนโลยีใหม่ แต่เป็นเทคโนโลยีตระกูล AI ที่พัฒนามาตั้งแต่คำว่า AI เริ่มฮิตนั่นแหละ และไอเดียพื้นฐานมันก็ไม่มีอะไรมากไปกว่าสร้างระบบ AI ให้เรียนรู้ภาพต่างๆ ในโลกนี้พร้อมคำบรรยายภาพ ให้มันเข้าใจของมันเองว่าคำว่าอะไรหมายถึงภาพอะไร และพอมันเรียนรู้ข้อความคู่กับภาพไปหลายล้านภาพ มันก็จะสามารถ ‘วาด’ ภาพของมันเองจากคำสั่งที่เป็นข้อความของเรา
แล้วทำไมต้องเป็นปี 2022? เหตผลแรกก็คือ เทคโนโลยีมันพร้อมแล้ว และ ‘ราคาการประมวลผล’ มันเริ่มถูกพอที่คนทั่วไปจะเข้าถึงได้นั่นเอง
ต้องเข้าใจก่อนว่าเทคโนโลยีพวกนี้ ในทางทฤษฎีมันทำได้นานแล้ว แต่ ‘ปัญหา’ คือต้นทุนการประมวลผลมันสูงมาก ฮาร์ดแวร์และอัลกอริธึมรุ่นเก่าๆ อาจทำให้ราคาการประมวลผลภาพภาพหนึ่งสูงเกิน 1,000 บาท ซึ่งต่อให้มัน ‘ทำได้ในทางเทคโนโลยี’ แต่คงไม่มีใครบ้าจี้เอามาแจกฟรีให้เราเล่นแน่ๆ แต่ในปี 2022 นี้เอง เทคโนโลยีแบบนี้มันมี ‘ต้นทุนที่ถูกพอ’ ที่จะให้เรา ‘ลองใช้’ ฟรีได้แล้ว
ซึ่งถ้าใครติดตาม ก็จะรู้ว่าจริงๆ ‘ตัวเปิด’ มันคือ AI ที่ชื่อว่า Dall-E 2 ของทาง OpenAI ซึ่งตัวนี้ทาง OpenAI พัฒนามาจากตัว AI พื้นฐานตัวล่าสุดอย่าง GPT-3 และถ้าจะอธิบายให้เข้าใจง่ายๆ ก็คือ GPT-3 เป็น AI ที่ถูกสร้างมาให้ทำได้หลายอย่าง แต่การเอามันมาฝึกให้ ‘วาดภาพ’ โดยเฉพาะ มันเลยออกมาเป็น Dall-E 2
Dall-E 2 เปิดตัวไปเมื่อเดือนเมษายน 2022 และคนที่ได้รับคำเชิญเท่านั้นที่ใช้ได้ ซึ่งทุกคนประทับใจสุดๆ เพราะความ ‘เหมือนจริง’ ของภาพจาก Dall-E 2 นั้นบ้าคลั่งมากๆ มันสามารถสั่งวาดภาพคน สัตว์ สิ่งของ และสถานที่ ที่ไม่มีอยู่จริงได้ และเป็น ‘ภาพเหมือนจริง’ เลยไม่ใช่ ‘ภาพศิลปะ’ แบบ Midjourney
ซึ่งหลังจาก Dall-E 2 เปิดตัวไม่นาน มีคนเอา Dall-E รุ่นเก่ามาพัฒนาให้คนทั่วๆ ไปเข้าเล่นได้ฟรี ซึ่งฮิตกันในเดือนมิถุนายนที่ผ่านมา มันก็เลยทำให้เทคโนโลยีนี้คนเริ่มรู้จักแพร่หลายไปอีก (ตอนนี้เขาย้ายแพลตฟอร์มไปที่ https://www.craiyon.com/ ซึ่งก็น่าจะเป็นเจ้าเดียวที่ยังสั่งให้มันวาดภาพได้ไม่จำกัดครั้งต่อวัน)
ผลของการเปิดตัวของสิ่งเหล่านี้ หลักๆ มันทำให้บริษัทอื่นๆ ที่พัฒนาเทคโนโลยีแบบนี้มาเหมือนกันอยู่เฉยไม่ได้ ต้องประกาศตัวบ้าง ไม่งั้นคนจะนึกว่ามีแต่ OpenAI ที่ทำ และนี่เป็นเหตุผลที่ทำให้ในเดือนมิถุนายนทาง Google ประกาศตัว AI ชื่อ Imagen และทำให้ Midjourney เริ่มไปเปิดตัวโดยการทำ ‘ภาพปก’ ให้นิตยสาร The Economist พร้อมได้ลงเรื่องเป็นฟีเจอร์ โดยทาง OpenAI ก็ไม่ได้น้อยหน้า ได้ไปทำปกให้นิตยสาร Cosmopolitan ในเดือนเดียวกัน
เรียกได้ว่าไม่มีใครยอมใคร และที่น่าสนใจคือ ตอนแรกมันไม่มีใครให้ลอง ‘โปรแกรมตัวเต็ม’ แบบที่ไม่ต้องมี ‘คำเชิญ’ แบบเฉพาะ จะมีแต่ Midjourney นี่แหละ ที่ให้คนทั่วไปเข้าไปลองใช้โปรแกรมตัวเต็ม (แต่ลองได้จำกัด) และผลก็คือเวิร์ค คนทั่วไปที่ได้เล่นประทับใจกัน โดย Midjourney ก็ฉลาดพอที่จะทำให้มัน ‘ยาก’ นิดนึงในการเข้าใช้ คือต้องสมัคร Discord ก่อนและเข้าไปคลิกๆ คลำๆ ว่าจะเล่นยังไง เพราะถ้ามันง่ายระดับเข้าหน้าเว็บแล้วพิมพ์ได้เลย ก็แทบจะรับประกันได้ว่าระบบล่มแน่นอน
แต่ถามว่ามีแค่นี้ไหม คำตอบคือมีอีกเพียบ ตัว AI ดังๆ ที่เขาว่าวาดภาพออกมาสวยอีกตัวก็คือ Disco Diffusion ซึ่งไม่เปิดให้ลองฟรี แต่คุณภาพของภาพที่ได้มาก็จะถูกเอามาเทียบกับ Dall-E 2 กับ Midjourney ตลอด และที่คงไม่กล่าวถึงไม่ได้เช่นกันก็คือ AI ของ ‘ยักษ์เงียบ’อย่าง NVIDIA ที่ชื่อ GauGAHN2
โดยทั้งหมดนี้เราก็ยังไม่ได้พูดถึง AI วาดรูปของเจ้าอื่นๆ ที่มีอีกมากมาย ที่มักให้ทดลองใช้ฟรีแบบจำกัดรายวัน แต่จะใช้เกินกว่านั้นต้องเสียเงิน พูดง่ายๆ ก็คือมันเป็นเทคโนโลยีที่มีเกลื่อนแล้ว และตอนนี้คือคนกำลังแย่งกันจะเป็นเจ้าของตลาด หรือให้ตรงกว่านั้นก็คือ จะแย่งกันให้คน ‘สมัคร’ เข้าไปใช้แบบเสียเงิน ซึ่งสนนราคาสมัครค่าบริการเจ้าหนึ่งๆ ต่อเดือนมันก็จะอยู่ราวๆ 300-1,000 บาท
ดังนั้นถ้าใครเล่น Midjourney แล้วไม่จุใจ หมดโควตาฟรี ก็อย่าเพิ่งไป ‘เสียเงิน’ เพราะเจ้าอื่นๆ ก็น่าจะทยอยเปิดตัวให้เราเล่นฟรีและลองฟรีในที่สุด ท่ามกลางการแข่งขันอันหนักหน่วงของเทคโนโลยีนี้
อ้างอิง
- Vice. Inside Midjourney, The Generative Art AI That Rivals DALL-E. https://bit.ly/3SDvY4v
- The Economist. How a computer designed this week’s cover. https://econ.st/3SFfc52
- Cosmopolitan. The World’s Smartest Artificial Intelligence Just Made Its First Magazine Cover. https://bit.ly/3BSI9V9
- The Economist. Huge ‘foundation models’ are turbo-charging AI progress. https://econ.st/3BY0IYp
- Dall-E 2. https://openai.com/dall-e-2/
- Midjourney. https://www.midjourney.com/
- Imagen. https://imagen.research.google/
- Weird Wonderful AI Art. Getting Started with Disco Diffusion. https://bit.ly/3vPSTzU
- NVIDIA. ‘Paint Me a Picture’: NVIDIA Research Shows GauGAN AI Art Demo Now Responds to Words. https://bit.ly/3PbBnNi
- MUD. 5 Best Free AI Text to Art Generators to Create an Image From What You Type. https://www.makeuseof.com/ai-text-to-art-generators/