4 Min

ไม่ใช่แค่ Midjourney แต่ 2022 คือปีของ ‘AI วาดภาพ’

4 Min
2069 Views
11 Aug 2022

ช่วงต้นเดือนสิงหาคม 2022 ชาวไทยจำนวนมากได้เข้าไปเล่น ‘AI วาดภาพของ Midjourney ในแพลตฟอร์ม Discord ซึ่งหลักๆ แล้วทำงานด้วยการพิมพ์ /imagine ลงไปก่อน แล้วใส่คำสั่งให้มันวาดอะไรก็ได้ อยู่ที่จินตนาการของเรา (ส่วนใครอยากเข้าไปเล่น ก็ลองค้นตามเน็ตว่าเข้าไปยังไง มีทั้งข้อเขียนและวิดีโอสอนมากมาย)

Midjourney นั้นโด่งดังมาก จนหลายคนอาจลืมไปว่าในช่วงเดือนมิถุนายนปีนี้ก็เคยมี AI ที่ชื่อว่า Dall-E Mini ที่ดังในแวดวงคนเล่นเน็ตในต่างประเทศพอควร (แต่ในไทยไม่ดัง) และที่ Midjourney นั้นดังกว่า ส่วนหนึ่งก็เพราะภาพที่มันวาดออกมามันสวยกว่า และสามารถทำภาพให้ละเอียดขึ้น ขยายภาพใหญ่ ใช้เป็นภาพโปรไฟล์ได้ด้วย

เราอยากให้ลืมๆ อะไรพวกนี้ไปก่อน แล้วถอยมาดูภาพใหญ่ของปรากฏการณ์ ‘AI วาดภาพที่ ณ ตอนนี้น่าจะเรียกได้เต็มปากแล้วว่าเป็นเทคโนโลยีที่เกิดในสายตาของสาธารณชนประจำปีนี้

ตัวเทคโนโลยีนี้ชื่อทางการของมันคือ เทคโนโลยีแปลงข้อความเป็นภาพ’ (Text-to-Image) จริงๆ มันไม่ใช่เทคโนโลยีใหม่ แต่เป็นเทคโนโลยีตระกูล AI ที่พัฒนามาตั้งแต่คำว่า AI เริ่มฮิตนั่นแหละ และไอเดียพื้นฐานมันก็ไม่มีอะไรมากไปกว่าสร้างระบบ AI ให้เรียนรู้ภาพต่างๆ ในโลกนี้พร้อมคำบรรยายภาพ ให้มันเข้าใจของมันเองว่าคำว่าอะไรหมายถึงภาพอะไร และพอมันเรียนรู้ข้อความคู่กับภาพไปหลายล้านภาพ มันก็จะสามารถวาดภาพของมันเองจากคำสั่งที่เป็นข้อความของเรา

แล้วทำไมต้องเป็นปี 2022? เหตผลแรกก็คือ เทคโนโลยีมันพร้อมแล้ว และราคาการประมวลผลมันเริ่มถูกพอที่คนทั่วไปจะเข้าถึงได้นั่นเอง

ต้องเข้าใจก่อนว่าเทคโนโลยีพวกนี้ ในทางทฤษฎีมันทำได้นานแล้ว แต่ปัญหาคือต้นทุนการประมวลผลมันสูงมาก ฮาร์ดแวร์และอัลกอริธึมรุ่นเก่าๆ อาจทำให้ราคาการประมวลผลภาพภาพหนึ่งสูงเกิน 1,000 บาท ซึ่งต่อให้มันทำได้ในทางเทคโนโลยี  แต่คงไม่มีใครบ้าจี้เอามาแจกฟรีให้เราเล่นแน่ๆ แต่ในปี 2022 นี้เอง เทคโนโลยีแบบนี้มันมีต้นทุนที่ถูกพอที่จะให้เราลองใช้ฟรีได้แล้ว

ซึ่งถ้าใครติดตาม ก็จะรู้ว่าจริงๆตัวเปิดมันคือ AI ที่ชื่อว่า Dall-E 2 ของทาง OpenAI ซึ่งตัวนี้ทาง OpenAI พัฒนามาจากตัว AI พื้นฐานตัวล่าสุดอย่าง GPT-3 และถ้าจะอธิบายให้เข้าใจง่ายๆ ก็คือ GPT-3 เป็น AI ที่ถูกสร้างมาให้ทำได้หลายอย่าง แต่การเอามันมาฝึกให้วาดภาพโดยเฉพาะ มันเลยออกมาเป็น Dall-E 2

Dall-E 2 เปิดตัวไปเมื่อเดือนเมษายน 2022 และคนที่ได้รับคำเชิญเท่านั้นที่ใช้ได้ ซึ่งทุกคนประทับใจสุดๆ เพราะความเหมือนจริงของภาพจาก Dall-E 2 นั้นบ้าคลั่งมากๆ มันสามารถสั่งวาดภาพคน สัตว์ สิ่งของ และสถานที่ ที่ไม่มีอยู่จริงได้ และเป็นภาพเหมือนจริงเลยไม่ใช่ภาพศิลปะแบบ Midjourney

ซึ่งหลังจาก Dall-E 2 เปิดตัวไม่นาน มีคนเอา Dall-E รุ่นเก่ามาพัฒนาให้คนทั่วๆ ไปเข้าเล่นได้ฟรี ซึ่งฮิตกันในเดือนมิถุนายนที่ผ่านมา มันก็เลยทำให้เทคโนโลยีนี้คนเริ่มรู้จักแพร่หลายไปอีก (ตอนนี้เขาย้ายแพลตฟอร์มไปที่ https://www.craiyon.com/ ซึ่งก็น่าจะเป็นเจ้าเดียวที่ยังสั่งให้มันวาดภาพได้ไม่จำกัดครั้งต่อวัน)

ผลของการเปิดตัวของสิ่งเหล่านี้ หลักๆ มันทำให้บริษัทอื่นๆ ที่พัฒนาเทคโนโลยีแบบนี้มาเหมือนกันอยู่เฉยไม่ได้ ต้องประกาศตัวบ้าง ไม่งั้นคนจะนึกว่ามีแต่ OpenAI ที่ทำ และนี่เป็นเหตุผลที่ทำให้ในเดือนมิถุนายนทาง Google ประกาศตัว AI ชื่อ Imagen และทำให้ Midjourney เริ่มไปเปิดตัวโดยการทำภาพปกให้นิตยสาร The Economist พร้อมได้ลงเรื่องเป็นฟีเจอร์ โดยทาง OpenAI ก็ไม่ได้น้อยหน้า ได้ไปทำปกให้นิตยสาร Cosmopolitan ในเดือนเดียวกัน

เรียกได้ว่าไม่มีใครยอมใคร และที่น่าสนใจคือ ตอนแรกมันไม่มีใครให้ลองโปรแกรมตัวเต็มแบบที่ไม่ต้องมีคำเชิญแบบเฉพาะ จะมีแต่ Midjourney นี่แหละ ที่ให้คนทั่วไปเข้าไปลองใช้โปรแกรมตัวเต็ม (แต่ลองได้จำกัด) และผลก็คือเวิร์ค คนทั่วไปที่ได้เล่นประทับใจกัน โดย Midjourney ก็ฉลาดพอที่จะทำให้มันยากนิดนึงในการเข้าใช้ คือต้องสมัคร Discord ก่อนและเข้าไปคลิกๆ คลำๆ ว่าจะเล่นยังไง เพราะถ้ามันง่ายระดับเข้าหน้าเว็บแล้วพิมพ์ได้เลย ก็แทบจะรับประกันได้ว่าระบบล่มแน่นอน

แต่ถามว่ามีแค่นี้ไหม คำตอบคือมีอีกเพียบ ตัว AI ดังๆ ที่เขาว่าวาดภาพออกมาสวยอีกตัวก็คือ Disco Diffusion ซึ่งไม่เปิดให้ลองฟรี แต่คุณภาพของภาพที่ได้มาก็จะถูกเอามาเทียบกับ Dall-E 2 กับ Midjourney ตลอด และที่คงไม่กล่าวถึงไม่ได้เช่นกันก็คือ AI ของยักษ์เงียบอย่าง NVIDIA ที่ชื่อ GauGAHN2

โดยทั้งหมดนี้เราก็ยังไม่ได้พูดถึง AI วาดรูปของเจ้าอื่นๆ ที่มีอีกมากมาย ที่มักให้ทดลองใช้ฟรีแบบจำกัดรายวัน แต่จะใช้เกินกว่านั้นต้องเสียเงิน พูดง่ายๆ ก็คือมันเป็นเทคโนโลยีที่มีเกลื่อนแล้ว และตอนนี้คือคนกำลังแย่งกันจะเป็นเจ้าของตลาด หรือให้ตรงกว่านั้นก็คือ จะแย่งกันให้คนสมัครเข้าไปใช้แบบเสียเงิน ซึ่งสนนราคาสมัครค่าบริการเจ้าหนึ่งๆ ต่อเดือนมันก็จะอยู่ราวๆ 300-1,000 บาท

ดังนั้นถ้าใครเล่น Midjourney แล้วไม่จุใจ หมดโควตาฟรี ก็อย่าเพิ่งไปเสียเงินเพราะเจ้าอื่นๆ ก็น่าจะทยอยเปิดตัวให้เราเล่นฟรีและลองฟรีในที่สุด ท่ามกลางการแข่งขันอันหนักหน่วงของเทคโนโลยีนี้

อ้างอิง