AI Neural Network จาก Nvidia สร้างภาพปลอมแบบสมจริง

$config[ads_kvadrat] not found

เวก้าผับ ฉบับพิเศษ

เวก้าผับ ฉบับพิเศษ
Anonim

ภาพบนสุดดูเหมือนภาพทั่วไปของถนนธรรมดาที่ถ่ายจากกล้องลูกเบี้ยวหรือจากคนที่โง่พอที่จะเดินเข้าไปในถนนเพื่อถ่ายภาพฉากธรรมดา ๆ

แต่มองใกล้หน่อย สังเกตว่าสัญญาณไฟจราจรบิดเบี้ยวเล็กน้อยหรือว่ารถยนต์บางคันดูเหมือนจะคลุมเครือ มีบางอย่างผิดปกติที่นี่ นี่ไม่ใช่ภาพถ่ายเลย มันเป็นภาพที่สร้างโดย A.I ทั้งหมด

นักวิทยาศาสตร์คอมพิวเตอร์จาก บริษัท เทคโนโลยี Nvidia และ University of California, Berkeley ได้เขียนรายงานการวิจัยซึ่งมีให้พิมพ์ไว้ใน arXiv โดยมีรายละเอียดว่าพวกเขาสามารถสร้างโครงข่ายประสาทเทียมเพื่อสร้างภาพถนนจริงและภาพคนได้อย่างไร พวกเขารวมอินเทอร์เฟซผู้ใช้ที่ช่วยให้คุณปรับแต่งรูปภาพตามที่คุณต้องการด้วยการเพิ่มใบไม้พิเศษหรือเปลี่ยนสภาพอากาศ

“ เกมกำลังเติบโตอย่างรวดเร็วเพราะผู้คนชอบที่จะมีปฏิสัมพันธ์กันในสภาพแวดล้อมเสมือนจริง” Ming-Yu Liu นักวิทยาศาสตร์อาวุโสของ Nvidia กล่าว ผกผัน ในอีเมล “ อย่างไรก็ตามการสร้างโลกเสมือนจริงนั้นมีราคาแพงด้วยเทคโนโลยีของวันนี้เพราะมันต้องการศิลปินในการสร้างแบบจำลองและจำลองพื้นผิวและแสงสำหรับโลกที่พวกเขากำลังสร้างอย่างชัดเจน ด้วยการแปลแบบภาพต่อภาพเราสามารถลองชิมโลกแห่งความจริงเพื่อสร้างโลกเสมือนจริง"

โครงข่ายประสาทเทียมเป็นคอมพิวเตอร์ที่จำลองแบบการทำงานเหมือนสมองมนุษย์โดยรับข้อมูลนำไปใช้และเรียนรู้จากผลลัพธ์ การวิจัยนี้ใช้อวนประสาทพิเศษชนิดที่ Ian Goodfellow นำมาใช้ในปี 2014 เรียกว่าเครือข่ายผู้ไม่หวังดี (Generative Adversarial Networks) หรือ GANs ซึ่งโดยทั่วไปประกอบด้วยเครือข่ายสองเครือข่ายเครื่องกำเนิดไฟฟ้าและเครื่องจำแนก

เครื่องกำเนิดไฟฟ้าจะได้รับภาพถ่ายและเริ่มสร้างภาพสังเคราะห์คล้ายกับภาพที่ได้รับ จากนั้นจะแสดงภาพที่ได้รับผสมและของปลอมต่อผู้เลือกปฏิบัติซึ่งมีหน้าที่แจ้งให้พวกเขาทราบ เมื่อกระบวนการนี้ดำเนินต่อไปเครื่องกำเนิดจะดีขึ้นในการเลียนแบบภาพต้นฉบับและผู้จำแนกก็จะดีขึ้นในการบอกความแตกต่าง ผลลัพธ์เป็นภาพที่น่าเชื่อและเป็นของปลอมโดยสิ้นเชิง

งานวิจัยนี้เป็นการสร้างแบบจำลอง GAN แบบดั้งเดิมโดยเพิ่มการแยกตัวกำเนิดและตัวแยกเครือข่ายออกเป็นสองเครือข่ายย่อยเพื่อให้ได้ภาพที่มีความละเอียดสูงขึ้น โครงข่ายใยประสาทเทียมนั้นสามารถถ่ายในแผนที่ความหมายหรือพิมพ์เขียวว่าภาพถ่ายควรมีลักษณะอย่างไรและเติมพื้นผิวด้วยตนเอง ผู้ใช้สามารถพิมพ์เขียวและเปลี่ยนแปลงสิ่งต่าง ๆ หากพวกเขาต้องการเพิ่มสิ่งปลูกสร้างแทนต้นไม้ในมุมมองถนนหรือทำให้ดวงตากว้างขึ้นในแนวตั้ง

กระดาษจะเปรียบเทียบผลลัพธ์กับการทดลองที่คล้ายกันโดยใช้วิธีนี้ซึ่งเป็นสิ่งที่น่าสังเกตมากที่สุดคือ pix2pix การศึกษาของ Nvidia และ UC Berkeley นั้นสามารถสร้างภาพที่มีรายละเอียดเล็ก ๆ และแม่นยำเหมือนป้ายทะเบียนที่ชัดเจนในขณะที่ pix2pix ให้ภาพที่ดูเหมือนภาพวาดสีน้ำ

ในขณะที่เครื่องมือนี้สามารถใช้ในการรับกรรม reddit ฟรีกับภาพถ่ายต่างประเทศสองสามรูป แต่ผู้เขียนเห็นว่ามีศักยภาพมหาศาลในการใช้วิธีการนี้เพื่อสร้างกราฟิกที่เหมือนจริงด้วยพิมพ์เขียวง่ายๆ

แรงงานที่ใช้ความอุตสาหะมาหลายร้อยชั่วโมงในการสร้างโลกเสมือนจริงสำหรับใช้ใน Google Maps ภาพยนตร์และวิดีโอเกม Liu กล่าวว่าโมเดลนี้สามารถใช้เป็นวิธีในการออกแบบให้เสร็จได้อย่างไม่ลำบากและจากนั้นเข้าไปในรายละเอียดในภายหลัง

“ แทนการเรนเดอร์โลกด้วยการสร้างแบบจำลองอย่างชัดเจนเราสามารถสร้างโลกโดยปริยายโดยใช้การแปลแบบรูปภาพต่อภาพเพื่อแปลระหว่างโมเดลที่เรียบง่ายของโลกที่ไม่มีพื้นผิวหรือแสงใด ๆ. ความสามารถนี้ควรทำให้ถูกกว่ามากในการสร้างโลกเสมือน” เขากล่าว ผกผัน.

สำหรับขั้นตอนต่อไปในการวิจัยนี้ทีมหวังที่จะสำรวจการแปลงวิดีโอเป็นวิดีโอซึ่งจะใช้อวนประสาทเพื่อสร้างวิดีโอที่สมจริง เป้าหมายที่ลุยกล่าวได้ท้าทายนักวิจัยในสาขานี้

ตอนนี้คุณรู้แล้วว่าสามารถสร้างภาพปลอมได้ง่ายเพียงใด อย่าเชื่อใจทุกสิ่งที่คุณเห็นบนรูปภาพของ Google

$config[ads_kvadrat] not found