เครือข่ายประสาท "เหนือมนุษย์" ของ Google สามารถบอกตำแหน่งของภาพใด ๆ ได้หรือไม่

$config[ads_kvadrat] not found

A day with Scandale - Harmonie Collection - Spring / Summer 2013

A day with Scandale - Harmonie Collection - Spring / Summer 2013
Anonim

ค้นหาภาพได้ง่ายกว่าที่เคย แต่ถ้าคุณกำลังพยายามหาภาพของบางสิ่งบางอย่างในสถานที่ที่ไม่ชัดเจนโดยสิ้นเชิง (ไม่ใช่ปิรามิดอียิปต์หรือรูปปั้นนิ้วโป้งยักษ์ในปารีส) มันยากกว่าที่คุณคิด - แม้จะมีข้อมูลตำแหน่งทางภูมิศาสตร์ตามสิ่งที่ ในภาพ

ป้อนวิศวกรของ Google ชื่อ Tobias Weyand และเพื่อนร่วมงานของเขา ตามบทความใหม่ในวารสาร arXiv (เด่นชัด“ เก็บถาวร”) ทั้งสามคนได้สร้างเครื่องเรียนรู้ลึกที่สามารถระบุตำแหน่งของภาพถ่ายเกือบทุกรูปแบบโดยอาศัยการวิเคราะห์พิกเซลของมันเท่านั้น

ในการทำให้เครื่องทำงานให้สำเร็จเช่นนี้คุณต้องให้ความสามารถในการหยั่งรู้ข้อมูลโดยยึดตามการมองเห็น คุณต้องการให้มันคิดเช่นเดียวกับมนุษย์

Weyand เริ่มเกี่ยวกับการพัฒนาโครงข่ายประสาทเทียม - ระบบกลไกที่ออกแบบมาเพื่อเลียนแบบเส้นทางประสาทของสมองซึ่งทำให้สามารถเรียนรู้ประมวลผลและเรียกคืนข้อมูลได้เหมือนมนุษย์ ระบบใหม่นี้ PlaNet เห็นได้ชัดว่ามีความสามารถเหนือกว่ามนุษย์ในการกำหนดตำแหน่งของภาพไม่ว่าการตั้งค่าจะเป็นแบบใดก็ตามไม่ว่าจะในที่ร่มหรือกลางแจ้งและมีภาพชี้นำที่ไม่เหมือนใคร

PlaNet worK อย่างไร Weyand และทีมของเขาแบ่งแผนที่โลกออกเป็นกริดที่วางรูปทรงเหมือน 26,000 ตารางในภูมิภาคต่างๆขึ้นอยู่กับจำนวนภาพที่ถ่ายในสถานที่เหล่านั้น สถานที่หนาแน่นที่มีการถ่ายภาพจำนวนมากให้พอดีกับสี่เหลี่ยมจัตุรัสเล็ก ๆ ในขณะที่พื้นที่ห่างไกลที่ใหญ่กว่าสามารถตัดเป็นสี่เหลี่ยมที่ใหญ่กว่าได้

ทีมงานได้สร้างฐานข้อมูลภาพขนาดใหญ่ที่มีตำแหน่งทางภูมิศาสตร์อยู่แล้วเกือบ 126 ล้านรูป มีการใช้ชุดข้อมูลประมาณ 91 ล้านชุดเพื่อสอน PlaNet ถึงวิธีการคิดว่าจะวางรูปภาพใดในตารางบนแผนที่โลก

จากนั้นเครือข่ายประสาทเทียมได้รับมอบหมายให้ทำหน้าที่ระบุตำแหน่งทางภูมิศาสตร์อีก 34 ล้านภาพจากฐานข้อมูล ในที่สุด PlaNet ถูกตั้งค่าไว้ที่ชุดข้อมูลขนาด 2.3 ล้านภาพที่ติดแท็กตำแหน่งจาก Flickr

ผลลัพธ์หรือไม่ PlaNet สามารถระบุประเทศต้นทางได้ 28.4 เปอร์เซ็นต์ของภาพถ่ายและทวีป 48% นอกจากนี้ระบบสามารถระบุตำแหน่งระดับถนนได้ 3.6 เปอร์เซ็นต์ของภาพ Flickr และตำแหน่งระดับเมือง 10.1 เปอร์เซ็นต์

และ PlaNet นั้นดีกว่ามนุษย์มากที่สุด - แม้แต่นักเดินทางที่ยิ่งใหญ่ที่สุด Weyand ได้ทำการคัดเลือก 10 คนที่เดินทางเป็นอย่างดีเพื่อแข่งขันกับ PlaNet ในเกมติดฉลากตำแหน่งของภาพที่พบใน Google Street View

“ โดยรวมแล้ว PlaNet ได้รับรางวัล 28 จาก 50 รอบโดยมีข้อผิดพลาดการแปลเฉลี่ย 1131.7 กม. ในขณะที่ข้อผิดพลาดในการแปลเป็นค่ามัธยฐานของมนุษย์อยู่ที่ 2320.75 กม.” นักวิจัยเขียน “ สิ่งนี้ การทดลองขนาดเล็กแสดงให้เห็นว่า PlaNet มาถึงสมรรถนะเหนือมนุษย์ในการกำหนดตำแหน่งทางภูมิศาสตร์ของ Street View”

มันเป็นเรื่องจริงหรือ? วิศวกรของ Google ทำจริง ๆ เพียงแค่พัฒนา "เหนือมนุษย์" A.I. ระบบ?

เมื่อพูดถึงตำแหน่งทางภูมิศาสตร์ภาพอาจจะ และนั่นก็ไม่น่าแปลกใจเลย - จุดของ A.I ไม่ได้เป็นการเลียนแบบสมองของมนุษย์ในทุก ๆ ด้าน แต่เป็นการ จำกัด ข้อ จำกัด ของมนุษย์ในวิธีการเฉพาะสองสามอย่างเพื่อให้งานที่ยากขึ้นสำเร็จมากขึ้น ดังนั้นในแง่นั้นสิ่งที่นักวิจัยเขียนเป็นจริง

ถึงกระนั้นมันก็เป็นเรื่องที่จะเรียก PlaNet ว่าเป็น“ โครงข่ายประสาทเทียม” รูปแบบที่สมบูรณ์แบบของเทคโนโลยีประเภทนั้นจะสามารถเรียนรู้ได้มากกว่าตำแหน่งทางภูมิศาสตร์ของภาพ AI. ระบบมีความสามารถในการเขียน similes และการเล่น ซูเปอร์มาริโอ แต่นี่เป็นสิ่งเล็กน้อยเมื่อเทียบกับระบบ "ต้นแบบ" ในอุดมคติที่สามารถตรวจสอบและบำรุงรักษาระบบจัดการการขนส่งหรือโครงสร้างพื้นฐานด้านพลังงานและอื่น ๆ อีกมากมายโดยอัตโนมัติ

$config[ads_kvadrat] not found