ทำไมต้อง A.I. สามารถต่อสู้เพื่อทำความเข้าใจภาษาอาหรับ

$config[ads_kvadrat] not found

เวก้าผับ ฉบับพิเศษ

เวก้าผับ ฉบับพิเศษ
Anonim

ในโลกของปัญญาประดิษฐ์ข้อมูลคือราชา ยิ่งคุณมีเครื่องมือของคุณจะยิ่งดีขึ้นเท่าที่ระบบสามารถ "เรียนรู้" ได้มากขึ้นเกี่ยวกับสิ่งที่คาดหวัง แต่ขึ้นอยู่กับแพลตฟอร์มเอเอ กำลังดึงข้อมูลจากบางภาษาอาจแสดงได้ดีกว่าภาษาอื่นตาม Miriam Redi นักวิทยาศาสตร์การวิจัยของ Yahoo Labs

“ ตัวอย่างเช่น Flickr ซึ่งเราใช้ข้อมูลจากบางภาษามีการแสดงน้อยมาก” Redi กล่าวในการประชุม Deep Learning Summit ที่กรุงลอนดอนเมื่อวันพฤหัสบดี “ ดังนั้นเราจึงมีภาษาอังกฤษภาพนับล้านสำหรับภาษาอังกฤษ แต่เราอาจมี 100,000 ภาพสำหรับภาษาอาหรับ”

ทีมของ Redi กำลังทำงานกับเครื่องมือที่สามารถระบุองค์ประกอบที่มองไม่เห็นในภาพเช่นค่าทางวัฒนธรรมและความหมายแฝงทางอารมณ์ เครื่องมือวิเคราะห์ข้อความที่แนบกับภาพที่มีต่อสาธารณะใน Flickr เมื่อเวลาผ่านไป A.I. เริ่มเข้าใจว่าทำไมใครบางคนอาจติดแท็กภาพ“ ปาร์ตี้ที่มีความสุข” หรือ“ ช่วงเวลาที่น่าอึดอัดใจ” แต่ความคิดเหล่านี้จะเติบโตอย่างแม่นยำมากขึ้นเมื่อเครื่องมือวิเคราะห์ภาพมากขึ้น

“ น่าเสียดายที่ความแม่นยำในการตรวจจับความเชื่อมั่นในภาพสำหรับภาษาอาหรับมีแนวโน้มที่จะลดลงเพราะเราไม่มีข้อมูลเพียงพอ” Redi กล่าว

ในภาษาที่มีข้อมูลจำนวนมากทีมของ Redi สังเกตเห็นรูปแบบที่น่าสนใจสองสามอย่าง ภาษาโรมานซ์อย่างฝรั่งเศสและสเปนมีแนวโน้มที่จะแสดงออกในทำนองเดียวกันในขณะที่อิตาลีดูเหมือนจะเป็นภาษาเดียวที่ผู้ใช้ระบุรูปภาพด้วยคำว่า "การหลีกเลี่ยงภาษี"

ปัญหาและอุปสรรคทางภาษายังคงเป็นปัญหาสำหรับ A.I นักวิจัย ทุกคนที่ใช้ Google แปลภาษาจะรู้ว่าการเปลี่ยนภาษานั้นไม่ง่ายอย่างที่คิด อย่างไรก็ตามการพัฒนาใหม่กำลังเปลี่ยนแปลงสิ่งต่าง ๆ ด้วย Facebook ประกาศช่วงฤดูร้อนนี้ว่ามันใกล้เข้ากับความฝันของเครือข่ายสังคมภาษาเดียวแปลข้อความโดยอัตโนมัติสำหรับผู้ใช้

การพัฒนาในการขจัดอุปสรรคด้านภาษาสามารถช่วยส่งเสริมการสื่อสารระหว่างประเทศ แต่สำหรับโครงการอย่าง Redi ไม่มีอะไรทดแทนได้อย่างแท้จริงสำหรับข้อมูลความเชื่อมั่นที่มนุษย์สร้างขึ้น

$config[ads_kvadrat] not found