نوشته و ویرایش شده توسط مجله ی اسکوار
رباتی به نام «امو» (Emo) از احساسات و هیجانات انسان قبل از این که توسط صورت ابراز شوند، باخبر میبشود و همزمان با انسان ابراز احساسات میکند. این نوشته میتواند قدم بزرگی در جهت گسترش رباتهایی با تواناییهای ارتباطی گسترش یافتهتر باشد.
به نقل از New Atlas، پیشرفتها در مدلهای زبانی بزرگ (LLM) همانند ChatGPT گسترش رباتهایی را ممکن کرده است که در ارتباطات کلامی زیاد خوب می باشند. بااینحال، تعداد بسیاری از این رباتها تا این مدت در ربط غیرکلامی چالشهایی دارند؛ بهاختصاصی در پیشبینی و جواب مناسب به حالات چهره و احساسات انسان.
محققان آزمایشگاه ماشینهای خلاق دانشگاه کلمبیا، با آموزش سر ربات انساننمای آبی سیلیکونی خود به نام امو، به حل این چالش پرداختهاند. دلنشین آنکه این ربات لبخند افراد را پیشبینی میکند و به همان شکل جواب میدهد.
طراحی رباتی که به نشانههای غیرکلامی جواب میدهد شامل دو چالش است. اولین مورد تشکیل یک چهره رسا است که شامل سختافزار پیچیده و مکانیزمهای فعالسازی میبشود. دوم این که به ربات آموزش داده بشود که چه عباراتی را بهموقع بگوید تا طبیعی و واقعی بهنظر برسد.
امو چطور این چنین خصوصیتی دارد؟
امو امکان پذیر «فقط یک سر» بهنظر آید، اما شامل ۲۶ محرک است که تشکیل طیف وسیعی از حالات چهره را با جزئیات گوناگون مقدور میکند. دوربینهای با وضوح بالا در هر دو مردمک، ایمو را قادر میسازد تا تماس چشمی را برای ربط غیرکلامی ملزوم برقرار کند. برای آموزش این که ایمو چطور حالات صورت را بسازد، محققان آن را در روبه رو دوربین قرار دادند و به آن اجازه دادند حرکات اتفاقی انجام دهد؛ همانند به تمرین عبارات گوناگون درحالیکه در آینه نگاه میکنیم. بعد از چند ساعت، امو آموخت که چه دستوراتی مربوط به حالات صورت را اجرا کند.
سپس به امو ویدیوهایی از حالات چهره انسان برای تجزیهوتحلیل فریم به فریم نشان داده شد. چند ساعت آموزش زیاد تر ضمانت کرد که این ربات میتواند حالات چهره افراد را با مشاهده تغییرات کوچک پیشبینی کند. امو نزدیک به ۸۴۰ میلیثانیه قبل از وقوع یک لبخند انسان را پیشبینی میکند و بهطور همزمان با یک لبخند جواب داد.
دسته بندی مطالب