به گزارش روابط عمومی پژوهشگاه فرهنگ و اندیشه اسلامی، نشست علمی “استخراج مدل سهبعدی بدن انسان از عکسهای ورودی دو بعدی، و تولید تصاویر دو بعدی از زوایای جدید (۳D Body Modeling and Novel View Synthesis from 2D Input Images)” با ارائه دکتر احمد خواجهنژاد پژوهشگر پسادکتری دانشگاه بریتیش کلمبیا، کانادا، یکشنبه ۲۰ خرداد ماه ۱۴۰۳، به میزبانی مرکز رشد و نوآوری پژوهشگاه با همکاری مرکز تعاملات بینالمللی علم و فناوری و دانشگاه مجازی المصطفی به صورت برخط در اسکایروم برگزار شد.
دکتر خواجهنژاد تمام مقاطع تحصیلی را در ایران گذرانده و از یک سال گذشته برای پژوهش در موقعیت پسادکتری به کانادا رفته است. ایده ارائه وی ناشی از درخواست یک اپلیکیشن تناسب اندام برای تشخیص چربی بدن انسان کلید خورده است.
دکتر خواجهنژاد تصریح کرد که مدلسازی بدن انسان کاربردهای مختلفی میتواند داشته باشد. برای نمونه در انیمیشن مسأله تخمین حالت انسان (pose estimation) مطرح است که ابتدا به کمک مدلسازی تشخیص حالت اتفاق میافتد و این حالت به یک سری آواتار و مدلهای انیمیشنیی تبدیل میشود که فرآیندهای خاص خودش را دارد. نمونه دیگر برای پروفایل است که اگر فرد بخواهد آواتار سهبعدی بگذارد به این تخمین نیاز دارد. همچنین برای مبحث واقعیت مجازی (virtual reality) اگر کسی بخواهد با کسی آن سوی دنیا به صورت مجازی بهتر ارتباط برقرار کند و صحبت کند، نیاز به مدل سهبعدی دارد. در ورزش و سلامت مقوله تشخیص چربی بدن (body fat distinction) مطرح است که میتوان از شکل و فرم بدن، ابعاد دور شکم و بازو را حدس زد که چقدر چربی دارد و بر همین اساس توصیههای ورزشی و تغذیهای انجام میشود. علاوه بر اینها در صنعت لباس آدمها جلوی دوربین میایستند و تصویرشان را نشان میدهند که لباس مناسب برای اندام هرکسی شبیهسازی شود.
این پژوهشگر اذعان داشت: در مسائل تشخیص ابعاد بدن معمولا ابعاد مفصلهای بدن و فواصل آن با یکدیگر مانند مچ پا تا مچ دست مهم است. در برخی موقعیتها پژوهشگران سعی میکنند حالتهای مختلف مفاصل دست و پا را پردازش کنند. این موضوع در فضای دوبُعدی حل شده ولی در سهبعدی بخواهیم محل مفاصل را در فضای سهبعدی در نظر بگیریم کار اندکی دشوار میشود. البته به فاکتورهای مختلفی بستگی دارد که این مدل درست اسکن شود؛ ممکن است دوربینها کم و زیاد باشد، یا در حالتی که دوربین مستقیم روبروی صورت شحص وجود ندارد و مثلا روی سرش نصب شده شرایط متفاوت میشود.
دکتر خواجهنژاد در ادامه افزود: یک سری روشهایی برای مدلسازی تصاویر هست که پژوهشگران در این سالها سعی کردند آن را به انسان تعمیم بدهند. در مدل نِرف ما ۶ تا عکس داریم که ماشین آنها را در ۶ زاویه میسازد؛ اما درباره انسان یک سوژه داریم که یک دوربین احتمالا بیشتر ندارد و به علاوه موقعیتهایش تغییر میکند. در کنار آن، انسان را یکی از اشیای مفصلبندیشده (articulated) مینامند که اهرمهایی در پیکرۀ خود دارد و نقاطی را به هم متصل میکند. در مدلی که ما در نظر داریم، ماشین ابتدائا از چند موقعیت در بدن سوژه انسانی و مفصلهایش در فضای سهبعدی مدل میدهد و بعد برای هر نقطه از این مدل، در سه جهت x-y-z به طوری که اشعه را شامل شود، موقعیت را محاسبه میکند. سپس برای هر نقطه موقعیت نقطه را در نسبت با ۱۷ مفصل در نظر میگیرد و آن را با مدلهای نِرف و MLP مدل میکند.
در پایان پرسشهای شرکتکنندگان مطرح شد و ارائهدهنده در یکی از پرسشها که آیا این ایده به محصول یا خدمت مشخصی رسیده گفت که با پروژۀ فلِکس (Flex) کار کرده است ولی ماژول وی هنوز وارد سیستم نشده است؛ لذا هنوز خدمت و محصول مشخصی هماکنون نیست، ولی اگر طرح تحقیقاتی دانشگاهی وی تکمیل شود برای اپلیکیشنهای مختلف کاربرد دارد. مسئله این ایده از منظر حکمرانی و عمومیسازی و شخصیسازی استفاده از مهارتهای تغذیهای و ورزشی با تأکید بر چت جیپیتی نیز بخش پایانی پنل پرسش و پاسخ بود.