چالش های تحلیل افکار عمومی با استفاده از کلان‌داده شبکه‌های اجتماعی

به گزارش اداره روابط عمومی و اطلاع‌رسانی پژوهشگاه فرهنگ و اندیشه اسلامی، سلسله نشست های آزمایشگاه علوم اجتماعی محاسباتی با موضوع “چالش های تحلیل افکار عمومی با استفاده از کلان‌داده شبکه‌های اجتماعی” دوشنبه ۲۰ دی ماه ۱۴۰۰ توسط هسته آزمایشگاه علوم اجتماعی محاسباتی، هسته مشترک مرکز رشد و نوآوری پژوهشگاه فرهنگ و اندیشه اسلامی و مرکز پژوهش‌های مجلس شورای اسلامی برگزار شد.

دکتر حسین رحمانی تحلیلگر و داده‌کاو کلان‌داده شبکه‌های اجتماعی و پژوهشگر علوم اجتماعی شناختی ارائه دهنده این نشست بود.

دکتر رحمانی در این نشست در بخش اول به چالش های پیش روی داده کاوی در ایران با توجه ظرافت های زبان فارسی پرداخت و اشاره کرد: «از آنجا که زبان برنامه نویسی در دنیا بر روی زبان انگلیسی پیاده شده است، بنابراین ما در داده کاوی زبان فارسی با چالش های زیادی مواجه هستیم. برای مثال ماشین داده کاوی به هیچ عنوان منظور مفاهیم کنایه ای در زبان فارسی را نمی تواند شناسایی کند و دائما از این طریق به اشتباه خواهد افتاد.»

ایشان در ادامه با مطرح کردن این چالش ها به مسئله نمونه جامعه آماری موجود در فضای مجازی پرداخت و معتقد بود نمونه های انتخابی در داده کاوی مجموعه های داخلی بسیار پایین تر از حد بین المللی است و عملا از استانداردهای لازم برخورد نیست.

در بخش دوم دکتر رحمانی به ارائه آماری کلی از پلتفرم های مجازی پرطرفدار در کشور پرداخت و محدودیت های هر کدام را در داده کاوی بیان نمودند. در بخشی از صحبت ها ایشان معتقد بودند که پلتفرمی مانند توئیتر با توجه به اقتضائیاتش و لشکرهای سایبری که در آن وجود دارد به هیچ وجه نمی تواند نماینده افکار عمومی باشد و با تحلیل پست های توئیتر نمی توان نظر کلی مردم را در موضوعات مختلف به دست آورد.

همچنین در پلتفرم اینستاگرام هم با توجه به محدودیت ها و سیاست های امنیتی که این شرکت در نظر گرفته است نیز داده کاوی با مشکل مواجه است. عمده کاربران این پلتفرم مصرف کننده و توزیع کننده محتوای تولید شده در این شبکه هستند و عمده صفحات شخصی نیز پرایوت هستند که به محتوای آنها نمی توان دسترسی داشت. پس تنها منبع موجود از افکار عمومی کامنت های زیر پست های صفحات مرجع می باشد که این کامنت ها نیز با توجه به سوگیری های صفحات پر مراجع و مخطبان مشخصی که دارند نمی تواند نمونه گیری مطلوبی به حساب آید. در ضمن این که باز هم مشکل فهم کنایه ها و تحلیل احساسات در زبان فارسی در این جا نیز پابرجاست.

به طور کلی در این نشست سعی شد طرح بحثی در این رابطه صورت گیرد تا امید باشد دامنه بحث در جهت ارتقا و رفع محدودیت های موجود در محیط داده کاوی کشور با ابزار نوآوری گسترش یافته و منشأ اثر واقع شود. واضح است که مسیری که این بحث می گشاید پهن دامنه و پرچالش خواهد بود و چالش های علمی همواره منجر به رشد علمی خواهند شد.