به گزارش روابط عمومی پژوهشگاه فرهنگ و اندیشه اسلامی، ششمین جلسه از کارگاه “دانشافزایی هوش مصنوعی” با عنوان “دادههای ترکیبی، حریم خصوصی و توضیحپذیری و انصاف هوش مصنوعی” توسط هستههای حکمرانی فضای مجازی و حکمرانی و هوش مصنوعی مرکز رشد و خانه خلاق و نوآوری پژوهشگاه به صورت مجازی برگزار شد.
با توجه به تحولات شگرفی که توسط هوش مصنوعی در حوزههای مختلف بهوجود آمده است، هستههای حکمرانی فضای مجازی و حکمرانی هوش مصنوعی مرکز رشد و خانه خلاق و نوآوری پژوهشگاه فرهنگ و اندیشه اسلامی نشستهایی را تحت عنوان کارگاه دانشافزایی هوش مصنوعی برگزار مینمایند. ششمین جلسه از این کارگاه علمی- آموزشی که حول موضوع فناوری هوش مصنوعی بود، در تاریخ یکشنبه ۷ آبانماه سال جاری با ارائه جواد عبادی دکتری فیزیک ذرات از پژوهشگاه IPM و مهندس داده در شرکت TELUS کانادا، با عنوان «دادههای ترکیبی، حریم خصوصی و توضیحپذیری و انصاف هوش مصنوعی» و با حمایت مرکز تعاملات بینالمللی علم و فناوری معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری و برگزار شد.
عبادی بحث خود را با توضیح درباره اطلاعات هویتی شخصی (Personally Identification Information) و حریم خصوصی آغاز کرد و به توضیح درباره هویتزدایی داده (Data Anonymization) پرداخت. در فرایند هویتزدایی عملیاتی بر روی داده انجام میشود که درنهایت هویت آن را از بین میبرد و دیگر معلوم نیست اطلاعات مربوط به چه شخصیتی است. پس از آن میتوان عملیات مختلفی برروی دادهها ازجمله بهاشتراکگذاشتن داده، تربیت کردن الگوریتمهای یادگیری ماشین بر روی داده، … را انجام داد.
مهندس شرکت تلاس درادامه به معضلات روشهای سنتی هویتزدایی اشاره کرد و گفت: اولا بصیرت (insight) را از دادهها میگیرد و ثانیا با گسترش وبسایتها اطلاعاتی که افراد دارای آن هستند، بسیار زیاد شد، مانند اینکه چه سایتهایی را میبینند، چه زمانهایی آنلاین میشوند، … . هویتزدایی با روش سنتی در این صورت میتوانست به حریم خصوصی آسیب بزند. بهعنوانمثال در سال ۲۰۰۶ نتفلیکس برای سیستم پیشنهادگر فیلم خود مسابقه ای برگزار کرد و در این مسابقه اطلاعات ۵۰۰ هزار نفر از مشتریان خود را بهصورت هویتزداشده در معرض عموم قرار داد، اطلاعاتی مانند اینکه هرفرد چهزمانی چه فیلمی دیده و چه امتیازی داده است. دو سال بعد تحلیلگرانی این اطلاعات را با اطلاعات سایت imdb که در آن پروفایل عمومی افراد بیننده فیلم وجود دارد، ترکیب کردند. بعدازآن توانستند برخی افراد را با نگاشت کردن. اطلاعات موجود در نتفلیکس با اطلاعات imdb بازهویتیابی کنند. با انجام این کار معلوم شد که شخص چه فیلمهایی را دیده است و میشد فهمید که مثلا گرایشهای سیاسی او چیست.
پژوهشگر حوزه داده درمورد روش جایگزین گفت: دادههای ترکیبی تولیدشده با هوش مصنوعی یک روش هویتزدایی است که سودمندی داده را نگه میدارد. این دادهها در بدو امر وجود ندارند و بعد توسط هوش مصنوعی با فرایند یادگیری ماشین و اعمال آن بر دادههای اولیه افراد تولید میشوند. دادههای جدید از نظر آماری همان ویژگیهای دادههای اولیه را دارند و صرفا اطلاعات مربوط به حریم خصوصی در آن نیست. درواقع این دادهها مربوط به افراد واقعی در جهان بیرونی نیست؛ اما از نظر آماری بسیار شبیه آن دادهها است.
عبادی درادامه به ذکر مزایا و معایب دادههای ترکیبی، دستهبندیهای مختلف آن و نیز موارد استفاده از آن پرداخت. بحث بعدی نیز توضیح این مطلب بود که دادههای ترکیبی چگونه میتواند به توسعه هوش مصنوعی توضیحپذیر (Explainable) و مسئولیتپذیر (Responsible) کمک نماید. وی سخنرانی خود را با ذکر مواردی از برنامههای موجود برای توضیح دادن عملکرد یک سامانه هوش مصنوعی خاص و نیز تولید دادههای ترکیبی به پایان برد.
در این نشست که بهصورت برخط برگزار شد، حدود ۴۰ نفر شرکت داشتند. پس از پایان سخنرانی پرسش و پاسخ حاضرین انجام شد و جلسه بعد از حدود ۷۵ دقیقه به پایان رسید.