رایانههوش مصنوعی

اجتناب از راه حل های میانبر در هوش مصنوعی

در یادگیری ماشینی، یک راه حل میانبر زمانی رخ می دهد که مدل برای تصمیم گیری، به جای یادگیری ماهیت واقعی داده ها، که می تواند منجر به پیش بینی های نادرست شود، به یک مشخصه ساده از یک مجموعه داده تکیه می کند.

 برای مثال، یک مدل ممکن است یاد بگیرد که تصاویر گاوها را با تمرکز بر روی چمن سبزی که در عکس‌ها ظاهر می‌شود شناسایی کند، به جای اشکال و الگوهای پیچیده‌تر گاوها.  

یک مطالعه جدید توسط محققان MIT مشکل میانبرها را در یک روش محبوب یادگیری ماشینی بررسی می‌کند و راه‌حلی را پیشنهاد می‌کند که می‌تواند با وادار کردن مدل به استفاده از داده‌های بیشتر در تصمیم‌گیری از میانبرها جلوگیری کند.

با حذف ویژگی‌های ساده‌تری که مدل بر روی آنها تمرکز می‌کند، محققان آن را مجبور می‌کنند تا بر روی ویژگی‌های پیچیده‌تر داده‌هایی تمرکز کند که در نظر گرفته نشده بود.

 سپس، با درخواست از مدل برای حل یک کار به دو روش – یک بار با استفاده از آن ویژگی‌های ساده‌تر، و سپس با استفاده از ویژگی‌های پیچیده‌ای که اکنون شناسایی کرده است – تمایل به راه‌حل‌های میانبر را کاهش می‌دهند و عملکرد مدل را افزایش می‌دهند.

یکی از کاربردهای بالقوه این کار، افزایش اثربخشی مدل‌های یادگیری ماشینی است که برای شناسایی بیماری در تصاویر پزشکی استفاده می‌شوند.

 راه حل های میانبر در این زمینه می تواند منجر به تشخیص های نادرست شود و پیامدهای خطرناکی برای بیماران داشته باشد.

هنوز دشوار است که بگوییم چرا شبکه‌های عمیق تصمیم‌هایی را می‌گیرند که انجام می‌دهند، و به ویژه، این شبکه‌ها هنگام تصمیم‌گیری روی کدام بخش از داده‌ها تمرکز می‌کنند.

 جاشوا رابینسون، دانشجوی دکترا در دانشگاه می گوید: اگر بتوانیم نحوه عملکرد میانبرها را با جزئیات بیشتر درک کنیم، می توانیم حتی فراتر برویم و به برخی از سؤالات اساسی اما بسیار کاربردی که برای افرادی که در تلاش برای استقرار این شبکه ها هستند بسیار مهم هستند پاسخ دهیم.

آزمایشگاه علوم کامپیوتر و هوش مصنوعی (CSAIL) و نویسنده اصلی مقاله.

رابینسون این مقاله را با مشاورانش، نویسنده ارشد سووریت سرا، استادیار توسعه شغلی استر و هارولد ای. ادگرتون در گروه مهندسی برق و علوم کامپیوتر (EECS) و یکی از اعضای اصلی موسسه داده، سیستم‌ها و جامعه نوشت.

(IDSS) و آزمایشگاه اطلاعات و سیستم های تصمیم گیری. و استفانی جگلکا، دانشیار توسعه شغلی کنسرسیوم X در EECS و عضو CSAIL و IDSS. و همچنین کیهان باتمانقلیچ، استادیار دانشگاه پیتسبورگ و دانشجویان دکترا، لی سان و که یو. این تحقیق در کنفرانس سیستم های پردازش اطلاعات عصبی در ماه دسامبر ارائه خواهد شد. 

اجتناب از راه حل های میانبر در هوش مصنوعی

راه طولانی برای درک میانبرها

اجتناب از راه حل های میانبر در هوش مصنوعی
اجتناب از راه حل های میانبر در هوش مصنوعی

محققان مطالعه خود را بر یادگیری متضاد متمرکز کردند، که شکل قدرتمندی از یادگیری ماشینی خود نظارت است.

 در یادگیری ماشینی خود نظارتی، مدلی با استفاده از داده‌های خامی که توصیفات برچسبی از انسان ندارند، آموزش داده می‌شود. بنابراین می توان آن را با موفقیت برای طیف وسیع تری از داده ها استفاده کرد.

یک مدل یادگیری خود نظارت، نمایش‌های مفیدی از داده‌ها را می‌آموزد که به عنوان ورودی برای کارهای مختلف مانند طبقه‌بندی تصویر استفاده می‌شوند.

 اما اگر مدل از میانبرها استفاده کند و نتواند اطلاعات مهم را بگیرد، این وظایف نیز نمی توانند از آن اطلاعات استفاده کنند.

برای مثال، اگر یک مدل یادگیری تحت نظارت خود برای طبقه‌بندی ذات‌الریه در اشعه ایکس تعدادی از بیمارستان‌ها آموزش دیده باشد، اما یاد می‌گیرد که براساس برچسبی که بیمارستانی را که اسکن از آن گرفته شده است، پیش‌بینی کند (زیرا برخی از بیمارستان‌ها پنومونی بیشتری دارند. در موارد دیگر)، مدل زمانی که داده‌های یک بیمارستان جدید به آن داده می‌شود، عملکرد خوبی نخواهد داشت.     

برای مدل‌های یادگیری متضاد، یک الگوریتم رمزگذار برای تمایز بین جفت ورودی‌های مشابه و جفت ورودی‌های غیرمشابه آموزش داده شده است. این فرآیند داده های غنی و پیچیده مانند تصاویر را به گونه ای رمزگذاری می کند که مدل یادگیری متضاد بتواند تفسیر کند.

محققان رمزگذارهای یادگیری متضاد را با مجموعه ای از تصاویر آزمایش کردند و دریافتند که در طول این روش آموزشی، آنها طعمه راه حل های میانبر نیز می شوند.

 رمزگذارها تمایل دارند روی ساده‌ترین ویژگی‌های یک تصویر تمرکز کنند تا تصمیم بگیرند که کدام جفت ورودی مشابه و کدام یک متفاوت هستند.

 جگلکا می‌گوید: در حالت ایده‌آل، رمزگذار باید هنگام تصمیم‌گیری روی تمام ویژگی‌های مفید داده‌ها تمرکز کند.

بنابراین، تیم تشخیص تفاوت بین جفت‌های مشابه و غیرمشابه را سخت‌تر کرد و متوجه شد که این تغییرات که ویژگی‌های رمزگذار برای تصمیم‌گیری به آن نگاه می‌کند.

او می‌گوید: «اگر کار تمایز بین موارد مشابه و غیرمشابه را سخت‌تر و سخت‌تر کنید، سیستم شما مجبور می‌شود اطلاعات معنی‌داری بیشتری در داده‌ها بیاموزد، زیرا بدون یادگیری نمی‌تواند کار را حل کند.

اما افزایش این دشواری منجر به معاوضه شد – رمزگذار در تمرکز بر برخی از ویژگی‌های داده بهتر شد اما در تمرکز بر برخی دیگر بدتر شد. رابینسون می گوید که تقریباً به نظر می رسید ویژگی های ساده تر را فراموش کرده است.

برای جلوگیری از این مبادله، محققان از رمزگذار خواستند تا با استفاده از ویژگی‌های ساده‌تر، و همچنین پس از حذف اطلاعاتی که قبلاً آموخته بود، بین جفت‌ها به همان روشی که در ابتدا داشت تمایز قائل شود. حل کار به دو صورت به طور همزمان باعث بهبود رمزگذار در همه ویژگی ها شد.

روش آنها که اصلاح ویژگی ضمنی نامیده می‌شود، نمونه‌ها را برای حذف ویژگی‌های ساده‌تری که رمزگذار برای تمایز بین جفت‌ها استفاده می‌کند، اصلاح می‌کند.

 Sra توضیح می دهد که این تکنیک به ورودی انسان متکی نیست، که مهم است زیرا مجموعه داده های دنیای واقعی می توانند صدها ویژگی مختلف داشته باشند که می توانند به روش های پیچیده ترکیب شوند.

از اتومبیل تا COPD

  • پلاتیپوس های نر دارای خارهایی بر روی پای عقب خود هستند که می توانند سم آزاد کنند و آنها را به یکی از معدود پستانداران سمی تبدیل می کند.

محققان یک آزمایش از این روش را با استفاده از تصاویر وسایل نقلیه انجام دادند. آنها از اصلاح ویژگی ضمنی برای تنظیم رنگ، جهت و نوع وسیله نقلیه استفاده کردند تا تمایز بین جفت تصاویر مشابه و غیر مشابه را برای رمزگذار دشوارتر کنند.

 رمزگذار دقت خود را در هر سه ویژگی – بافت، شکل و رنگ – به طور همزمان بهبود بخشید.

برای اینکه ببینند آیا این روش در برابر داده‌های پیچیده‌تر مقاومت می‌کند یا خیر، محققان آن را با نمونه‌هایی از پایگاه داده تصاویر پزشکی بیماری مزمن انسدادی ریه (COPD) آزمایش کردند. مجدداً، این روش منجر به بهبودهای همزمان در همه ویژگی‌هایی شد که آنها ارزیابی کردند.

در حالی که این کار گام‌های مهمی را در درک علل راه‌حل‌های میان‌بر و تلاش برای حل آنها برمی‌دارد، محققان می‌گویند که ادامه اصلاح این روش‌ها و بکارگیری آن‌ها در انواع دیگر یادگیری خود نظارتی کلید پیشرفت‌های آینده خواهد بود.

“این به برخی از بزرگترین سوالات در مورد سیستم های یادگیری عمیق، مانند “چرا آنها شکست می خورند؟” و “آیا ما می توانیم از قبل از موقعیت هایی که مدل شما شکست خواهد خورد؟” رابینسون می‌گوید اگر می‌خواهید یادگیری میان‌بر را در کلیت کامل آن درک کنید، هنوز چیزهای زیادی در پیش دارید.

این تحقیق توسط بنیاد ملی علوم، مؤسسه ملی بهداشت و برنامه افزایش تحقیقات جهانی مشترک المنافع SAP SE (CURE) اداره بهداشت پنسیلوانیا پشتیبانی می شود.

اجتناب از راه حل های میانبر در هوش مصنوعی

مهندس حمید تدینی: نویسنده و وبلاگ نویس مشهور، متخصص در زبان برنامه نویسی و هوش مصنوعی و ساکن آلمان است. مقالات روشنگر او به پیچیدگی های این زمینه ها می پردازد و به خوانندگان درک عمیقی از مفاهیم پیچیده فناوری ارائه می دهد. کار او به دلیل وضوح و دقت مشهور است. مهندس حمید تدینی: نویسنده و وبلاگ نویس مشهور، متخصص در زبان برنامه نویسی و هوش مصنوعی و ساکن آلمان است. مقالات روشنگر او به پیچیدگی های این زمینه ها می پردازد و به خوانندگان درک عمیقی از مفاهیم پیچیده فناوری ارائه می دهد. کار او به دلیل وضوح و دقت مشهور است.
نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا