ابزار جدید به مردم کمک می کند روش مناسبی را برای ارزیابی مدل های هوش مصنوعی انتخاب کنند

مصاحبه با محققان و کارشناسان هوش مصنوعی از سایر زمینه‌ها نشان داد که این کارت‌ها به افراد کمک می‌کنند تا سریعاً روش‌های مختلف را مقایسه کنند و تکنیک مناسب کار را انتخاب کنند. انتخاب روش مناسب به کاربران تصویر دقیق تری از نحوه رفتار مدلشان می دهد، بنابراین آنها برای تفسیر صحیح پیش بینی های آن مجهزتر هستند.

در حرکت رو به جلو، محققان می‌خواهند برخی از ویژگی‌های کمتر ارزیابی‌شده را بررسی کنند و شاید روش‌های برجسته‌سازی مختص کار را طراحی کنند. آنها همچنین می‌خواهند درک بهتری از نحوه درک افراد از خروجی‌های روش برجسته ایجاد کنند که می‌تواند به تجسم بهتر منجر شود. علاوه بر این، آنها کار خود را در یک مخزن عمومی میزبانی می کنند تا دیگران بتوانند بازخوردی ارائه دهند که کار آینده را هدایت می کند.

محققان قبلاً روش‌های برجسته را با استفاده از مفهوم وفاداری ارزیابی کرده‌اند. در این زمینه، وفاداری نشان می‌دهد که یک روش چقدر فرآیند تصمیم‌گیری یک مدل را منعکس می‌کند.

با این حال، انتخاب روش “اشتباه” می تواند عواقب جدی داشته باشد. به عنوان مثال، یک روش برجسته، که به عنوان گرادیان های یکپارچه شناخته می شود، اهمیت ویژگی ها را در یک تصویر با یک خط پایه بی معنی مقایسه می کند. ویژگی‌هایی که بیشترین اهمیت را در خط مبنا دارند، برای پیش‌بینی مدل بیشترین معنا را دارند. این روش معمولاً از همه 0 ها به عنوان خط پایه استفاده می کند، اما اگر برای تصاویر اعمال شود، همه 0 ها برابر با رنگ سیاه است.

«آیا می توانیم این شکاف را پر کنیم؟ آیا روش برجسته ای وجود دارد که بتواند هر دو کار را انجام دهد؟ یا شاید این دو ایده از نظر تئوری با یکدیگر در تضاد باشند،” بوگوست می گوید.

کارت های خود را نشان می دهند

این مقاله برای اولین بار در 31 مه 2023 در تاریخ انتشار یافته است اخبار MIT.

با تشکر،
خلاصه کیفیت

منبع: https://www.qualitydigest.com/inside/innovation-news/new-tool-helps-people-choose-right-method-evaluating-ai-models-061923.html

هنگامی که آنها چندین کارت ایجاد کردند، تیم یک مطالعه کاربری با هشت متخصص حوزه، از دانشمندان کامپیوتر گرفته تا یک رادیولوژیست که با یادگیری ماشینی ناآشنا بود، انجام داد. در طول مصاحبه، همه شرکت‌کنندگان گفتند که توضیحات مختصر به آنها کمک کرد تا ویژگی‌ها را اولویت‌بندی کنند و روش‌ها را مقایسه کنند. بوگوست می گوید، با وجود اینکه با یادگیری ماشین آشنایی نداشت، رادیولوژیست توانست کارت ها را بفهمد و از آنها برای شرکت در فرآیند انتخاب روش برجسته استفاده کند.

قول ما: خلاصه کیفیت فقط تبلیغات ثابتی را نشان می دهد که هرگز محتوا را پوشش نمی دهد یا پوشان نمی دهد. آنها هرگز سر راه شما قرار نمی گیرند. آنها برای خواندن شما وجود دارند یا نه.

با این حال، کسی باید برای این محتوا هزینه کند. و اینجاست که تبلیغات وارد می‌شود. بیشتر مردم تبلیغات را یک مزاحم می‌دانند، اما آنها علاوه بر اینکه به شرکت‌های رسانه‌ای اجازه می‌دهند سرپا بمانند، عملکرد مفیدی نیز دارند. آنها شما را از محصولات و خدمات جدید مرتبط با صنعت خود آگاه می کنند. همه تبلیغات در خلاصه کیفیت مستقیماً برای محصولات و خدماتی که اکثر خوانندگان ما به آن نیاز دارند اعمال شود. شما تبلیغات خودرو یا مکمل های سلامتی را نخواهید دید.

خلاصه کیفیت برای محتوای آن از خوانندگان هزینه ای دریافت نمی کند. ما معتقدیم که اخبار صنعت برای شما مهم است که کار خود را انجام دهید، و خلاصه کیفیت از کسب و کارهای مختلف پشتیبانی می کند.

این به شما می گوید که هر پیکسل سیاه در تصویر شما مهم نیست، حتی اگر مهم باشد، زیرا با آن خط پایه بی معنی یکسان است. بوگوست می‌گوید: اگر به اشعه ایکس نگاه می‌کنید، این می‌تواند مشکل بزرگی باشد، زیرا رنگ سیاه می‌تواند برای پزشکان معنی‌دار باشد.

با انتشار مداوم روش‌های جدید، محققان MIT و IBM Research ابزاری برای کمک به کاربران در انتخاب بهترین روش برجسته برای کار خاص خود ایجاد کردند. آن‌ها کارت‌های برجسته را توسعه دادند که مستندات استانداردی از نحوه عملکرد یک روش، از جمله نقاط قوت و ضعف و توضیحات آن برای کمک به کاربران برای تفسیر صحیح آن ارائه می‌کند.

این کارت‌ها همچنین می‌توانند با آشکار کردن شکاف‌ها در فضای تحقیقاتی برای دانشمندان مفید باشند. به عنوان مثال، محققان MIT نتوانستند روش برجسته‌ای را شناسایی کنند که از نظر محاسباتی کارآمد باشد اما می‌توان آن را برای هر مدل یادگیری ماشینی نیز به کار برد.

نوآوری

ابزار جدید به مردم کمک می کند روش مناسبی را برای ارزیابی مدل های هوش مصنوعی انتخاب کنند

دانستن اینکه یک مدل چگونه رفتار می کند به کاربران کمک می کند تا پیش بینی های آن را تفسیر کنند

دبلیومدل‌های یادگیری ماشینی مرغ در موقعیت‌های دنیای واقعی به کار گرفته می‌شوند، شاید برای علامت‌گذاری بیماری احتمالی در اشعه ایکس برای بررسی رادیولوژیست، کاربران انسانی باید بدانند چه زمانی به پیش‌بینی‌های مدل اعتماد کنند.

اما مدل‌های یادگیری ماشینی آنقدر بزرگ و پیچیده هستند که حتی دانشمندانی که آنها را طراحی می‌کنند نیز نمی‌دانند مدل‌ها چگونه پیش‌بینی می‌کنند. بنابراین، آنها تکنیک هایی را ایجاد می کنند که به عنوان شناخته می شوند روش های برجسته سازی که به دنبال توضیح رفتار مدل هستند.