
الگوریتمهای جدید امکان یادگیری ماشین کارآمد با دادههای متقارن را فراهم میکنند.
این رویکرد جدید میتواند به توسعه مدلهای هوش مصنوعی پیشرفتهتر برای کشف دارو و مواد منجر شود.
در مقالهای که در ۳۰ ژوئیه ۲۰۲۵ منتشر شد، محققان مؤسسه فناوری ماساچوست (MIT) الگوریتمی کارآمد برای یادگیری ماشین با دادههای متقارن ارائه دادهاند که نیاز به دادههای کمتری دارد و در عین حال از کارایی بالایی برخوردار است. این الگوریتم میتواند در تحلیلهای پیچیده دادههای متقارن کاربرد داشته باشد.
اگر تصویری از یک ساختار مولکولی را بچرخانید، یک انسان میتواند تشخیص دهد که تصویر چرخاندهشده هنوز همان مولکول است، اما یک مدل یادگیری ماشین ممکن است فکر کند که این یک داده جدید است. به زبان علوم کامپیوتر، مولکول «متقارن» است، به این معنا که ساختار بنیادی آن مولکول، حتی پس از اعمال برخی تبدیلات مانند چرخش، تغییر نمیکند.
اگر یک مدل کشف دارو متقارن بودن را درک نکند، ممکن است پیشبینیهای نادرستی درباره ویژگیهای مولکولی ارائه دهد. با وجود برخی موفقیتهای تجربی، هنوز مشخص نبود که آیا روش محاسباتی کارآمدی برای آموزش یک مدل خوب که تضمینشده متقارن بودن را رعایت کند وجود دارد یا خیر.
یک مطالعه جدید توسط محققان MIT به این سوال پاسخ میدهد و اولین روش برای یادگیری ماشین با دادههای متقارن را معرفی میکند که از نظر میزان محاسبات و دادههای مورد نیاز بهطور قابل اثبات کارآمد است.
این نتایج یک سوال بنیادی را روشن میکنند و میتوانند به پژوهشگران در توسعه مدلهای یادگیری ماشین قدرتمندتر که برای مدیریت تقارن طراحی شدهاند، کمک کنند. چنین مدلهایی میتوانند در طیف وسیعی از کاربردها مفید باشند، از کشف مواد جدید گرفته تا شناسایی ناهنجاریهای نجومی و بررسی الگوهای پیچیده اقلیمی.
«این تقارنها مهم هستند زیرا نوعی اطلاعاتی هستند که طبیعت درباره دادهها به ما میدهد و ما باید آن را در مدلهای یادگیری ماشین خود لحاظ کنیم. اکنون نشان دادهایم که امکان انجام یادگیری ماشین با دادههای متقارن به روشی کارآمد وجود دارد.» — بهروز طهماسبی، دانشجوی فارغالتحصیل MIT و نویسنده همرهبر این مطالعه.
در مقاله، او همراه با اشکان سلیمانی (دانشجوی فارغالتحصیل MIT و نویسنده همرهبر)، استفانی جیگلکا (استاد همکار مهندسی برق و علوم کامپیوتر و عضو موسسه داده، سیستمها و جامعه و آزمایشگاه علوم کامپیوتر و هوش مصنوعی) و پاتریک جیلت (استاد مهندسی برق و علوم کامپیوتر و محقق اصلی در آزمایشگاه اطلاعات و سیستمهای تصمیمگیری) هستند. این تحقیق اخیراً در کنفرانس بینالمللی یادگیری ماشین ارائه شد.
دادههای متقارن در بسیاری از حوزهها بهویژه علوم طبیعی و فیزیک ظاهر میشوند. مدلی که تقارنها را شناسایی کند، قادر است یک شیء، مانند یک خودرو، را بدون توجه به مکان آن در تصویر شناسایی کند.
مگر اینکه یک مدل یادگیری ماشین بهگونهای طراحی شود که بتواند با تقارنها کار کند، ممکن است دقت کمتری داشته باشد و در مواجهه با دادههای متقارن جدید در دنیای واقعی دچار خطا شود. از سوی دیگر، مدلهایی که از تقارن بهره میبرند میتوانند سریعتر باشند و برای آموزش به دادههای کمتری نیاز داشته باشند.
اما آموزش یک مدل برای پردازش دادههای متقارن کار آسانی نیست.
یک روش رایج به نام افزایش دادهها (data augmentation) وجود دارد که در آن پژوهشگران هر نقطه داده متقارن را به چندین داده تبدیل میکنند تا مدل بتواند بهتر به دادههای جدید تعمیم دهد. برای مثال، میتوان یک ساختار مولکولی را بارها چرخاند تا دادههای آموزشی جدید تولید شود، اما اگر بخواهیم مطمئن شویم که مدل تقارن را رعایت میکند، این روش میتواند از نظر محاسباتی سنگین باشد.
روش دیگر این است که تقارن را در معماری مدل کدگذاری کنیم. مثال شناختهشده این موضوع، شبکههای عصبی گرافی (GNN) است که بهطور ذاتی با دادههای متقارن کار میکنند.
«شبکههای عصبی گرافی سریع و کارآمد هستند و تقارن را بهخوبی مدیریت میکنند، اما کسی واقعاً نمیداند این مدلها چه چیزی یاد میگیرند یا چرا کار میکنند. درک GNNها انگیزه اصلی کار ما بود، بنابراین از ارزیابی نظری شروع کردیم تا ببینیم وقتی دادهها متقارن هستند چه اتفاقی میافتد.» — طهماسبی
آنها موازنه آماری-محاسباتی در یادگیری ماشین با دادههای متقارن را بررسی کردند. این موازنه به این معناست که روشهایی که به داده کمتری نیاز دارند، میتوانند از نظر محاسباتی پرهزینهتر باشند، بنابراین پژوهشگران باید تعادل مناسبی پیدا کنند.
با تکیه بر این ارزیابی نظری، پژوهشگران الگوریتمی کارآمد برای یادگیری ماشین با دادههای متقارن طراحی کردند.
برای انجام این کار، آنها ایدههایی از جبر برای سادهسازی مسئله گرفتند و سپس مسئله را با استفاده از ایدههای هندسی بازفرموله کردند که بهطور مؤثر تقارن را بازنمایی میکند.
در نهایت، جبر و هندسه را در یک مسئله بهینهسازی ترکیب کردند که میتواند بهصورت کارآمد حل شود و الگوریتم جدید آنها را به وجود آورد.
«اکثر نظریهها و کاربردها یا بر جبر یا بر هندسه تمرکز داشتند. اینجا ما فقط آنها را ترکیب کردیم.»
این الگوریتم به دادههای کمتری برای آموزش نیاز دارد و میتواند دقت مدل و توانایی آن برای سازگاری با کاربردهای جدید را بهبود دهد.
با اثبات اینکه دانشمندان میتوانند الگوریتمهای کارآمد برای یادگیری ماشین با دادههای متقارن توسعه دهند و نشان دادن چگونگی انجام آن، این نتایج میتواند منجر به توسعه معماریهای جدید شبکه عصبی شود که دقیقتر و کمهزینهتر از مدلهای فعلی باشند.
پژوهشگران همچنین میتوانند از این تحلیل بهعنوان نقطه شروع برای بررسی عملکرد درونی GNNها و تفاوت آنها با الگوریتم توسعهیافته MIT استفاده کنند.
«وقتی این موضوع را بهتر بدانیم، میتوانیم معماریهای شبکه عصبی قابلتفسیرتر، مقاومتر و کارآمدتری طراحی کنیم.» — سلیمانی
این تحقیق تا حدی توسط صندوق ملی تحقیقات سنگاپور، آزمایشگاههای ملی DSO سنگاپور، دفتر تحقیقات نیروی دریایی آمریکا، بنیاد ملی علوم آمریکا و کرسی استادی الکساندر فون هومبولت تأمین مالی شده است.
manaland.ir ©