الگوریتم‌های جدید امکان یادگیری ماشین کارآمد با داده‌های متقارن را فراهم می‌کنند.

این رویکرد جدید می‌تواند به توسعه مدل‌های هوش مصنوعی پیشرفته‌تر برای کشف دارو و مواد منجر شود.

در مقاله‌ای که در ۳۰ ژوئیه ۲۰۲۵ منتشر شد، محققان مؤسسه فناوری ماساچوست (MIT) الگوریتمی کارآمد برای یادگیری ماشین با داده‌های متقارن ارائه داده‌اند که نیاز به داده‌های کمتری دارد و در عین حال از کارایی بالایی برخوردار است. این الگوریتم می‌تواند در تحلیل‌های پیچیده داده‌های متقارن کاربرد داشته باشد.


اگر تصویری از یک ساختار مولکولی را بچرخانید، یک انسان می‌تواند تشخیص دهد که تصویر چرخانده‌شده هنوز همان مولکول است، اما یک مدل یادگیری ماشین ممکن است فکر کند که این یک داده جدید است. به زبان علوم کامپیوتر، مولکول «متقارن» است، به این معنا که ساختار بنیادی آن مولکول، حتی پس از اعمال برخی تبدیلات مانند چرخش، تغییر نمی‌کند.

اگر یک مدل کشف دارو متقارن بودن را درک نکند، ممکن است پیش‌بینی‌های نادرستی درباره ویژگی‌های مولکولی ارائه دهد. با وجود برخی موفقیت‌های تجربی، هنوز مشخص نبود که آیا روش محاسباتی کارآمدی برای آموزش یک مدل خوب که تضمین‌شده متقارن بودن را رعایت کند وجود دارد یا خیر.

یک مطالعه جدید توسط محققان MIT به این سوال پاسخ می‌دهد و اولین روش برای یادگیری ماشین با داده‌های متقارن را معرفی می‌کند که از نظر میزان محاسبات و داده‌های مورد نیاز به‌طور قابل اثبات کارآمد است.

این نتایج یک سوال بنیادی را روشن می‌کنند و می‌توانند به پژوهشگران در توسعه مدل‌های یادگیری ماشین قدرتمندتر که برای مدیریت تقارن طراحی شده‌اند، کمک کنند. چنین مدل‌هایی می‌توانند در طیف وسیعی از کاربردها مفید باشند، از کشف مواد جدید گرفته تا شناسایی ناهنجاری‌های نجومی و بررسی الگوهای پیچیده اقلیمی.

«این تقارن‌ها مهم هستند زیرا نوعی اطلاعاتی هستند که طبیعت درباره داده‌ها به ما می‌دهد و ما باید آن را در مدل‌های یادگیری ماشین خود لحاظ کنیم. اکنون نشان داده‌ایم که امکان انجام یادگیری ماشین با داده‌های متقارن به روشی کارآمد وجود دارد.» — بهروز طهماسبی، دانشجوی فارغ‌التحصیل MIT و نویسنده هم‌رهبر این مطالعه.

در مقاله، او همراه با اشکان سلیمانی (دانشجوی فارغ‌التحصیل MIT و نویسنده هم‌رهبر)، استفانی جیگلکا (استاد همکار مهندسی برق و علوم کامپیوتر و عضو موسسه داده، سیستم‌ها و جامعه و آزمایشگاه علوم کامپیوتر و هوش مصنوعی) و پاتریک جیلت (استاد مهندسی برق و علوم کامپیوتر و محقق اصلی در آزمایشگاه اطلاعات و سیستم‌های تصمیم‌گیری) هستند. این تحقیق اخیراً در کنفرانس بین‌المللی یادگیری ماشین ارائه شد.

بررسی تقارن

داده‌های متقارن در بسیاری از حوزه‌ها به‌ویژه علوم طبیعی و فیزیک ظاهر می‌شوند. مدلی که تقارن‌ها را شناسایی کند، قادر است یک شیء، مانند یک خودرو، را بدون توجه به مکان آن در تصویر شناسایی کند.

مگر اینکه یک مدل یادگیری ماشین به‌گونه‌ای طراحی شود که بتواند با تقارن‌ها کار کند، ممکن است دقت کمتری داشته باشد و در مواجهه با داده‌های متقارن جدید در دنیای واقعی دچار خطا شود. از سوی دیگر، مدل‌هایی که از تقارن بهره می‌برند می‌توانند سریع‌تر باشند و برای آموزش به داده‌های کمتری نیاز داشته باشند.

اما آموزش یک مدل برای پردازش داده‌های متقارن کار آسانی نیست.

یک روش رایج به نام افزایش داده‌ها (data augmentation) وجود دارد که در آن پژوهشگران هر نقطه داده متقارن را به چندین داده تبدیل می‌کنند تا مدل بتواند بهتر به داده‌های جدید تعمیم دهد. برای مثال، می‌توان یک ساختار مولکولی را بارها چرخاند تا داده‌های آموزشی جدید تولید شود، اما اگر بخواهیم مطمئن شویم که مدل تقارن را رعایت می‌کند، این روش می‌تواند از نظر محاسباتی سنگین باشد.

روش دیگر این است که تقارن را در معماری مدل کدگذاری کنیم. مثال شناخته‌شده این موضوع، شبکه‌های عصبی گرافی (GNN) است که به‌طور ذاتی با داده‌های متقارن کار می‌کنند.

«شبکه‌های عصبی گرافی سریع و کارآمد هستند و تقارن را به‌خوبی مدیریت می‌کنند، اما کسی واقعاً نمی‌داند این مدل‌ها چه چیزی یاد می‌گیرند یا چرا کار می‌کنند. درک GNN‌ها انگیزه اصلی کار ما بود، بنابراین از ارزیابی نظری شروع کردیم تا ببینیم وقتی داده‌ها متقارن هستند چه اتفاقی می‌افتد.» — طهماسبی

آن‌ها موازنه آماری-محاسباتی در یادگیری ماشین با داده‌های متقارن را بررسی کردند. این موازنه به این معناست که روش‌هایی که به داده کمتری نیاز دارند، می‌توانند از نظر محاسباتی پرهزینه‌تر باشند، بنابراین پژوهشگران باید تعادل مناسبی پیدا کنند.

با تکیه بر این ارزیابی نظری، پژوهشگران الگوریتمی کارآمد برای یادگیری ماشین با داده‌های متقارن طراحی کردند.

ترکیب ریاضی

برای انجام این کار، آن‌ها ایده‌هایی از جبر برای ساده‌سازی مسئله گرفتند و سپس مسئله را با استفاده از ایده‌های هندسی بازفرموله کردند که به‌طور مؤثر تقارن را بازنمایی می‌کند.

در نهایت، جبر و هندسه را در یک مسئله بهینه‌سازی ترکیب کردند که می‌تواند به‌صورت کارآمد حل شود و الگوریتم جدید آن‌ها را به وجود آورد.

«اکثر نظریه‌ها و کاربردها یا بر جبر یا بر هندسه تمرکز داشتند. اینجا ما فقط آن‌ها را ترکیب کردیم.»

این الگوریتم به داده‌های کمتری برای آموزش نیاز دارد و می‌تواند دقت مدل و توانایی آن برای سازگاری با کاربردهای جدید را بهبود دهد.

با اثبات اینکه دانشمندان می‌توانند الگوریتم‌های کارآمد برای یادگیری ماشین با داده‌های متقارن توسعه دهند و نشان دادن چگونگی انجام آن، این نتایج می‌تواند منجر به توسعه معماری‌های جدید شبکه عصبی شود که دقیق‌تر و کم‌هزینه‌تر از مدل‌های فعلی باشند.

پژوهشگران همچنین می‌توانند از این تحلیل به‌عنوان نقطه شروع برای بررسی عملکرد درونی GNN‌ها و تفاوت آن‌ها با الگوریتم توسعه‌یافته MIT استفاده کنند.

«وقتی این موضوع را بهتر بدانیم، می‌توانیم معماری‌های شبکه عصبی قابل‌تفسیرتر، مقاوم‌تر و کارآمدتری طراحی کنیم.» — سلیمانی

این تحقیق تا حدی توسط صندوق ملی تحقیقات سنگاپور، آزمایشگاه‌های ملی DSO سنگاپور، دفتر تحقیقات نیروی دریایی آمریکا، بنیاد ملی علوم آمریکا و کرسی استادی الکساندر فون هومبولت تأمین مالی شده است.

تحقیقات در زمینه یادگیری ماشین با داده‌های متقارن

پست مرتبط

~/js/swiper-bundle.min.js.map