پایان داده‌های انسانی، آغاز چالش‌های جدید برای هوش مصنوعی

استفاده از داده‌های مصنوعی، راهکاری موقت اما پرچالش برای آموزش مدل‌های هوش مصنوعی.

ایلان ماسک، با اعلام پایان داده‌های انسانی برای آموزش مدل‌های هوش مصنوعی، زنگ خطری را برای صنعت هوش مصنوعی به صدا درآورده است. به گفته وی، شرکت‌های بزرگ مانند OpenAI، گوگل و متا، تقریباً تمام دانش بشری موجود در اینترنت را برای آموزش مدل‌هایی مانند GPT-۴ و Gemini مورد استفاده قرار داده‌اند. این موضوع، استفاده از داده‌های مصنوعی را به عنوان یک راهکار موقت اجتناب‌ناپذیر کرده است. داده‌های مصنوعی، که توسط خود مدل‌های هوش مصنوعی تولید می‌شوند، می‌توانند برای آموزش مدل‌های جدیدتر به کار روند، اما این روش بدون چالش نیست.

شرکت‌هایی مانند متا و مایکروسافت پیش‌تر از داده‌های مصنوعی استفاده کرده‌اند، اما این روش خطراتی به همراه دارد. یکی از مهم‌ترین این خطرات، پدیده‌ "توهم‌های هوش مصنوعی" است که منجر به تولید اطلاعات نادرست یا بی‌معنی توسط مدل‌ها می‌شود. ماسک در این خصوص هشدار داده و به دشواری تشخیص اطلاعات صحیح از توهمات اشاره کرده است. همچنین، استفاده مداوم از داده‌های مصنوعی می‌تواند منجر به "فروپاشی مدل" شود، که در آن مدل‌ها خلاقیت خود را از دست داده و خروجی‌های تکراری و یک‌جانبه تولید می‌کنند. این موضوع توسط اندرو دانکن، مدیر مؤسسه آلن تورینگ نیز تأیید شده است.

علاوه بر این، استفاده از داده‌های مصنوعی می‌تواند باعث کاهش تنوع و جامعیت مدل‌ها شود. از آنجا که داده‌های مصنوعی بر اساس الگوهای موجود در داده‌های قبلی تولید می‌شوند، احتمال تقویت سوگیری‌ها و عدم توجه به زبان‌ها و فرهنگ‌های خاص افزایش می‌یابد. محققان در حال بررسی راه‌حل‌هایی مانند ترکیب داده‌های مصنوعی با داده‌های انسانی باکیفیت، توسعه الگوریتم‌های تشخیص توهمات و ایجاد پایگاه‌های داده جدید با مشارکت کاربران هستند تا بتوانند آینده‌ای پایدارتر و قابل اعتمادتر را برای هوش مصنوعی رقم بزنند.

نظرات

شنبه ۲۲ دی ۱۴۰۳ - ۰۰:۲۳

تعداد بازدید : 105

نویسنده : علی دلیران