پایان دادههای انسانی، آغاز چالشهای جدید برای هوش مصنوعی
استفاده از دادههای مصنوعی، راهکاری موقت اما پرچالش برای آموزش مدلهای هوش مصنوعی.
ایلان ماسک، با اعلام پایان دادههای انسانی برای آموزش مدلهای هوش مصنوعی، زنگ خطری را برای صنعت هوش مصنوعی به صدا درآورده است. به گفته وی، شرکتهای بزرگ مانند OpenAI، گوگل و متا، تقریباً تمام دانش بشری موجود در اینترنت را برای آموزش مدلهایی مانند GPT-۴ و Gemini مورد استفاده قرار دادهاند. این موضوع، استفاده از دادههای مصنوعی را به عنوان یک راهکار موقت اجتنابناپذیر کرده است. دادههای مصنوعی، که توسط خود مدلهای هوش مصنوعی تولید میشوند، میتوانند برای آموزش مدلهای جدیدتر به کار روند، اما این روش بدون چالش نیست.
شرکتهایی مانند متا و مایکروسافت پیشتر از دادههای مصنوعی استفاده کردهاند، اما این روش خطراتی به همراه دارد. یکی از مهمترین این خطرات، پدیده "توهمهای هوش مصنوعی" است که منجر به تولید اطلاعات نادرست یا بیمعنی توسط مدلها میشود. ماسک در این خصوص هشدار داده و به دشواری تشخیص اطلاعات صحیح از توهمات اشاره کرده است. همچنین، استفاده مداوم از دادههای مصنوعی میتواند منجر به "فروپاشی مدل" شود، که در آن مدلها خلاقیت خود را از دست داده و خروجیهای تکراری و یکجانبه تولید میکنند. این موضوع توسط اندرو دانکن، مدیر مؤسسه آلن تورینگ نیز تأیید شده است.
علاوه بر این، استفاده از دادههای مصنوعی میتواند باعث کاهش تنوع و جامعیت مدلها شود. از آنجا که دادههای مصنوعی بر اساس الگوهای موجود در دادههای قبلی تولید میشوند، احتمال تقویت سوگیریها و عدم توجه به زبانها و فرهنگهای خاص افزایش مییابد. محققان در حال بررسی راهحلهایی مانند ترکیب دادههای مصنوعی با دادههای انسانی باکیفیت، توسعه الگوریتمهای تشخیص توهمات و ایجاد پایگاههای داده جدید با مشارکت کاربران هستند تا بتوانند آیندهای پایدارتر و قابل اعتمادتر را برای هوش مصنوعی رقم بزنند.

نظرات