زندگی در گذشته‌ی با کمک مدل‌های زبانی (LLM)

زندگی در گذشته‌ی با کمک مدل‌های زبانی (LLM)

در روزهای آغازین پیدایش هوش مصنوعی، یکی از برنامه‌های مثال‌زدنی و رایج، بازی «Hexapawn» بود؛ نسخه‌ای بسیار ساده شده از شطرنج که با کمک شما یاد می‌گرفت چگونه بازی کند. وقتی کامپیوتر حرکت بدی انجام می‌داد، شما آن را تنبیه می‌کردید. با این حال، مردم خیلی زود فهمیدند که می‌توانند حرکات «خوب» کامپیوتر را هم تنبیه کنند تا مطمئن شوند همیشه در برابر ماشین پیروز می‌شوند.

مدل‌های زبانی بزرگ (LLMs) امروزی به نظر می‌رسد «همه‌چیز» را می‌دانند، اما این «همه‌چیز» در واقع هر آن چیزی است که در اینترنت وجود دارد؛ از اطلاعات علمی گرفته تا شکلک‌های اسب آبی! همین موضوع باعث شد «هایک گریگوریان» (Hayk Grigorian) به فکر فرو برود و پروژه‌ای به نام TimeCapsule LLM (کپسول زمانِ مدل زبانی) را بسازد تا هوش مصنوعی‌ای داشته باشد که فقط بر اساس داده‌های تاریخی عمل می‌کند.

فرار از دانش مدرن

مطمئناً شما می‌توانید به یک چت‌بات مدرن دستور بدهید (Prompt) که تصور کند در سال ۱۸۷۵ در لندن زندگی می‌کند و مطابق با آن زمان پاسخ دهد. اما مشکل اینجاست که چت‌بات‌ها ماهیتی آماری دارند؛ به همین دلیل ممکن است خیلی راحت دانش مدرن از دهانشان بپرد. اما از آنجایی که «کپسول زمان» فقط داده‌های سال ۱۸۷۵ و قبل از آن را می‌شناسد، با کمال میل به شما خواهد گفت که مثلاً سفر به ماه غیرممکن است. اگر از یک مدل زبانی سنتی بخواهید نقش بازی کند، او اغلب به چیزهایی اشاره می‌کند که ما امروز می‌دانیم درست است، اما در آن دوره زمانی خاص برای هیچ‌کس شناخته شده نبود.

برای امتحان، چت با ChatGPT و گفتن این جمله که «او شخصی است که در سال ۱۲۰۰ میلادی در گلاسگو زندگی می‌کند»، تا حدی دانش او را محدود کرد. با این حال، باز هم توانست به وجود قاره آمریکای شمالی و اتم اشاره کند! درست است که وایکینگ‌ها حدود سال ۱۰۰۰ میلادی آمریکای شمالی را کشف کرده بودند و «دموکریتوس» در قرن پنجم پیش از میلاد درباره ماده تقسیم‌ناپذیر (اتم) نوشته بود، اما این دانش قطعاً در سال ۱۲۰۰ میلادی میان مردم عادی رایج نبوده است. آموزش دیدن بر اساس متون همان دوره، قطعاً بازنمایی بسیار بهتری از یک شخصیت تاریخی ارائه می‌دهد.

جزئیات مدلی که در گذشته بوده و کاربردها

این مدل (TimeCapsule) از متونی استفاده می‌کند که بین سال‌های ۱۸۰۰ تا ۱۸۷۵ در لندن منتشر شده‌اند. در مجموع، حدود ۹۰ گیگابایت فایل متنی در بدنه آموزشی این مدل وجود دارد. اما آیا این کار کاربردی هم دارد؟

علاقه آکادمیک زیادی برای بازسازی مدل‌های دقیق از دوره‌های زمانی مختلف جهت مطالعه تاریخ وجود دارد. برخی نیز به این پروژه به عنوان راهی برای ردیابی تعصبات و سوگیری‌های آن دوران و مقایسه آن‌ها با سوگیری‌های موجود در داده‌های امروزی نگاه می‌کنند. البته برخلاف اینترنت امروز، اسناد باقی‌مانده از قرن نوزدهم کمتر حاوی مطالب پیش‌پاافتاده و روزمره هستند؛ بنابراین هنوز مشخص نیست که چنین مدلی تا چه حد می‌تواند برای درک جزئیات زندگی عادی آن دوران دقیق باشد.

به جای خواندن اخبار، مدل‌های زبانی حالا می‌توانند خودشان اخبار بنویسند. فقط به یاد داشته باشید که ماهیت آماری این مدل‌ها، دستکاری آن‌ها را در طول فرآیند آموزش نیز بسیار آسان می‌کند.

منبع

پاسخ‌ها

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پاسخ‌ها

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *