در روزهای آغازین پیدایش هوش مصنوعی، یکی از برنامههای مثالزدنی و رایج، بازی «Hexapawn» بود؛ نسخهای بسیار ساده شده از شطرنج که با کمک شما یاد میگرفت چگونه بازی کند. وقتی کامپیوتر حرکت بدی انجام میداد، شما آن را تنبیه میکردید. با این حال، مردم خیلی زود فهمیدند که میتوانند حرکات «خوب» کامپیوتر را هم تنبیه کنند تا مطمئن شوند همیشه در برابر ماشین پیروز میشوند.
مدلهای زبانی بزرگ (LLMs) امروزی به نظر میرسد «همهچیز» را میدانند، اما این «همهچیز» در واقع هر آن چیزی است که در اینترنت وجود دارد؛ از اطلاعات علمی گرفته تا شکلکهای اسب آبی! همین موضوع باعث شد «هایک گریگوریان» (Hayk Grigorian) به فکر فرو برود و پروژهای به نام TimeCapsule LLM (کپسول زمانِ مدل زبانی) را بسازد تا هوش مصنوعیای داشته باشد که فقط بر اساس دادههای تاریخی عمل میکند.
فرار از دانش مدرن
مطمئناً شما میتوانید به یک چتبات مدرن دستور بدهید (Prompt) که تصور کند در سال ۱۸۷۵ در لندن زندگی میکند و مطابق با آن زمان پاسخ دهد. اما مشکل اینجاست که چتباتها ماهیتی آماری دارند؛ به همین دلیل ممکن است خیلی راحت دانش مدرن از دهانشان بپرد. اما از آنجایی که «کپسول زمان» فقط دادههای سال ۱۸۷۵ و قبل از آن را میشناسد، با کمال میل به شما خواهد گفت که مثلاً سفر به ماه غیرممکن است. اگر از یک مدل زبانی سنتی بخواهید نقش بازی کند، او اغلب به چیزهایی اشاره میکند که ما امروز میدانیم درست است، اما در آن دوره زمانی خاص برای هیچکس شناخته شده نبود.
برای امتحان، چت با ChatGPT و گفتن این جمله که «او شخصی است که در سال ۱۲۰۰ میلادی در گلاسگو زندگی میکند»، تا حدی دانش او را محدود کرد. با این حال، باز هم توانست به وجود قاره آمریکای شمالی و اتم اشاره کند! درست است که وایکینگها حدود سال ۱۰۰۰ میلادی آمریکای شمالی را کشف کرده بودند و «دموکریتوس» در قرن پنجم پیش از میلاد درباره ماده تقسیمناپذیر (اتم) نوشته بود، اما این دانش قطعاً در سال ۱۲۰۰ میلادی میان مردم عادی رایج نبوده است. آموزش دیدن بر اساس متون همان دوره، قطعاً بازنمایی بسیار بهتری از یک شخصیت تاریخی ارائه میدهد.
جزئیات مدلی که در گذشته بوده و کاربردها
این مدل (TimeCapsule) از متونی استفاده میکند که بین سالهای ۱۸۰۰ تا ۱۸۷۵ در لندن منتشر شدهاند. در مجموع، حدود ۹۰ گیگابایت فایل متنی در بدنه آموزشی این مدل وجود دارد. اما آیا این کار کاربردی هم دارد؟
علاقه آکادمیک زیادی برای بازسازی مدلهای دقیق از دورههای زمانی مختلف جهت مطالعه تاریخ وجود دارد. برخی نیز به این پروژه به عنوان راهی برای ردیابی تعصبات و سوگیریهای آن دوران و مقایسه آنها با سوگیریهای موجود در دادههای امروزی نگاه میکنند. البته برخلاف اینترنت امروز، اسناد باقیمانده از قرن نوزدهم کمتر حاوی مطالب پیشپاافتاده و روزمره هستند؛ بنابراین هنوز مشخص نیست که چنین مدلی تا چه حد میتواند برای درک جزئیات زندگی عادی آن دوران دقیق باشد.
به جای خواندن اخبار، مدلهای زبانی حالا میتوانند خودشان اخبار بنویسند. فقط به یاد داشته باشید که ماهیت آماری این مدلها، دستکاری آنها را در طول فرآیند آموزش نیز بسیار آسان میکند.




پاسخها