فهرست مطالب
گوگل به تازگی یک مقاله پژوهشی منتشر کرده است که نشان می دهد چگونه می توان هدف جستجو را از دل تعاملات کاربران استخراج کرد.
این فناوری جدید قرار است برای ایجنت های خودمختار (Autonomous Agents) که به صورت مستقل عمل می کنند، مورد استفاده قرار بگیرد.
روشی که محققان گوگل کشف کرده اند بر پایه مدل های کوچک روی دستگاه (On-device Small Models) بنا شده است.
نکته بسیار مهم این است که این مدل ها نیازی به ارسال داده ها به سرورهای مرکزی گوگل ندارند و به همین دلیل حریم خصوصی کاربران کاملا محفوظ می ماند.
محققان دریافتند که با شکستن این مسئله پیچیده به دو وظیفه جداگانه، می توانند راه حل بسیار کارآمدی پیدا کنند.
جالب است بدانید که این راه حل آنقدر خوب عمل کرده که توانسته است رکورد مدل های زبانی بزرگ چند وجهی (MLLMs) را که در دیتاسنترهای عظیم اجرا می شوند، بشکند.
مدل های هوشمند کوچک در مرورگر و سئو موبایل
تمرکز اصلی این پژوهش جدید روی شناسایی هدف جستجو است که از طریق بررسی رفتارهای کاربر انجام می شود.
گوگل می خواهد بداند کاربر چه اقداماتی را روی دستگاه موبایل یا مرورگر وب خود انجام می دهد.
نکته کلیدی اینجاست که تمام این اطلاعات روی خود دستگاه باقی می ماند تا حریم خصوصی حفظ شود و هیچ دیتایی به سرورهای گوگل فرستاده نشود.
این یعنی تمام پردازش ها باید مستقیماً روی سخت افزار کاربر انجام شود که برای سئو موبایل اهمیت زیادی دارد.
محققان گوگل برای رسیدن به این هدف، فرآیند را به دو مرحله تقسیم کردند.
در مرحله اول، مدلی که روی دستگاه نصب شده، خلاصه ای از کارهایی که کاربر انجام داده است را تهیه می کند.
سپس این خلاصه ها به مدل دوم تحویل داده می شوند تا مدل دوم بتواند هدف جستجو و نیت اصلی کاربر را تشخیص دهد.
تیم تحقیق در توضیح این روش می گوید که متد دو مرحله ای آن ها عملکرد بسیار بهتری نسبت به مدل های کوچک قبلی دارد.
حتی جالب است که این روش توانسته مدل های زبانی بزرگ چندوجهی (MLLM) پیشرفته را هم شکست دهد.
علاوه بر این، سیستم جدید به خوبی می تواند داده های نویزی و نامنظم را مدیریت کند، کاری که روش های سنتی در آن ضعف داشتند.
استخراج نیت کاربر از طریق تجربه کاربری و رابط بصری
تکنیک استخراج هدف از روی اسکرین شات ها و توضیحات متنی، روشی بود که در سال ۲۰۲۵ با کمک مدل های MLLMs مطرح شد.
تیم گوگل اعلام کرده که همان رویکرد را پیش گرفته اما با استفاده از پرامپت های (دستورات) بسیار پیشرفته تر و بهینه تر.
استخراج نیت کاربر اصلاً کار ساده ای نیست و ممکن است در مراحل مختلف خطاهای زیادی رخ دهد.
محققان از اصطلاح خط سیر یا مسیر (Trajectory) استفاده می کنند تا تجربه کاربری و سفر کاربر در یک اپلیکیشن یا وب سایت را توصیف کنند.
این سفر کاربر به یک فرمول دقیق تبدیل می شود که هر تعامل در آن شامل دو بخش اصلی است.
بخش اول مشاهده (Observation) نام دارد که وضعیت بصری صفحه را نشان می دهد و دقیقاً با مباحث سئو عکس مرتبط است چون اسکرین شات لحظه ای را ثبت می کند.
بخش دوم اقدام (Action) است که شامل کارهایی مثل کلیک روی دکمه، تایپ کردن یا استفاده از تکنیک های لینک سازی داخلی (کلیک روی لینک) می شود.
در نهایت محققان سه ویژگی حیاتی را برای یک استخراج هدف موفق معرفی کردند.
اولین ویژگی وفاداری (Faithful) است؛ یعنی فقط باید چیزهایی توصیف شوند که واقعاً در مسیر اتفاق افتاده اند.
ویژگی دوم جامعیت (Comprehensive) است؛ یعنی باید تمام اطلاعات لازم درباره هدف کاربر ارائه شود تا بتوان مسیر را بازسازی کرد.
و سومین ویژگی مرتبط بودن (Relevant) است؛ به این معنی که اطلاعات اضافه و بیهوده نباید در داده ها وجود داشته باشد.
چالشهای ارزیابی هدف جستجو و هوش مصنوعی
تیم تحقیقاتی گوگل توضیح می دهد که سنجش و امتیازدهی به هدف جستجو استخراج شده، کار بسیار دشواری است.
دلیل اصلی این سختی، وجود جزئیات پیچیده در نیت کاربران است؛ مواردی مثل تاریخ های خاص یا اطلاعات مربوط به تراکنش های مالی.
علاوه بر این، نیت کاربران کاملاً ذهنی (Subjective) است و ابهامات زیادی دارد که حل کردنشان ساده نیست.
وقتی از تجربه کاربری و مسیرهای طی شده صحبت می کنیم، با موضوعی ذهنی روبرو هستیم چون انگیزه های درونی کاربر معمولاً پنهان و مبهم است.
به عنوان مثال، وقتی کاربری یک محصول را انتخاب می کند، آیا این کار را بخاطر قیمت انجام داده یا ویژگی های فنی محصول؟
رفتارهای کاربر و اسکرین شات های بصری (که در سئو عکس تحلیل می شوند) قابل مشاهده هستند، اما انگیزه اصلی نه.
جالب است بدانید در مقالات سئو و تحقیقات قبلی مشخص شده که درک انسان ها از نیت یکدیگر در وب ۸۰ درصد و در موبایل ۷۶ درصد تطابق دارد.
بنابراین نمی توان با اطمینان گفت که پیمودن یک مسیر خاص توسط کاربر، لزوماً نشان دهنده یک هدف مشخص و ثابت است.
رویکرد دو مرحله ای در مدل های زبانی
محققان گوگل روش های مختلفی مثل استدلال زنجیره فکر (Chain of Thought – CoT) را بررسی کردند.
اما چون مدل های زبانی کوچک (Small Language Models) در پردازش های استدلالی ضعف داشتند، این روش ها رد شدند.
در نهایت، آن ها یک رویکرد دو مرحله ای را انتخاب کردند که عملکرد سئو و هوش مصنوعی را در شبیه سازی استدلال بهبود می بخشد.
محققان این فرآیند دو مرحله ای را به شکل زیر تشریح کردند:
در مرحله اول، ما از پرامپت نویسی استفاده می کنیم تا برای هر تعامل کاربر یک خلاصه دقیق تولید کنیم.
این تعامل شامل یک تصویر بصری از صفحه و توضیحات متنی درباره کاری است که کاربر انجام داده است.
این مرحله کاملاً وابسته به پرامپت است، چون در حال حاضر هیچ داده آموزشی استانداردی وجود ندارد که برای تک تک تعاملات برچسب گذاری شده باشد.
در مرحله دوم، تمام این خلاصه های جزئی را به یک مدل ثانویه می دهیم.
وظیفه این مدل دوم این است که یک توصیف جامع و کلی از نیت کاربر ارائه دهد.
ما برای بالا بردن دقت کار، در این مرحله دوم از تکنیک تنظیم دقیق یا همان Fine-tuning استفاده می کنیم.
هدف جستجو و مراحل فنی استخراج آن
در بررسی تخصصی هدف جستجو (Search Intent)، تیم تحقیقاتی گوگل فرآیند را با تحلیل دقیق اسکرین شات ها آغاز می کند.
آن ها این خلاصه سازی بصری را به چند بخش تقسیم می کنند، اما نکته جالب وجود یک بخش سوم پنهان است.
بخش اول شامل توصیف عناصری است که روی صفحه نمایش دیده می شوند.
بخش دوم به توصیف دقیق اقداماتی که کاربر انجام داده است می پردازد.
اما بخش سوم که «هدف حدسی» نام دارد، در واقع تکنیکی هوشمندانه برای حذف گمانه زنی های مدل هوش مصنوعی است.
در این روش، به مدل اجازه داده می شود تا حدس بزند، اما سپس این حدسیات حذف می شوند تا کیفیت خروجی نهایی افزایش یابد.
مرحله دوم: تولید توصیف کلی با سئو و هوش مصنوعی
در مرحله دوم، محققان از تکنیک های پیشرفته سئو و هوش مصنوعی برای تنظیم دقیق (Fine-tune) مدل استفاده کردند.
داده های آموزشی در این مرحله شامل خلاصه تعاملات کاربر و حقیقت زمینه ای (Ground Truth) است که هدف نهایی را توصیف می کند.
در ابتدا، مدل دچار توهم (Hallucination) می شد، زیرا سعی می کرد اطلاعات ناقص ورودی را با تخیل خود کامل کند.
برای حل این مشکل، محققان اهداف هدف را اصلاح کردند و جزئیات اضافه را حذف نمودند.
این کار باعث شد مدل یاد بگیرد که استنتاج خود را صرفاً بر اساس داده های ورودی واقعی انجام دهد، نه حدسیات.
ملاحظات اخلاقی و محدودیت های سئو موبایل
این مقالات سئو و پژوهشی، هشدارهایی جدی درباره مسائل اخلاقی عوامل خودمختار (Autonomous Agents) می دهند.
اگر این سیستم ها بدون کنترل باشند، ممکن است اقداماتی برخلاف منافع کاربر انجام دهند.
یکی از محدودیت های مهم این تحقیق، تمرکز آن بر محیط اندروید و وب است که مستقیماً به سئو موبایل مربوط می شود.
بنابراین، نتایج این آزمایش فعلاً قابل تعمیم به اکوسیستم اپل نیست و تنها کاربران انگلیسی زبان آمریکا را پوشش داده است.
در حال حاضر، هیچ نشانه ای وجود ندارد که این روش ها در الگوریتم های فعلی مثل رنک برین گوگل استفاده شوند.
با این حال، با افزایش قدرت پردازش موبایل ها، درک هدف روی دستگاه (On-device) آینده ویژگی های کمکی خواهد بود.
نکات کلیدی و آینده استراتژی محتوا
این پژوهش ها مستقیماً به جستجوی کلاسیک گوگل اشاره ندارند، بلکه بر عوامل هوشمند خودمختار تمرکز دارند.
این سیستم ها رفتار کاربر را مشاهده می کنند تا هدف نهایی او را درک کنند.
دو کاربرد اصلی این فناوری شامل «کمک پیشگیرانه» برای شخصی سازی بهتر و «حافظه شخصی سازی شده» است.
این موارد می توانند در آینده بخشی از استراتژی محتوا و تعامل با کاربر باشند.
در نهایت، این تحقیقات نشان می دهد گوگل به سمتی می رود که مدل های کوچک روی دستگاه، رفتار کاربر را برای بهبود تجربه کاربری رصد می کنند.
این مدل ها نه فقط برای جستجو، بلکه برای درک عمیق تر نیازهای کاربر و کمک لحظه ای به او طراحی شده اند.

من، جعفر جلالی، سایت ایران بک لینک را راهاندازی کردم. با تکیه بر تجربیاتی که طی سالها در کسبوکارهای آنلاین به دست آوردهام و همچنین استفاده از منابع اصلی و معتبر انگلیسی، تلاش کردم بهترین مقالات و منابع آموزشی در زمینه سئو را به زبان فارسی گردآوری کنم. هدف من از ایجاد ایران بک لینک این است که به کسبوکارهای آنلاین کمک کنم تا با دسترسی به اطلاعات کاربردی و جامع، به موفقیت بیشتری دست پیدا کنند. امیدوارم که ایران بک لینک بتواند به منبعی قابلاعتماد برای شما تبدیل شود.

