فهرست مطالب
گوگل اخیراً تحقیقاتی درباره الگوریتمی جدید منتشر کرده که قادر است محتوای صفحات وب شما و رقبایتان را دریافت کرده و با ترکیب آنها، مقالاتی منسجم ایجاد کند. این الگوریتم که با نام الگوریتم Paraphrasing شناخته میشود، توانایی تولید محتوای اصلی را دارد و میتواند بدون نیاز به هدایت کاربر به سایر صفحات وب، پاسخهای موردنظر او را ارائه دهد.
الگوریتم Paraphrasing چگونه کار میکند؟
الگوریتم جدید گوگل با تحلیل محتوای وب و استفاده از فرآیندی خاص، محتوای شما را استخراج کرده و بخشهای غیرمرتبط را حذف میکند. این روش شباهت زیادی به الگوریتمهایی دارد که برای تولید Featured Snippetها استفاده میشوند.
در این فرآیند، بخشهایی که بهعنوان خلاصههای استخراجی شناخته میشوند، مستقیماً از صفحات وب دریافت میشوند. این خلاصهها مانند چکیدهای از مهمترین جملات یک متن هستند و درواقع الگوریتم میتواند با ترکیب چندین مقاله، محتوایی جدید و منحصربهفرد ایجاد کند.
ترکیب خلاصههای استخراجی و خلاصههای چکیده
الگوریتم Paraphrasing علاوه بر خلاصههای استخراجی، از نوع دیگری از الگوریتم به نام خلاصه چکیده نیز بهره میبرد. این روش شامل بازنویسی محتوا به شکلی جدید است که گاهی به نقل قول شباهت پیدا میکند.
یکی از مشکلات این روش، ایجاد اطلاعات نادرست است. تحقیقات نشان دادهاند که حدود یکسوم از خلاصههای چکیده ممکن است شامل دادههای جعلی باشند. برای رفع این مشکل، گوگل روشی ترکیبی را به کار گرفته است. ابتدا با استفاده از خلاصههای استخراجی، اطلاعات معتبر را از اسناد مختلف وب دریافت میکند، سپس از روش خلاصهنویسی چکیده برای بیان این اطلاعات بهره میبرد.
ایجاد محتوای اختصاصی توسط گوگل
این رویکرد باعث میشود که گوگل بتواند اسناد جدیدی را بر پایه اطلاعات موجود در وب تولید کند، مشابه آنچه که در ویکیپدیا اتفاق میافتد. به گفته گوگل:
«ما نشان دادهایم که تولید مقالات ویکیپدیای انگلیسی را میتوان بهعنوان خلاصهنویسی چندین سند از منابع مختلف در نظر گرفت.»
این جمله به این معناست که گوگل میتواند اطلاعات مرتبط با یک موضوع را از چندین منبع مختلف جمعآوری کند. سپس این اطلاعات با استفاده از خلاصههای استخراجی تحلیل میشوند تا بخشهای مهم مشخص شوند.
مدل انتزاعی عصبی برای تولید مقاله
در مرحله نهایی، گوگل از یک مدل انتزاعی عصبی برای تولید مقاله استفاده میکند. این مدل قادر است معانی استخراجشده از محتوای مختلف را پردازش کرده و آنها را در قالب پاراگرافهای طبیعی و خوانا بازنویسی کند.
گوگل تأکید دارد که محتوای تولیدشده توسط الگوریتم Paraphrasing میتواند توسط انسانها بررسی و تأیید شود:
«ما نشان دادهایم که این مدل میتواند پاراگرافهایی روان و منسجم ایجاد کند… همچنین قادر است اطلاعات معتبر را استخراج کرده و در ارزیابیهای انسانی مورد تأیید قرار گیرد.»
ارتباط الگوریتم Paraphrasing با Featured Snippet
یکی از کاربردهای مشابه این الگوریتم، Featured Snippetها هستند. در این فرآیند، گوگل محتوای صفحات را بررسی کرده، اطلاعات غیرضروری را حذف میکند و جملاتی کلیدی را که پاسخ دقیق به سؤال کاربر میدهند، نگه میدارد.
همچنین الگوریتمی دیگر در گوگل برای خلاصهنویسی محتوای صفحات وب در Google Voice استفاده میشود که با نام Sentence Compression by Deletion with LSTM شناخته میشود. این الگوریتم نیز به روشی مشابه، اطلاعات اصلی را از متن استخراج کرده و در قالب جملات کوتاه و مفید ارائه میدهد.
آیا الگوریتم Paraphrasing گوگل محتوای شما را خلاصه میکند؟
الگوریتم Paraphrasing گوگل، به جای خلاصه کردن محتوای شما، بیشتر به پردازش و بازنویسی محتوای موجود میپردازد. این الگوریتم برای جمعآوری و تجزیهوتحلیل «مستندات متعدد» و ایجاد یک جمعبندی از آنها طراحی شده است. بهطور خاص، میتوان آن را در مواردی مانند کتابها و پایگاههای داده اطلاعات اوپن سورس به کار برد. از آنجا که این الگوریتم به محتوای موجود در صفحات وب عمومی نیز اعمال میشود، میتواند تأثیر زیادی بر محتوای شما داشته باشد.
تحقیقات انجامشده بر اساس نتایج موتورهای جستجو و منابعی مانند ویکی پدیا نشان داده است که گاهی اوقات از این منابع برای تولید مقالات جدید استفاده میشود. همچنین، الگوریتم Paraphrasing تستی انجام داده است که در آن دستهای از محتوای جدید را با استفاده از رفرنسهایی که در ویکی پدیا اشاره شده، تولید میکند.
در این تحقیق، فرآیند انجامشده به این صورت است:
«مستندات مرجع از یک موتور جستجو استخراج شده و بهعنوان جستجوی مشابه با موضوع ویکی پدیا استفاده میشوند. در این روش، نتایج با مستنداتی که فقط در بخش مراجع مقالات ویکی پدیا موجود هستند، مقایسه میشوند.»
ترجمه این جملهها به زبان فارسی به وضوح نشان میدهد که ویکی پدیا بهعنوان یک سرچ کوئری و همچنین صفحات نتایج موتورهای جستجو (SERP) و محتوای موجود در وب، بهعنوان منابع اصلی برای تولید پاسخهای جدید استفاده میشوند که میتوانند بهطور مستقیم به سوالات کاربران پاسخ دهند، بدون اینکه نیازی به ارجاع به صفحات خاص باشد.
مقاله تحقیقاتی که بررسی میکند آیا گوگل مشخص میکند که محتوای خود را از شما گرفته است یا خیر، به این موضوع اشاره نکرده و توضیحی در مورد اضافه کردن لینکها بهعنوان بخشی از SERP یا در پاورقی منابع اصلی ارائه نمیدهد.
آیا گوگل دیگر محتوای شما را نمایش نمیدهد؟
یک تحقیق نشان داده که آزمایش انجامشده در این زمینه موفقیتآمیز بوده است. بر اساس این مطالعه، گوگل میتواند محتوای خود را با ترکیب اطلاعات مختلف تولید کند و مستقیماً به پرسش کاربران پاسخ دهد، بدون اینکه نیازی به کلیک روی وبسایتها باشد. این موضوع میتواند برای مدیران سایتها و تولیدکنندگان محتوا خبری ناخوشایند باشد.
در مقاله تحقیقاتی گوگل آمده است:
«ما نشان دادیم که استخراج اطلاعات از ویکیپدیا میتواند چالشهایی را در خلاصهسازی چندین سند ایجاد کند.»
منظور از «چندین سند» هر منبعی است که آزادانه در دسترس باشد، از جمله صفحات وب شما و رقبایتان.
مقاله همچنین درباره عملکرد الگوریتم Paraphrasing میگوید:
«این مدل، نسبت به معماری سنتی encoder-decoder در پردازش متون طولانی عملکرد بهتری دارد و این امکان را فراهم میکند که منابع مختلف بررسی شده و مقالات منسجم و آموزندهای برای ویکیپدیا تولید شود.»
این موضوع نشان میدهد که گوگل قادر است از منابع مختلف در سطح وب برای تولید محتوای «منسجم» و «آموزنده» استفاده کند، مسئلهای که ممکن است برای بسیاری از فعالان حوزه محتوا نگرانیهایی ایجاد کند.
آیا گوگل از الگوریتم Paraphrasing در دستیار صوتی خود استفاده میکند؟
هنوز مشخص نیست که گوگل قصد دارد این الگوریتم را در دستیار صوتی خود به کار بگیرد یا نه. با این حال، الگوریتم Paraphrasing به دلیل قابلیت پردازش زبان طبیعی، میتواند گزینهای ایدهآل برای جستجوهای صوتی باشد. این جستجوها معمولاً از طریق تلفنهای همراه یا دستگاههای هوشمند (IoT) انجام میشوند.
اگر این الگوریتم در دستیار صوتی گوگل پیادهسازی شود، هنگام دریافت سؤالهایی درباره موضوعات مختلف، پاسخهایی طبیعی و روان ارائه خواهد کرد، مشابه زمانی که از یک فرد واقعی سؤال میشود.
گوگل مدتهاست که به دنبال توسعه فناوریهایی شبیه به کامپیوتر دستیار صوتی در سریال Star Trek است. در سال ۲۰۱۴، گزارشهایی منتشر شد که نشان میداد نسخه اولیه جستجوی صوتی گوگل، به صدای بازیگری که در این سریال نقش دستیار صوتی را ایفا کرده بود، رمزگذاری شده است. در چنین شرایطی، استفاده از الگوریتم Paraphrasing میتواند کاملاً با این رویکرد همخوانی داشته باشد.
سخن پایانی
الگوریتم Paraphrasing یکی از ابزارهای گوگل برای پردازش اطلاعات وب است که با تحلیل محتواهای مختلف، بخشهای غیرضروری را حذف کرده و خلاصهای مفید و کاربردی ارائه میدهد. هدف اصلی این الگوریتم، تسهیل دسترسی کاربران به اطلاعات موردنظرشان بدون نیاز به مطالعه کامل صفحات وب است، مسئلهای که میتواند بر میزان بازدید وبسایتها تأثیرگذار باشد.
پست های مرتبط