فهرست مطالب

5/5 - (1 امتیاز)

گوگل اخیراً تحقیقاتی درباره الگوریتمی جدید منتشر کرده که قادر است محتوای صفحات وب شما و رقبایتان را دریافت کرده و با ترکیب آن‌ها، مقالاتی منسجم ایجاد کند. این الگوریتم که با نام الگوریتم Paraphrasing شناخته می‌شود، توانایی تولید محتوای اصلی را دارد و می‌تواند بدون نیاز به هدایت کاربر به سایر صفحات وب، پاسخ‌های موردنظر او را ارائه دهد.

الگوریتم Paraphrasing

الگوریتم Paraphrasing چگونه کار می‌کند؟

الگوریتم جدید گوگل با تحلیل محتوای وب و استفاده از فرآیندی خاص، محتوای شما را استخراج کرده و بخش‌های غیرمرتبط را حذف می‌کند. این روش شباهت زیادی به الگوریتم‌هایی دارد که برای تولید Featured Snippet‌ها استفاده می‌شوند.

در این فرآیند، بخش‌هایی که به‌عنوان خلاصه‌های استخراجی شناخته می‌شوند، مستقیماً از صفحات وب دریافت می‌شوند. این خلاصه‌ها مانند چکیده‌ای از مهم‌ترین جملات یک متن هستند و درواقع الگوریتم می‌تواند با ترکیب چندین مقاله، محتوایی جدید و منحصر‌به‌فرد ایجاد کند.

ترکیب خلاصه‌های استخراجی و خلاصه‌های چکیده

الگوریتم Paraphrasing علاوه بر خلاصه‌های استخراجی، از نوع دیگری از الگوریتم به نام خلاصه چکیده نیز بهره می‌برد. این روش شامل بازنویسی محتوا به شکلی جدید است که گاهی به نقل قول شباهت پیدا می‌کند.

یکی از مشکلات این روش، ایجاد اطلاعات نادرست است. تحقیقات نشان داده‌اند که حدود یک‌سوم از خلاصه‌های چکیده ممکن است شامل داده‌های جعلی باشند. برای رفع این مشکل، گوگل روشی ترکیبی را به کار گرفته است. ابتدا با استفاده از خلاصه‌های استخراجی، اطلاعات معتبر را از اسناد مختلف وب دریافت می‌کند، سپس از روش خلاصه‌نویسی چکیده برای بیان این اطلاعات بهره می‌برد.

ایجاد محتوای اختصاصی توسط گوگل

این رویکرد باعث می‌شود که گوگل بتواند اسناد جدیدی را بر پایه اطلاعات موجود در وب تولید کند، مشابه آنچه که در ویکی‌پدیا اتفاق می‌افتد. به گفته گوگل:

«ما نشان داده‌ایم که تولید مقالات ویکی‌پدیای انگلیسی را می‌توان به‌عنوان خلاصه‌نویسی چندین سند از منابع مختلف در نظر گرفت.»

این جمله به این معناست که گوگل می‌تواند اطلاعات مرتبط با یک موضوع را از چندین منبع مختلف جمع‌آوری کند. سپس این اطلاعات با استفاده از خلاصه‌های استخراجی تحلیل می‌شوند تا بخش‌های مهم مشخص شوند.

مدل انتزاعی عصبی برای تولید مقاله

در مرحله نهایی، گوگل از یک مدل انتزاعی عصبی برای تولید مقاله استفاده می‌کند. این مدل قادر است معانی استخراج‌شده از محتوای مختلف را پردازش کرده و آن‌ها را در قالب پاراگراف‌های طبیعی و خوانا بازنویسی کند.

گوگل تأکید دارد که محتوای تولیدشده توسط الگوریتم Paraphrasing می‌تواند توسط انسان‌ها بررسی و تأیید شود:

«ما نشان داده‌ایم که این مدل می‌تواند پاراگراف‌هایی روان و منسجم ایجاد کند… همچنین قادر است اطلاعات معتبر را استخراج کرده و در ارزیابی‌های انسانی مورد تأیید قرار گیرد.»

ارتباط الگوریتم Paraphrasing با Featured Snippet

یکی از کاربردهای مشابه این الگوریتم، Featured Snippet‌ها هستند. در این فرآیند، گوگل محتوای صفحات را بررسی کرده، اطلاعات غیرضروری را حذف می‌کند و جملاتی کلیدی را که پاسخ دقیق به سؤال کاربر می‌دهند، نگه می‌دارد.

همچنین الگوریتمی دیگر در گوگل برای خلاصه‌نویسی محتوای صفحات وب در Google Voice استفاده می‌شود که با نام Sentence Compression by Deletion with LSTM شناخته می‌شود. این الگوریتم نیز به روشی مشابه، اطلاعات اصلی را از متن استخراج کرده و در قالب جملات کوتاه و مفید ارائه می‌دهد.

آیا الگوریتم Paraphrasing گوگل محتوای شما را خلاصه می‌کند؟

الگوریتم Paraphrasing گوگل، به جای خلاصه کردن محتوای شما، بیشتر به پردازش و بازنویسی محتوای موجود می‌پردازد. این الگوریتم برای جمع‌آوری و تجزیه‌وتحلیل «مستندات متعدد» و ایجاد یک جمع‌بندی از آن‌ها طراحی شده است. به‌طور خاص، می‌توان آن را در مواردی مانند کتاب‌ها و پایگاه‌های داده اطلاعات اوپن سورس به کار برد. از آنجا که این الگوریتم به محتوای موجود در صفحات وب عمومی نیز اعمال می‌شود، می‌تواند تأثیر زیادی بر محتوای شما داشته باشد.

تحقیقات انجام‌شده بر اساس نتایج موتورهای جستجو و منابعی مانند ویکی پدیا نشان داده است که گاهی اوقات از این منابع برای تولید مقالات جدید استفاده می‌شود. همچنین، الگوریتم Paraphrasing تستی انجام داده است که در آن دسته‌ای از محتوای جدید را با استفاده از رفرنس‌هایی که در ویکی پدیا اشاره شده، تولید می‌کند.

در این تحقیق، فرآیند انجام‌شده به این صورت است:

«مستندات مرجع از یک موتور جستجو استخراج شده و به‌عنوان جستجوی مشابه با موضوع ویکی پدیا استفاده می‌شوند. در این روش، نتایج با مستنداتی که فقط در بخش مراجع مقالات ویکی پدیا موجود هستند، مقایسه می‌شوند.»

ترجمه این جمله‌ها به زبان فارسی به وضوح نشان می‌دهد که ویکی پدیا به‌عنوان یک سرچ کوئری و همچنین صفحات نتایج موتورهای جستجو (SERP) و محتوای موجود در وب، به‌عنوان منابع اصلی برای تولید پاسخ‌های جدید استفاده می‌شوند که می‌توانند به‌طور مستقیم به سوالات کاربران پاسخ دهند، بدون اینکه نیازی به ارجاع به صفحات خاص باشد.

مقاله تحقیقاتی که بررسی می‌کند آیا گوگل مشخص می‌کند که محتوای خود را از شما گرفته است یا خیر، به این موضوع اشاره نکرده و توضیحی در مورد اضافه کردن لینک‌ها به‌عنوان بخشی از SERP یا در پاورقی منابع اصلی ارائه نمی‌دهد.

آیا گوگل دیگر محتوای شما را نمایش نمی‌دهد؟

یک تحقیق نشان داده که آزمایش انجام‌شده در این زمینه موفقیت‌آمیز بوده است. بر اساس این مطالعه، گوگل می‌تواند محتوای خود را با ترکیب اطلاعات مختلف تولید کند و مستقیماً به پرسش کاربران پاسخ دهد، بدون اینکه نیازی به کلیک روی وب‌سایت‌ها باشد. این موضوع می‌تواند برای مدیران سایت‌ها و تولیدکنندگان محتوا خبری ناخوشایند باشد.

در مقاله تحقیقاتی گوگل آمده است:

«ما نشان دادیم که استخراج اطلاعات از ویکی‌پدیا می‌تواند چالش‌هایی را در خلاصه‌سازی چندین سند ایجاد کند.»

منظور از «چندین سند» هر منبعی است که آزادانه در دسترس باشد، از جمله صفحات وب شما و رقبایتان.

مقاله همچنین درباره عملکرد الگوریتم Paraphrasing می‌گوید:

«این مدل، نسبت به معماری سنتی encoder-decoder در پردازش متون طولانی عملکرد بهتری دارد و این امکان را فراهم می‌کند که منابع مختلف بررسی شده و مقالات منسجم و آموزنده‌ای برای ویکی‌پدیا تولید شود.»

این موضوع نشان می‌دهد که گوگل قادر است از منابع مختلف در سطح وب برای تولید محتوای «منسجم» و «آموزنده» استفاده کند، مسئله‌ای که ممکن است برای بسیاری از فعالان حوزه محتوا نگرانی‌هایی ایجاد کند.

آیا گوگل از الگوریتم Paraphrasing در دستیار صوتی خود استفاده می‌کند؟

هنوز مشخص نیست که گوگل قصد دارد این الگوریتم را در دستیار صوتی خود به کار بگیرد یا نه. با این حال، الگوریتم Paraphrasing به دلیل قابلیت پردازش زبان طبیعی، می‌تواند گزینه‌ای ایده‌آل برای جستجوهای صوتی باشد. این جستجوها معمولاً از طریق تلفن‌های همراه یا دستگاه‌های هوشمند (IoT) انجام می‌شوند.

اگر این الگوریتم در دستیار صوتی گوگل پیاده‌سازی شود، هنگام دریافت سؤال‌هایی درباره موضوعات مختلف، پاسخ‌هایی طبیعی و روان ارائه خواهد کرد، مشابه زمانی که از یک فرد واقعی سؤال می‌شود.

گوگل مدت‌هاست که به دنبال توسعه فناوری‌هایی شبیه به کامپیوتر دستیار صوتی در سریال Star Trek است. در سال ۲۰۱۴، گزارش‌هایی منتشر شد که نشان می‌داد نسخه اولیه جستجوی صوتی گوگل، به صدای بازیگری که در این سریال نقش دستیار صوتی را ایفا کرده بود، رمزگذاری شده است. در چنین شرایطی، استفاده از الگوریتم Paraphrasing می‌تواند کاملاً با این رویکرد همخوانی داشته باشد.

سخن پایانی

الگوریتم Paraphrasing یکی از ابزارهای گوگل برای پردازش اطلاعات وب است که با تحلیل محتواهای مختلف، بخش‌های غیرضروری را حذف کرده و خلاصه‌ای مفید و کاربردی ارائه می‌دهد. هدف اصلی این الگوریتم، تسهیل دسترسی کاربران به اطلاعات موردنظرشان بدون نیاز به مطالعه کامل صفحات وب است، مسئله‌ای که می‌تواند بر میزان بازدید وب‌سایت‌ها تأثیرگذار باشد.

5/5 - (1 امتیاز)

پست های مرتبط

مقاله های دیگر