پایگاه دانش, سئو وردپرس

آیا گوگل فایل‌ها و محتواهای PDF را ایندکس می‌کند؟

آیا گوگل فایل‌ها و محتواهای PDF را ایندکس می‌کند؟

ممکن است برای شما سوال باشد که آیا گوگل فایل‌ها و محتواهای PDF را ایندکس می‌کند؟ یا به عبارت دیگر، آیا فایل های PDF در سئو سایت تاثیر دارند؟

اخیرا، جان مولر تأیید کرد که آنها فایل‌های PDF را درست مانند هر صفحه وب دیگری، در نتایج جستجوی گوگل ایندکس می‌کنند،. جان مولر همچنین بینشی در مورد اینکه چرا چنین فایل پی‌دی‌افی با وجود این ممکن است ایندکس نشود، ارائه کرد.

در Google Hangout، سؤال زیر در ساعت 18:48 پرسیده شد:

سوال: به نظر نمی رسد که من نمی توانم تعداد زیادی از pdf های خود را در صفحات محصول خود نمایه کنم. آیا باید فقط محتوا را در برگه محصول خود نیز اضافه کنم، بنابراین در هر دو مکان وجود دارد؟ آیا این باعث مشکلات تکراری و ایده ای برای ایندکس نشدن آنها می شود؟

جان مولر: به طور کلی ما فایل‌های PDF را مانند سایر صفحات عادی در یک وب‌سایت فهرست‌بندی می‌کنیم. چیزی که احتمالاً با PDF ها اتفاق می افتد این است که ما آنها را به سرعت صفحات HTML معمولی به روز نمی کنیم زیرا فرض می کنیم که فایل های PDF پایدار می مانند. اما این مشکل شما به نظر نمی رسد. با توجه به نمایه سازی فایل های PDF، در صورت مشاهده لینک به آن صفحات، سعی می کنیم آن صفحات را فهرست بندی کنیم تا در نتایج جستجو قرار گیرند.

جان مولر: بنابراین اگر ما نتوانیم آن صفحات را نمایه کنیم، در این صورت در یافتن پیوندهای آن فایل‌های پی‌دی‌اف با مشکل مواجه هستیم که ممکن است به این دلیل باشد که یافتن آن‌ها در وب‌سایت سخت است یا ممکن است در HTML ایستا نیستند یا دارای یک فایل PDF هستند. لینک nofollow یا چیزی شبیه به آن یا ممکن است فقط بگوییم که محتوای کافی از وب سایت شما نمایه شده است.

ما هنوز برای افزودن دسته قابل توجهی از محتوای بیشتر آماده نیستیم. بنابراین نمی‌توانیم تضمین کنیم که همه محتوای یک وب‌سایت را فهرست‌بندی می‌کنیم، به این معنی که برای برخی از وب‌سایت‌ها، در برخی موقعیت‌ها، ممکن است یک بریدگی داشته باشیم و بگوییم که قبلاً محتوای زیادی از این وب‌سایت ایندکس کرده‌ایم.

ما به خزیدن محتوای بیشتری از این وب سایت ادامه خواهیم داد، و اگر چیزی واقعاً قانع کننده پیدا کنیم، آن را نیز در فهرست قرار خواهیم داد. شاید این پی دی اف‌ها محتوایی باشند که ما به آن نگاه کرده‌ایم یا محتوایی هستند که وقت نکرده‌ایم از وب‌سایت به آن نگاه کنیم.

جان مولر: اگر محتوای مهمی در آن پی‌دی‌اف‌ها وجود دارد که باید آن‌ها را نمایه کنید، ممکن است ارزش آن را داشته باشد که مستقیماً در صفحه محصول قرار دهید. به این ترتیب مردم برای دیدن آن محتوا نیازی به دانلود PDF ندارند. بنابراین اگر مهم است، شاید آن را مستقیماً در صفحه قرار دهید. اگر بیشتر محتوای کمکی است، مانند مطالب مرجع که ممکن است افراد بخواهند به آن نگاه کنند، اما نیازی به رتبه بندی جداگانه ندارند، شاید فقط لینک دادن از صفحات محصول شما خوب باشد.

سوالات متداول ایندکس فایل PDF

این اولین بار نیست که موضوع نمایه سازی فایل های PDF مطرح می شود. در یک پست وبلاگ مرکزی وب مستر در سپتامبر 2011، گری ایلیس از گوگل به برخی از سوالات در مورد نمایه سازی PDF پاسخ داد که در زیر به طور خلاصه به آنها اشاره خواهیم کرد:

آیا گوگل می‌تواند فایل‌های PDF را فهرست کند؟

به طور کلی، بله، گوگل پی دی اف ها را می خزند مگر اینکه با رمز عبور محافظت شده یا رمزگذاری شده باشند. اگر متن به عنوان تصویر جاسازی شده باشد، Google ممکن است آن تصاویر را برای استخراج متن پردازش کند. قانون کلی این است که اگر می‌توانید متن را از یک سند PDF کپی کنید، گوگل باید بتواند محتوای pdf را جستجو کرده و محتوا را فهرست‌بندی کند.

با تصاویر موجود در فایل های PDF چه اتفاقی می افتد؟

تصاویر درون فایل‌های PDF ایندکس نمی‌شوند (مانند سال 2011).

پیوندها در فایل های PDF چگونه رفتار می شوند؟

با پیوندها مانند پیوندهای درون صفحات وب رفتار می شود. آنها PageRank و سایر سیگنال های نمایه سازی را پاس می کنند و هنگام خزیدن دنبال می شوند. امکان “nofollow” پیوندها در یک فایل PDF وجود ندارد.

چگونه می توانم از نمایش فایل های PDF خود در نتایج جستجو جلوگیری کنم. یا اگر قبلا این کار را انجام داده اند، چگونه می توانم آنها را حذف کنم؟

شما باید یک “X-Robots-Tag: noindex” در سربرگ HTTP که برای ارائه فایل استفاده می شود، اضافه کنید. اگر از قبل ایندکس شده باشند، هدر پیاده سازی شده باعث می شود به مرور زمان از بین بروند. همچنین می‌توانید از ابزار حذف URL استفاده کنید.

آیا فایل های PDF می توانند رتبه بالایی در نتایج جستجو داشته باشند؟

فایل های PDF می توانند رتبه ای مشابه صفحات وب داشته باشند.

اگر من یک کپی از صفحات خود را به صورت HTML و PDF داشته باشم، محتوای تکراری محسوب می شود؟

آره. اگر باید هر دو نسخه را ارائه دهید، باید یک نسخه را به نسخه دیگر متعارف کنید.

چگونه می توانم بر عنوان نشان داده شده در نتایج جستجو برای سند PDF خود تأثیر بگذارم؟

گوگل از ابرداده عنوان در فایل و متن لنگر پیوندهایی که به فایل PDF اشاره می کنند استفاده می کند. گوگل توصیه می کند که هر دو را تنظیم کنید.

چگونه فایل های PDF را در گوگل جستجو کنیم؟

1. برای جستجوی فایل های PDF از عملگر filetype استفاده کنید

اگر می خواهید فایل های PDF را در گوگل جستجو کنید، می توانید از عملگر “filetype:” استفاده کنید.

برای جستجوی فایل های PDF برای عبارت جستجو شده “SEO PDF” عبارت زیر را تایپ کنید:

  • filetype:pdf SEO PDF
  • سپس «جستجوی گوگل» را بزنید.

چگونه فایل های PDF را در گوگل جستجو کنیم؟

2. صفحه نتایج PDF را در سمت چپ هر نتیجه نشان می دهد

می توانید اسکرین شات از نتایج را در تصویر زیر ببینید.

چگونه فایل های PDF را در گوگل جستجو کنیم؟

فایل‌های PDF حتی می‌توانند در قطعه‌های ویژه نمایش داده شوند

در 17 ژانویه 2019، کوین ایندیگ در توییتر گزارش داد که گوگل اکنون در حال استخراج اسنیپت های برجسته از فایل های PDF است.

من مثال ارائه شده را امتحان کردم و تا 26 ژانویه همچنان کار می کرد. در زیر می توانید اسکرین شات را ببینید:

فایل‌های PDF حتی می‌توانند در قطعه‌های ویژه نمایش داده شوند

شما هم می توانید امتحان کنید. بسیاری از متخصصان سئو اکنون PDF خود را برای موتورهای جستجو بهینه می کنند.

به پایان این مقاله رسیدیم، امیدواریم که پاسخ سوال آیا گوگل فایل‌ها و محتواهای PDF را ایندکس می‌کند؟ را به خوبی گرفته باشید. همچنین ممکن است بخواهید مقاله دیگر ما را در مورد سئو وردپرس ببینید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *