چرا مسئلهی canonicalization اهمیت دارد

Canonicalization (تعیین نسخه اصلی صفحه)، کلمهای است که تلفظ و نوشتن آن سخت است، اما برای جلوگیری از مشکلات محتوای تکراری در وبسایت شما بسیار حیاتی است. مفهوم یک صفحه canonical (اصلی) به این معناست که این صفحه، نسخه مهم، صحیح و اصلی است، و سایر صفحات مشابه، نسخههای کپی هستند و نباید توسط موتورهای جستجو بهطور مستقل شمارش شوند.
اگر در وبسایت خود صفحات مشابه زیادی دارید، مشخص کردن اینکه کدام یک از آنها نسخه اصلی است، میتواند به بهبود سئوی سایت شما کمک کند و باعث شود رباتهای موتور جستجو وقت خود را صرف URLهایی نکنند که در واقع نمیخواهید در نتایج جستجو نمایش داده شوند.
این مورد بهویژه برای سایتهایی که به چند زبان ترجمه شدهاند، اهمیت زیادی دارد. برای اطلاعات بیشتر دربارهی کمک به رباتهای جستجو در درک سایتهای بینالمللی، ویدیوی مرتبط را ببینید.
در صفحه اصلی سایت Kick Point میتوانید نمونهای از تگ canonical را ببینید. این تگها در سال ۲۰۰۹ معرفی شدند، زمانی که صنعت سئو بهشدت نگران مسئلهی محتوای تکراری بود. وبسایتها روز به روز پیچیدهتر میشدند و مشکلاتی مثل تغییر URL بهوسیله فیلترها افزایش مییافت. رباتهای جستجو مجبور بودند تمام حالتهای ممکن فیلترها را بررسی کنند، که واقعاً اتلاف وقت بود.
تگهای canonical در چنین شرایطی بهشدت مفید هستند، مثلاً وقتی پارامترهایی در URL برای کنترل فیلتر محتوای صفحه اضافه میشوند. فرض کنید یک سایت فروش بازیهای فکری دارید. فیلترهای سایت شامل تعداد بازیکنان و مدت زمان بازی هستند.
این URL صفحه اصلی شماست:example.com/games
حالا فقط بازیهای دو نفره را انتخاب میکنیم:example.com/games?players=2
و سپس میخواهید فقط بازیهایی را ببینید که زیر ۳۰ دقیقه انجام میشوند:example.com/games?players=2&time=under30
بدون استفاده از تگ canonical، هرکدام از این URLها بهصورت مجزا ایندکس میشوند، حتی اگر فقط زیرمجموعهای از اطلاعات صفحه اصلی را نمایش دهند. به همین خاطر، ممکن است هیچکدام از این صفحات رتبه خوبی نگیرند چون محتوای مشابهی دارند.
تگ canonical در این حالت به این صورت خواهد بود:
htmlCopyEdit<link rel="canonical" href="https://example.com/games" />
در این حالت، مهم نیست چند پارامتر اضافه شود، فقط همان صفحه اول برای ایندکسشدن در نتایج جستجو مدنظر قرار میگیرد.
مشکلات canonical فقط مختص به فروشگاهها یا فیلترها نیست. مثلاً ما با یک مشتری سازنده خانه روبرو شدیم که دو نوع صفحه داشت: یکی مربوط به خانههای نمایشی (show homes) و دیگری خانههای آماده فروش که نسخه ساختهشده آن خانههای نمایشی بودند. تنها تفاوت آنها این بود که خانههای آماده، آدرس داشتند، ولی خانههای نمایشی فقط محل ساخت را ذکر کرده بودند.
ما تصمیم گرفتیم صفحه خانه نمایشی را به عنوان نسخه اصلی در نظر بگیریم، چون معمولاً مدت بیشتری در سایت باقی میماند. خانههای آماده سریعتر فروخته میشوند و مرتب تغییر میکنند. بنابراین تگ canonical روی صفحات خانههای آماده به صفحه مرتبط خانه نمایشی اشاره میکند.
یک مورد خاص دیگر زمانی است که فایلهای PDF در نتایج جستجو رتبه بالاتری از صفحات سایت شما بگیرند. در این حالت هم میتوانید از تگ canonical استفاده کنید تا موتور جستجو را از فایل PDF به سمت صفحه HTML سایت هدایت کنید. البته برای این کار نیاز به مقداری توسعه و برنامهنویسی هست، اما اگر چنین مشکلی دارید، قطعاً ارزشش را دارد.
چند نکته مهم دیگر درباره تگ canonical:
- فقط روی صفحاتی که میخواهید به جای دیگر اشاره کنند، تگ canonical نگذارید. همهی صفحات باید یک تگ canonical داشته باشند، حتی اگر به خودشان اشاره میکند. بیشتر سیستمهای مدیریت محتوا این کار را خودکار انجام میدهند، ولی اگر CMS اختصاصی دارید، ممکن است لازم باشد دستی اضافه کنید.
- در هر صفحه فقط یک تگ canonical بگذارید. بیش از یکی باعث سردرگمی رباتهای موتور جستجو میشود.
- در تگ canonical از آدرس کامل (absolute URL) استفاده کنید. مثلاً
https://example.com/page
نه/page
. شفافیت کامل در تعیین URL اصلی ضروری است.
برای اینکه بفهمید سایتتان مشکل canonical دارد یا نه، میتوانید از ابزارهای crawl استفاده کنید و بررسی محتوای تکراری را انجام دهید. اکثر ابزارهای crawling این قابلیت را دارند.
برای نمونه، سایت Wisdom Pet هیچ تگ canonical ندارد که اصلاً خوب نیست. همچنین، سایت خود را در Google Search Console بررسی کنید. به بخش عملکرد (Performance) بروید و URLهای غیرعادی را بررسی کنید. همینطور گزارش Coverage را بررسی کنید تا هرگونه مشکل canonical را شناسایی کنید.