Canonicalization (تعیین نسخه اصلی صفحه)، کلمه‌ای است که تلفظ و نوشتن آن سخت است، اما برای جلوگیری از مشکلات محتوای تکراری در وب‌سایت شما بسیار حیاتی است. مفهوم یک صفحه canonical (اصلی) به این معناست که این صفحه، نسخه مهم، صحیح و اصلی است، و سایر صفحات مشابه، نسخه‌های کپی هستند و نباید توسط موتورهای جستجو به‌طور مستقل شمارش شوند.

اگر در وب‌سایت خود صفحات مشابه زیادی دارید، مشخص کردن اینکه کدام یک از آن‌ها نسخه اصلی است، می‌تواند به بهبود سئوی سایت شما کمک کند و باعث شود ربات‌های موتور جستجو وقت خود را صرف URLهایی نکنند که در واقع نمی‌خواهید در نتایج جستجو نمایش داده شوند.

این مورد به‌ویژه برای سایت‌هایی که به چند زبان ترجمه شده‌اند، اهمیت زیادی دارد. برای اطلاعات بیشتر درباره‌ی کمک به ربات‌های جستجو در درک سایت‌های بین‌المللی، ویدیوی مرتبط را ببینید.

در صفحه اصلی سایت Kick Point می‌توانید نمونه‌ای از تگ canonical را ببینید. این تگ‌ها در سال ۲۰۰۹ معرفی شدند، زمانی که صنعت سئو به‌شدت نگران مسئله‌ی محتوای تکراری بود. وب‌سایت‌ها روز به روز پیچیده‌تر می‌شدند و مشکلاتی مثل تغییر URL به‌وسیله فیلترها افزایش می‌یافت. ربات‌های جستجو مجبور بودند تمام حالت‌های ممکن فیلترها را بررسی کنند، که واقعاً اتلاف وقت بود.

تگ‌های canonical در چنین شرایطی به‌شدت مفید هستند، مثلاً وقتی پارامترهایی در URL برای کنترل فیلتر محتوای صفحه اضافه می‌شوند. فرض کنید یک سایت فروش بازی‌های فکری دارید. فیلترهای سایت شامل تعداد بازیکنان و مدت زمان بازی هستند.

این URL صفحه اصلی شماست:
example.com/games

حالا فقط بازی‌های دو نفره را انتخاب می‌کنیم:
example.com/games?players=2

و سپس می‌خواهید فقط بازی‌هایی را ببینید که زیر ۳۰ دقیقه انجام می‌شوند:
example.com/games?players=2&time=under30

بدون استفاده از تگ canonical، هرکدام از این URLها به‌صورت مجزا ایندکس می‌شوند، حتی اگر فقط زیرمجموعه‌ای از اطلاعات صفحه اصلی را نمایش دهند. به همین خاطر، ممکن است هیچ‌کدام از این صفحات رتبه خوبی نگیرند چون محتوای مشابهی دارند.

تگ canonical در این حالت به این صورت خواهد بود:

htmlCopyEdit<link rel="canonical" href="https://example.com/games" />

در این حالت، مهم نیست چند پارامتر اضافه شود، فقط همان صفحه اول برای ایندکس‌شدن در نتایج جستجو مدنظر قرار می‌گیرد.

مشکلات canonical فقط مختص به فروشگاه‌ها یا فیلترها نیست. مثلاً ما با یک مشتری سازنده خانه روبرو شدیم که دو نوع صفحه داشت: یکی مربوط به خانه‌های نمایشی (show homes) و دیگری خانه‌های آماده فروش که نسخه ساخته‌شده آن خانه‌های نمایشی بودند. تنها تفاوت آن‌ها این بود که خانه‌های آماده، آدرس داشتند، ولی خانه‌های نمایشی فقط محل ساخت را ذکر کرده بودند.

ما تصمیم گرفتیم صفحه خانه نمایشی را به عنوان نسخه اصلی در نظر بگیریم، چون معمولاً مدت بیشتری در سایت باقی می‌ماند. خانه‌های آماده سریع‌تر فروخته می‌شوند و مرتب تغییر می‌کنند. بنابراین تگ canonical روی صفحات خانه‌های آماده به صفحه مرتبط خانه نمایشی اشاره می‌کند.

یک مورد خاص دیگر زمانی است که فایل‌های PDF در نتایج جستجو رتبه بالاتری از صفحات سایت شما بگیرند. در این حالت هم می‌توانید از تگ canonical استفاده کنید تا موتور جستجو را از فایل PDF به سمت صفحه HTML سایت هدایت کنید. البته برای این کار نیاز به مقداری توسعه و برنامه‌نویسی هست، اما اگر چنین مشکلی دارید، قطعاً ارزشش را دارد.

چند نکته مهم دیگر درباره تگ canonical:

  1. فقط روی صفحاتی که می‌خواهید به جای دیگر اشاره کنند، تگ canonical نگذارید. همه‌ی صفحات باید یک تگ canonical داشته باشند، حتی اگر به خودشان اشاره می‌کند. بیشتر سیستم‌های مدیریت محتوا این کار را خودکار انجام می‌دهند، ولی اگر CMS اختصاصی دارید، ممکن است لازم باشد دستی اضافه کنید.
  2. در هر صفحه فقط یک تگ canonical بگذارید. بیش از یکی باعث سردرگمی ربات‌های موتور جستجو می‌شود.
  3. در تگ canonical از آدرس کامل (absolute URL) استفاده کنید. مثلاً https://example.com/page نه /page. شفافیت کامل در تعیین URL اصلی ضروری است.

برای اینکه بفهمید سایت‌تان مشکل canonical دارد یا نه، می‌توانید از ابزارهای crawl استفاده کنید و بررسی محتوای تکراری را انجام دهید. اکثر ابزارهای crawling این قابلیت را دارند.

برای نمونه، سایت Wisdom Pet هیچ تگ canonical ندارد که اصلاً خوب نیست. همچنین، سایت خود را در Google Search Console بررسی کنید. به بخش عملکرد (Performance) بروید و URLهای غیرعادی را بررسی کنید. همین‌طور گزارش Coverage را بررسی کنید تا هرگونه مشکل canonical را شناسایی کنید.