5 quy tắc và 7 sai lầm nghiêm trọng khi triển khai Canonical tag

Không còn là khái niệm mới mẻ với marketers đó là canonical tags là gì?

Năm 2009, Google, Microsoft và Yahoo đã hợp nhất để cùng tạo ra thẻ canonical. Với mong muốn hỗ trợ chủ website giải pháp hiệu quả để khắc phục các vấn đề duplicate content một cách nhanh chóng và dễ dàng hơn.

  • Nhưng đâu đó bạn vẫn không hiểu thật sự canonical tags là gì?
  • Cách triển khai ra sao?
  • Chúng có thực sự giúp ích cho hoạt động của website hay không?

Tất cả sẽ được giải đáp trong bài viết này. Hãy cùng tôi tìm hiểu nhé!

Canonical tag là gì?

Thẻ canonical tag (rel=“canonical”) – Là một đoạn mã HTML xác định phiên bản chính cho các trang trùng lặp, gần trùng lặp và tương tự nhau.

canonical url là gì
Canonical tags là gì?

Nếu có nội dung giống hoặc tương tự trong các URL khác nhau. Bạn có thể sử dụng canonical tag để chỉ định loại nào là phiên bản chính và sau đó, index nó.

Canonical tags là gì chúng có cấu trúc thể nào? Đó là cú pháp đơn giản, nhất quán và đặc biệt thường được đặt trong phần <head> của website, chẳng hạn như:

<link rel=“canonical” href=“https://example.com/sample-page/” />

canonical là gì
Cấu trúc của canonical tags là gì

Ý nghĩa của từng phần trong đoạn mã Canonical tagslà gì? Hiểu như sau:

  • link rel=“canonical”:  Liên kết trong thẻ này là bản gốc của trang này.
  • href=“https://example.com/sample-page/”: truy cập bản gốc tại URL này.

Bạn có biết: Duplicate content là điều Google cực kỳ “ghét”, do nó sẽ làm Google không xác định được:

  • Bản nào của trang cần index.
  • Loại nào của trang dùng để xếp hạng cho các truy vấn có liên quan.
  • Liệu họ có nên hợp nhất “link equity” trên một trang hay chia nó thành nhiều loại.

Quá nhiều nội dung trùng lặp cũng làm tổn hại đến “ngân sách thu thập thông tin”. Có nghĩa là, Google sẽ dành thời gian thu thập thông tin nhiều bản sao của cùng một trang thay vì khám phá các nội dung quan trọng khác trên trang web.

Tuy nhiên, thẻ Canonical là gì sẽ giúp giải quyết tất cả các vấn đề trên bằng cách: Thông báo cho Google phiên bản trang mà họ nên lập chỉ mục và xếp hạng, cũng như nơi hợp nhất “liên kết công bằng”.

Trong trường hợp không xác định được URL gốc (URL chuẩn). Google sẽ xem xét và quyết định cho bạn loại hoặc URL tốt nhất.

Tất nhiên, việc dựa vào Google như vậy không phải là một ý kiến hay. Bởi vì họ có thể chọn ngẫu nhiên một URL mà bạn không thực sự muốn nó là URL gốc.

canonical tag
Nếu không xác định được canonical URL thì Google sẽ thay bạn xem xét và quyết định loại hoặc URL tốt nhất.

Lưu ý nhỏ về ngân sách thu thập dữ liệu

Tất nhiên, việc buộc Google lãng phí thời gian thu thập thông tin nội dung trùng lặp là điều nên tránh. May mắn thay, không có quá nhiều trang web gặp sự cố này.

Đối với các trang mới thành lập, nếu được thu thập thông tin trong cùng một ngày, chúng sẽ xuất bản nội dung. Sau đó, ngân sách thu thập thông tin không phải là điều mà quản trị viên web cần phải lo lắng vì không có quá nhiều dữ liệu để xem xét kỹ lưỡng. Tương tự như vậy, các trang web có ít hơn vài nghìn URL sẽ được thu thập thông tin hiệu quả hơn.

Sự thật về Duplicate content

Bạn đã bao giờ nghĩ rằng miễn là bạn không đăng các bài viết hoặc trang giống nhau nhiều lần, bạn sẽ không nhận được nội dung trùng lặp theo mặc định?

Vì vậy, hãy nhớ rằng công cụ tìm kiếm thu thập dữ liệu URL, không phải dữ liệu trang.

Nghĩa là, họ sẽ xác định URL example.com/product và URL example.com/product?color=red trên hai trang khác nhau. Mặc dù chúng là cùng một trang web với nội dung giống hệt nhau hoặc tương tự nhau.

Chúng được gọi là URL được tham số hóa và chúng là nguyên nhân phổ biến của nội dung trùng lặp. Đặc biệt trên web thương mại điện tử có điều hướng được lọc (bộ lọc tùy chỉnh tìm kiếm của người dùng dựa trên những gì họ đang tìm kiếm)

Ví dụ, Brown Bag Clothing chuyên bán áo sơ mi. Đây là URL cho trang danh mục chính của họ: https://www.bbclothing.co.uk/en-gb/clothing/shirts.html

Nếu bạn chỉ lọc áo sơ mi XL, một thông số sẽ được thêm vào URL như sau: https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL

Nếu bạn cũng chỉ lọc áo sơ mi màu xanh lam thì một thông số khác sẽ được thêm vào: https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&color= Blue

Trong mắt Google, cả ba URL trên đều là các trang riêng biệt, mặc dù nội dung của chúng chỉ khác nhau một chút. Nhưng không chỉ các trang web thương mại điện tử trở thành nạn nhân của nội dung trùng lặp. Dưới đây là một số nguyên nhân khác của nội dung trùng lặp áp dụng cho tất cả các loại trang web:

  1. Có parameterized URLs cho các tìm kiếm chọn lọc (VD: example.com?q=search-term)
  2. Có parameterized URLs cho các IDs phiên (VD: https://example.com?sessionid=3)
  3. Các loại trang có thể in riêng biệt (VD: example.com/page and example.com/print/page)
  4. URL riêng biệt cho mỗi bài đăng trong các danh mục khác nhau (VD: example.com/services/SEO/ and example.com/specials/SEO/)
  5. Gồm pages cho các loại thiết bị khác nhau (VD: example.com and m.example.com)
  6. Đồng thời cả AMP và non-AMP trong cùng 1 trang (VD: example.com/page and amp.example/page)
  7. Cùng một nội dung ở các biến thể non-www và www variants (VD: http://example.com and http://www.example.com)
  8. Và cung cấp cùng một nội dung ở các biến thể non-https và https variants (VD: http://www.example.com and https://www.example.com)
  9. Cùng một nội dung có và không có dấu gạch chéo (VD: https://example.com/page/ and http://www.example.com/page)
  10. Có cùng một nội dung ở các bản mặc định, chẳng hạn như trang index (VD: https://www.example.com/, https://www.example.com/index.htm,..)
  11. Cùng một nội dung có và không có chữ viết hoa (VD: https://example.com/page/ and http://www.example.com/Page/)

Trong những tình huống này, điều rất quan trọng là phải sử dụng đúng thẻ canonical .. Hơn nữa, nội dung trùng lặp giữa nhiều tên miền cũng là điều cần lưu ý. Đây là trường hợp khi nội dung được chia sẻ trên 2 trang web khác nhau với mỗi trang là một phần của nội dung gốc. Nếu bạn là tác giả của bài viết gốc, bạn nên cài một thẻ canonical vào bài viết để thông báo rõ ràng cho các công cụ tìm kiếm.

Tất nhiên, các bài viết của bên thứ 3 được đăng lại từ bài viết của bạn vẫn có khả năng hiển thị trong danh sách tìm kiếm. Tuy nhiên, việc gắn các thẻ chuẩn sẽ giảm nguy cơ chúng được xếp hạng cao hơn so với nội dung gốc ..

Lưu ý: Vẫn có tình trạng một số web sẽ từ chối thêm canonical url. Trong những trường hợp này, bạn có muốn chấp nhận rủi ro hay không là tùy thuộc vào bạn.

Hướng dẫn triển khai canonical tag

Nhiều người thắc mắc Canonicals ta là gì có dễ thực hiện không. Trước khi thảo luận về bốn cách khác nhau để triển khai Canonical url. Tôi muốn giới thiệu 5 quy tắc vàng sau:

5 Quy tắc khi sử dụng canonical tags là gì

Quy tắc 1: Sử dụng URL tuyệt đối

John Mueller của Google nói rằng cách tốt nhất là không dùng đường dẫn tương đối với phần tử rel=“canonical” .

Thay vào đó, bạn nên dùng cấu trúc sau:

<link rel=“canonical” href=“https://example.com/sample-page/” />

Trái ngược với cấu trúc này:

<link rel=“canonical” href=”/sample-page/” />

Quy tắc 2: Sử dụng chữ viết thường trong URL

Google thường coi các URL viết hoa và viết thường là hai URL khác nhau. Tuy nhiên, bạn nên dùng chữ viết thường trong  URL trên máy chủ của mình, sau đó dùng URL viết thường cho canonical tag.

Quy tắc 3: Sử dụng đúng phiên bản miền HTTPS hay HTTP

Nếu bạn đã chuyển sang SSL. Hãy đảm bảo rằng bạn không khai báo bất kỳ URL không phải SSL (tức là HTTP) nào trong các thẻ canonical tag. Làm như vậy về mặt lý thuyết dẫn đến nhầm lẫn và kết quả không mong muốn.

Đối với secure domain, hãy đảm bảo rằng bạn dùng phiên bản URL sau:

<link rel=“canonical” href=“https://example.com/sample-page/” />

Còn nếu bạn không sử dụng HTTPS thì hãy dùng dạng URL này:

<link rel=“canonical” href=“http://example.com/sample-page/” />

Quy tắc 4: Sử dụng canonical tag tự tham chiếu

John Mueller cho rằng mặc dù không bắt buộc nhưng canonical tag tự tham chiếu vẫn là sự lựa chọn đáng cân nhắc. Vì nó giúp Google hiểu rõ bạn muốn index trang nào hoặc URL sẽ có cấu trúc như thế nào khi được index.

Về cơ bản, canonical tag tự tham chiếu là canonical url trên một trang mà trỏ link đến chính nó.

Ví dụ, nếu URL là https://example.com/sample-page, thì canonical url tự tham chiếu trên trang đó sẽ là:

<link rel=“canonical” href=“https://example.com/sample-page” />

Hầu hết các CMS phổ biến hiện đại đều tự động thêm các URL tự tham chiếu. Còn với CMS tùy chỉnh, bạn nhờ đến các nhà phát triển web  hardcode nó.

Quy tắc 5: Sử dụng 1 canonical tag cho mỗi trang

Nếu 1 trang có nhiều hơn 1 canonical tag, Google sẽ bỏ qua cả thảy.

Vì thế, mỗi trang chỉ nên dùng 1 canonical url thôi bạn nhé!

  • Cách triển khai thẻ canonical url

Có năm cách để chỉ định URL gốc với các tín hiệu chuẩn hóa sau:

  1. HTML tag (rel=canonical)
  2. HTTP header
  3. Sitemap
  4. 301 redirect*
  5. Liên kết nội bộ (Internal links)

Cài đặt thẻ canonical bằng cách sử dụng HTML rel = “canonical”

Sử dụng thẻ rel = canonical là cách đơn giản và rõ ràng nhất để chỉ định URL gốc.

Thực hiện cực kỳ đơn giản: chỉ cần thêm mã sau vào phần <head> của bất kỳ trang trùng lặp nào:

<link rel = “canonical” href = “https://example.com/canonical-page/” />

Ví dụ:

Giả sử bạn có một trang web thương mại điện tử bán áo thun. Bạn muốn chỉ định https://yourstore.com/tshirts/black-tshirts/ làm URL gốc. Ngay cả khi nội dung của trang đó có thể truy cập được qua các URL phù hợp, chẳng hạn như: https://yourstore.com/offers/black-tshirts/

Sau đó, chỉ cần thêm thẻ chuẩn sau vào bất kỳ trang trùng lặp nào:

<link rel = “canonical” href = “https://yourstore.com/tshirts/black-tshirts/” />

Lưu ý rằng nếu bạn đang sử dụng CMS, bạn không cần phải lo lắng về mã của trang.

Cài đặt canonical tag trong WordPress:

Trước hết, cài đặt Yoast SEO để canonical url tự tham chiếu sẽ được thêm tự động vào trang. Để thêm các mục tùy chỉnh cho thẻ, nhấp chọn phần “Nâng cao” trên mỗi bài đăng hoặc trang.

canonical url
Cài đặt canonical url trên Yoast SEO

Cài đặt canonical tag trên Shopify:

Shopify thêm URL gốc tự tham chiếu cho các sản phẩm và bài đăng trên blog theo mặc định. Để thêm mục tùy chỉnh cho URL gốc, bạn cần phải chỉnh sửa trực tiếp các tệp mẫu (.liquid).

Cài đặt canonical tag trên Squarespace:

Squarespace cũng thêm các URL tự tham chiếu theo mặc định và tương tự như trường hợp của Shopify. Bạn cần phải chỉnh sửa mã trực tiếp nếu muốn thêm tùy chỉnh vào URL gốc.

Cài đặt thẻ canonical trên các dòng tiêu đề HTTP

Đối với các tài liệu như PDF, không có cách nào để đặt thẻ canonical vào tiêu đề vì không có phần trang <head>. Trong những trường hợp như vậy, hãy sử dụng dòng tiêu đề HTTP để đặt thẻ chuẩn. Bạn cũng có thể sử dụng chuẩn trong tiêu đề HTTP cho các trang web chuẩn.

Ví dụ:

Giả sử tạo một tệp PDF của một bài đăng trên blog nhất định và lưu trữ nó trong một thư mục con (ahrefs.com/blog/*). Sau đó, tệp PDF sẽ có cấu trúc dòng tiêu đề HTTP sau:

HTTP / 1.1 200 OK

Loại nội dung: ứng dụng / pdf

Liên kết: <https://ahrefs.com/blog/canonical-tags/>; rel = “canonical”

Cài đặt thẻ canonical trong sitemaps

Google cho rằng các trang không có url chuẩn sẽ không được đưa vào sơ đồ trang web. Chỉ các URL chuẩn mới được liệt kê. Đó là bởi vì Google chỉ coi các trang được liệt kê trong sơ đồ trang là URL gốc được đề xuất.

Tuy nhiên, cũng có một số trường hợp họ từ chối chọn URL trong sơ đồ trang làm URL gốc.

Cài đặt thẻ canonical với 301 redirects

Sử dụng 301 redirects khi bạn muốn chuyển hướng lưu lượng truy cập ra khỏi URL trùng lặp và tới URL gốc.

Ví dụ;

Giả sử web của bạn có thể truy cập được tại các URL sau:

  • example.com
  • example.com/index.php
  • example.com/home/

Chọn một URL làm gốc và chuyển hướng các URL khác đến URL gốc đó.

Thực hiện tương tự với các phiên bản HTTPS / HTTP và www / không phải www trên trang web của mình. Chọn một bản chuẩn và chuyển hướng những bản khác đến phiên bản đó.

Ví dụ: Phiên bản chuẩn của ahrefs.com là URL HTTPS không phải www (https://ahrefs.com). Tất cả các URL sau đều chuyển hướng đến đó:

  • http://ahrefs.com/
  • http://www.ahrefs.com/
  • https://www.ahrefs.com/

Cài đặt thẻ canonical với các liên kết nội bộ

Cách bạn trỏ một liên kết từ trang này sang trang khác trên toàn bộ trang web của mình cũng được coi là một url chuẩn.

John Mueller đã đề cập đến các tín hiệu được sử dụng để xác định URL gốc trong video #AskGoogleWebmasters video

Tóm lại, bạn càng nhất quán với tất cả năm tín hiệu trên thì các công cụ của Google càng dễ dàng xác định URL gốc mong muốn được đưa vào. Như John đã đề cập trong video, Google cũng ủng hộ HTTPS hơn các URL HTTP và các URL đẹp hơn.

Những sai lầm thường gặp trong quá trình triển khai thẻ canonical

Canonicalization vốn là một chủ đề hơi phức tạp. Thực tế, có rất nhiều hiểu lầm và quan niệm sai lệch về việc triển khai canonical tags là gì đúng cách.

Dưới đây là một số sai lầm phổ biến mọi người thường mắc phải khi thực hiện thẻ canonical:

Sai lầm 1: Chặn URL được chuẩn hóa qua robots.txt

Việc chặn một URL trong robots.txt sẽ ngăn không cho Google thu thập dữ liệu. Có nghĩa là họ không thể thấy bất kỳ canonical url nào trên đó. Kết quả là Google cũng không tài nào chuyển hóa “link equity” từ non-canonical sang canonical.

Sai lầm 2: Đặt URL được chuẩn hóa thành ‘noindex’

Hãy nhớ rằng tốt nhất không nên kết hợp noindex và rel = canonical với nhau. Vì chúng là hai yếu tố hoàn toàn trái ngược nhau. .

Google thường sẽ ưu tiên trang chuẩn hơn thẻ “noindex”.

Trong trường hợp bạn muốn gắn thẻ URL chuẩn và noindex cùng một lúc, hãy sử dụng chuyển hướng 301. Nếu không, chỉ cần sử dụng rel = canonical.

Sai lầm 3: Đặt mã trạng thái HTTP 4XX cho URL gốc

Việc đặt mã HTTP 4XX cho URL gốc có tác động tương tự như việc dùng thẻ “noindex”. Google sẽ không thể nhìn thấy canonical tag để mà chuyển “link quity” sang bản gốc.

Sai lầm 4: Canonicalizing tất cả các paginated page đến page gốc

Các trang được phân trang không nên được triển khai url chuẩn cho các trang được phân trang đầu tiên trong chuỗi. Thay vào đó, chúng tôi sẽ sử dụng các thẻ chuẩn tự tham chiếu trên các trang này.

John Mueller đã đưa ra lời giải thích cho câu hỏi này như sau:

Nếu trang A không tương tự với trang B, thì thực tế là trang B đang sử dụng rel = canonical để trỏ đến trang A sẽ không được chấp thuận sử dụng rel = canonical không chính xác.

Bạn cũng nên sử dụng thẻ rel = prev / next để phân trang cho việc phân trang. Mặc dù cấu trúc này không phổ biến ở Google như một số trang web khác, chẳng hạn như Bing, nó vẫn sử dụng nó.

Sai lầm 5: Không sử dụng canonical tags với hreflang

Hreflang tags được sử dụng để chỉ định target đối tượng dựa vào ngôn ngữ và vị trí địa lý của website. Google khuyên rằng khi sử dụng hreflang: Bạn nên “chỉ định trang gốc có cùng một ngôn ngữ với website hoặc ngôn ngữ thay thế tốt nhất nếu không thể tìm ra ngôn ngữ chung cho cả 2”.

Sai lầm 6: Có quá nhiều thẻ rel=canonical

Có nhiều thẻ rel = canonical sẽ khiến Google dễ dàng bỏ qua tất cả chúng. Điều này xảy ra do các thẻ được thêm vào hệ thống ở các điểm khác nhau: Ví dụ: theo CMS, chủ đề và (các) plugin. Đây là lý do tại sao nhiều plugin có tùy chọn ghi đè để đảm bảo chúng là nguồn duy nhất cho url chuẩn.

Cũng có nhiều trường hợp thẻ rel = canonical được thêm vào bởi JavaScript. Google chỉ chấp thuận điều này nếu URL gốc không xuất hiện trong HTML và sau đó bạn thêm thẻ rel = canonical với JavaScript. Ngược lại, nếu HTML đã có thẻ chuẩn, bạn tiếp tục hoán đổi trang yêu thích của mình bằng JavaScript. Sau đó, có thể bạn đang làm khó Google bởi một loạt các tín hiệu hỗn hợp. Hãy cẩn thận!

Sai lầm 7: Đặt rel=canonical trong phần <body>

Rel = canonical chỉ nên xuất hiện trong <head> của tài liệu. Thẻ canonical trong phần <body> của web rất dễ bị bỏ qua.

Mặc dù mã nguồn của một trang có thể có thẻ rel = canonical ở đúng vị trí, nhưng khi nó thực sự được tạo trong trình duyệt hoặc được hiển thị bởi Google, có rất nhiều vấn đề xảy ra như: thẻ không được đóng, JavaScript bị chèn hoặc <iframes> trong <head>…, khiến cho <head> kết thúc sớm trong khung trình duyệt.

Trong trường hợp này, thẻ chuẩn đã được chuyển vào <body> của trang hiện đang hiển thị mà không cần phê duyệt.

Cách tìm và khắc phục sự cố canonicalization trên trang web

Rõ ràng, trong quá trình thực hiện pháp điển hóa rất dễ xảy ra sai sót. Do đó, bạn cần kiểm tra trang web của mình để tìm các vấn đề liên quan đến thẻ canonical và khắc phục chúng càng sớm càng tốt. Bạn nên sử dụng công cụ Kiểm tra trang web của Ahref để giải quyết hơn 100 mối quan tâm về thẻ chuẩn. SEO nói chung và thẻ canonical nói riêng là gì. Dưới đây là mười hai vấn đề liên quan đến thẻ chuẩn mà Kiểm tra trang web phát hiện và khắc phục một cách hiệu quả:

Trang canonical trỏ đến 4XX

Cảnh báo này được kích hoạt khi 1 hay nhiều trang được chuẩn hóa đến URL 4XX.

Vấn đề:

Google không index các trang 4XX vì chúng không hoạt động. Do đó, họ sẽ bỏ qua bất kỳ thẻ canonical nào trỏ đến như vậy. Thay vào đó, chọn index ngẫu nhiên 1 trang không có canonical.

Cách khắc phục:

Xem lại các trang bị ảnh hưởng và thay thế các canonical (4XX) đã chết bằng các liên kết đến các trang (200) đang hoạt động muốn được index.

Trang canonical trỏ đến 5XX

Cảnh báo này sẽ được kích hoạt khi 1 hay nhiều trang được chuẩn hóa đến URL 5XX.

Vấn đề:

Mã trạng thái HTTP 5XX chỉ ra rằng sự cố xảy ra với máy chủ. Điều này dẫn đến trang gốc không thể truy cập được. Google không có khả năng lập chỉ mục trang không thể truy cập, vì vậy trang gốc cũng bị bỏ qua.

Làm thế nào để khắc phục:

Thay thế mọi URL gốc bị lỗi bằng các URL hợp lệ. Trong trường hợp trang web ban đầu vẫn hoạt động tốt, hãy kiểm tra các cấu hình sai của máy chủ.

Lưu ý rằng đây có thể là sự cố tạm thời nếu thu thập thông tin xảy ra khi trang web của bạn ngừng hoạt động để bảo trì hoặc máy chủ trang web bị quá tải.

Trang canonical trỏ đến URL redirect

Cảnh báo này sẽ kích hoạt khi 1 hay là nhiều trang được chuẩn hóa đến URL redirect .

Vấn đề:

Canonicals phải trỏ đến phiên bản có thẩm quyền nhất của một trang mà URL redirect không thuộc dạng bản này. Trong trường hợp này, các công cụ tìm kiếm có thể hiểu sai hoặc bỏ qua các thẻ canonical.

Cách khắc phục:

Thay thế các canonical url bằng các kết nối trực tiếp đến phiên bản có thẩm quyền nhất của trang. Ví dụ như page trỏ về HTTP 200 và không chuyển hướng.

Duplicate pages không được gắn thẻ canonical

Cảnh báo này nó sẽ kích hoạt khi tồn tại một hoặc nhiều trang trùng lặp hoặc giống nhau nhưng không có trang nào trong số đó là bản gốc.

Vấn đề:

Vì không có trang nào được chỉ định là trang gốc. Nên Google sẽ cố gắng xác định loại phù hợp nhất để tự hiển thị trong kết quả tìm kiếm. Đây có thể không phải là loại mà bạn muốn được index.

Cách khắc phục:

Kiểm tra lại các trang duplicate. Sau đó, chỉ định 1 bản tốt nhất và chọn làm bản gốc để gắn canonical hoặc thẻ canonical tự tham chiếu.

Liên kết thẻ Hreflang đến các trang non-canonical

Cảnh báo này nó sẽ được kích hoạt khi 1 hay là nhiều trang chỉ định URL non-canonical trong hreflang.

Vấn đề:

Các liên kết trong thẻ hreflang phải luôn trỏ đến các trang canonical. Việc liên kết đến non-canonical của trang từ các chú thích hreflang có thể gây nhầm lẫn và đánh lừa công cụ tìm kiếm.

Cách khắc phục:

Thay thế các liên kết trong các chú thích hreflang của các trang bị ảnh hưởng bằng các canonical.

Canonical URL không có liên kết nội bộ

Cảnh báo này được kích hoạt khi một hoặc là nhiều canonical URL không có liên kết đến nội bộ.

Vấn đề:

Khách truy cập website không thể truy cập được các canonical URL không có kết nối nội bộ. Khi ấy, họ có thể được chuyển hướng đến các trang non-canonical

Cách khắc phục: 

Thay thế bất kỳ link nội bộ nào đến các trang canonical bằng các liên kết trực tiếp đến trang gốc.

Trang non-canonical trong sitemap

Cảnh báo này kích hoạt khi một hoặc nhiều trang non-canonical được liệt kê trong sitemap.

Vấn đề:

Google khuyên rằng bạn không nên đưa non-canonical URLs vào trong sitemap. Lý do đơn giản là các trang hiển thị trong sitemap chỉ nên là canonical page. Hay nói cách khác là những trang mà bạn muốn được index.

Cách khắc phục:

Loại bỏ non-canonical URLs ra khỏi sitemap.

Non-canonical page được chỉ định thành canonical page

Cảnh báo kích hoạt khi một hoặc nhiều trang chỉ định một URL chuẩn. URL này lại được canonical cho một trang khác. Điều này tạo ra một “chuỗi canonical”. Trong đó trang A được canonical đến trang B, sau đó được canonical đến trang C.

thẻ canonical
Cảnh báo kích hoạt URL chuẩn, URL này lại được canonical cho một trang khác

Vấn đề:

Chuỗi Canonical có thể gây nhầm lẫn và đánh lừa công cụ Google. Do đó, họ có thể hiểu sai hoặc bỏ qua các trang được canonical.

Cách khắc phục: 

Thay thế các liên kết không chuẩn trong thẻ chuẩn của trang bị ảnh hưởng bằng một liên kết trực tiếp đến trang chuẩn.

Ví dụ: nếu trang A là trang chuẩn cho trang B. Sau đó, trang chuẩn cho trang C. Thay thế liên kết chuẩn trên trang A bằng một liên kết trực tiếp đến trang C.

URL bên trong thẻ Open Graph  không khớp với canonical page

Cảnh báo này sẽ kích hoạt khi canonical URL và URL bên trong Open Graph URL không khớp nhau trên một hoặc nhiều trang.

Vấn đề:

Nếu  URL bên trong thẻ Open Graph URL sai lệch với canonical URL. Khi ấy non-canonical URL sẽ thay thế, được chia sẻ trên các mạng xã hội.

Cách khắc phục:

Thay thế URL trong thẻ URL Open Graph trên các trang bị ảnh hưởng bằng URL chuẩn. Đảm bảo rằng lần này hai URL giống nhau!

Lưu ý: URL bên trong thẻ Open Graph phải là tuyệt đối và sử dụng giao thức http: // hoặc https: //, giống như URL chuẩn.

Canonical từ  HTTPS sang HTTP

Cảnh báo này sẽ kích hoạt khi một hoặc nhiều secure (HTTPS) pages chỉ định non-secure (HTTP) page làm trang canonical.

Vấn đề:

HTTPS là một yếu tố xếp hạng. Vì vậy bạn nên chỉ định bản secure pages làm canonical nếu có thể.

Cách khắc phục:

Chuyển hướng trang HTTP sang HTTPS tương đương. Nếu không thể, hãy thêm liên kết rel = “canonical” từ phiên bản HTTP của trang vào phiên bản HTTPS.

Canonical từ HTTP sang HTTPS

Cảnh báo này nó kích hoạt khi một hoặc nhiều non-secure (HTTP) page chỉ định secure (HTTPS) pages làm trang canonical.

Vấn đề:

HTTPS luôn được ưu tiên hơn HTTP. Việc phiên bản HTTP của một trang chỉ định phiên bản HTTPS là trang canonical là điều không hề hợp lý.

Cách khắc phục:

Triển khai chuyển hướng 301 từ HTTP sang HTTPS. Bạn cũng nên thay thế mọi liên kết nội bộ tới phiên bản HTTP của trang bằng các liên kết trực tiếp đến HTTPS.

Non-canonical page nhận được lưu lượng truy cập organic

Cảnh báo này kích hoạt khi một hoặc nhiều trang non-canonical hiển thị trong kết quả tìm kiếm và nhận được lưu lượng truy cập organic (điều này sẽ không bao giờ xảy ra).

Vấn đề:

Trường hợp này xảy ra có thể là do canonical tag của bạn được thiết lập không chính xác hoặc Google đã chọn bỏ qua thẻ canonical do bạn tự chỉ định.

Cách khắc phục:

Kiểm tra xem các thẻ rel = canonical có được thiết lập chính xác trên tất cả các trang được báo cáo hay không. Nếu đó không phải là vấn đề, hãy sử dụng công cụ Kiểm tra URL trong Google Search Console để xem liệu họ có chấp thuận URL canonical do bạn chỉ định không.

Kết luận

Lần đầu tiên tìm hiểu về thẻ Canonical là gì có thể không dễ dàng như bạn nghĩ. Tuy nhiên, khi đã nắm rõ quy tắc, kết hợp với việc luyện tập chăm chỉ, tôi tin rằng bạn sẽ thành thạo cách thực hiện ngay thôi.

Những gì bạn nên nhớ, không phải là một chỉ báo mà là một tín hiệu cho các công cụ tìm kiếm. Họ vẫn có thể chọn một URL chuẩn khác với URL mà bạn đã chỉ định ban đầu.

Bây giờ đến lượt của bạn! Vui lòng kiểm tra lại các trang trên trang web. Sau đó, áp dụng những kiến thức tôi cung cấp trong bài viết Thẻ Canonical là gì để triển khai canonical một cách hiệu quả, góp phần tăng thứ tự xếp hạng cũng như thuận tiện trong quá trình các công cụ tìm kiếm thu thập dữ liệu.

Xem thêm các thông tin mới nhất tại: https://tuhocmarketingonline.info/

Trả lời

Email của bạn sẽ không được hiển thị công khai.