Khái niệm thẻ Canonical là gì không còn quá xa lạ đối với các anh em SEOer. Vào năm 2009, 3 ông lớn Google, Bing và Yahoo đã bắt tay nhau tạo nên thẻ Canonical với mục đích hỗ trợ chủ website các giải pháp hiệu quả để khắc phục các vấn đề liên quan đến trùng lặp nội dung (duplicate content) một cách hiệu quả và nhanh chóng. Nhưng:
- Bạn vẫn không thật sự hiểu Canonical là gì?
- Cách sử dụng thẻ Canonical ra sao?
- Chúng có thực sự giúp ích cho hoạt động của website hay không?
Hãy cùng ROI Media tìm hiểu trong bài viết ngay dưới đây nhé!
Thẻ Canonical là gì?
Thẻ Canonical (hay Canonical URL hoặc rel = Canonical) là thành phần HTML nhằm khai báo URL gốc của trang bị trùng lặp nội dung với công cụ tìm kiếm. Sử dụng thẻ Canonical trong trường hợp nội dung bị Duplicate hoặc giống nhau trên nhiều URL.
Nếu có nội dung giống hoặc tương tự nhau trong các URL khác nhau. Bạn có thể dùng Canonical URL để chỉ định loại nào là phiên bản chính và sau đó index nó.

Do đó việc sử dụng thẻ rel = “canonical” nhằm mục đích thông báo cho công cụ tìm kiếm biết đó là bản gốc và cái nào là bản sao của nó. Điều này có thể giúp bạn tránh khỏi bị phạt do nội dung trùng lặp.
Cấu trúc chuẩn của một thẻ Canonical
Rel = Canonical là cú pháp đơn giản, nhất quán và đặc biệt thường được đặt trong phần của website, chẳng hạn như:
Ý nghĩa của từng phần trong đoạn mã Canonical URL được hiểu như sau:
link rel=“canonical”
: Liên kết trong thẻ này là bản gốc của trang này.href=“https://example.com/sample-page/”
: có thể truy cập bản gốc tại đây.
Tầm quan trọng của thẻ Canonical đối với SEO
Như tôi đã nói ở trên, thẻ Canonical sinh ra để giải quyết vấn đề Duplicate Content. Do đó tôi sẽ phân tích về sự ảnh hưởng của trùng lặp nội dung (Duplicate Content) đến SEO, từ đó sẽ giúp bạn hiểu rõ hơn về tầm quan trọng cũng như lý do thẻ Canonical tag được tạo ra.
Có một điều tôi đã nhắc đi nhắc lại khá nhiều: Duplicate Content là thứ Google cực kỳ “ghét”, do nó sẽ làm Google không xác định chính xác được:
- Bản nào của trang cần index.
- Loại nào của trang dùng để xếp hạng cho các truy vấn có liên quan.
- Liệu họ có nên hợp nhất “link equity” trên một trang hay chia nó thành nhiều loại.
Trùng lặp nội dung cũng làm ảnh hưởng đến “ngân sách thu thập dữ liệu”. Nghĩa là, Google sẽ mất thời gian nhiều hơn để thu thập thông tin nhiều bản cùng một page thay vì khám phá nội dung quan trọng khác trên website. Tuy nhiên, nếu Canonical Tag được sử dụng, thì nó sẽ giúp giải quyết tất cả những vấn đề kể trên bằng cách: Thông báo đến Google biết nên index và xếp hạng phiên bản nào của page, cũng như vị trí cần thiết để hợp nhất “link equity”. Cụ thể:
- Chỉ định một URL chuẩn mà bạn muốn người tìm kiếm nhìn thấy trên kết quả tìm kiếm.
- Hợp nhất URL với các nội dung tương tự hoặc trùng lặp.
- Đơn giản hoá việc theo dõi chỉ số cho một chủ đề hay một sản phẩm.
- Quản lý nội dung được phân phối: Nếu nội dung được xuất bản trên các miền khác nhau, khi đó bạn muốn hợp nhất xếp hạng trang cho URL ưa thích.
- Để tránh bots của các công cụ tìm kiếm dành thời gian thu nhập dữ liệu của các trang trùng lặp. Khi đó các bots sẽ khai thác tối đa trang web của bạn, dành nhiều hơn thời gian thu thập dữ liệu các trang mới (hoặc cập nhật) trên trang web thay vì thu thập dữ liệu các phiên bản dành cho máy tính để bàn và thiết bị di động của cùng một trang
Còn trong trường hợp Google không nhận được bất kỳ thông báo nào về link gốc từ phía bạn. Thì mặc định Google sẽ thay bạn xem xét và quyết định loại hoặc chọn ra link tốt nhất. Tất nhiên, dựa hoàn toàn vào Google như thế không phải là một ý tưởng hay. Vì họ có thể chọn ngẫu nhiên 1 URL mà bạn không thật sự muốn nó sẽ trở thành link gốc.
Những điều nên biết về Duplicate Content
Nhiều người nghĩ rằng chỉ cần đăng lại nội dung trên trang khác nhau thì sẽ né được Duplicate Content. Tuy nhiên, trên thực tế ý tưởng này không thể triển khai. Vì các công cụ thu thập URL chứ không phải dữ liệu trên page.
Nghĩa là, chúng sẽ nhận định URL example.com/product và URL example.com/product?color=red sẽ ở 2 page khác nhau. Mặc dù chúng là cùng một trang web có nội dung giống hệt hoặc tương tự nhau.
Cái này được gọi là các parameterized URLs và chúng là nguyên nhân phổ biến dẫn đến lỗi Duplicate Content. Đặc biệt là trên trang web thương mại điện tử có filtered navigation (bộ lọc tùy chỉnh tìm kiếm của người dùng dựa trên những gì họ đang tìm kiếm).
Để tôi lấy ví dụ thực tế cho các bạn dễ hiểu. Hãng Brown Bag Clothing chuyên bán áo sơ mi.
- Đây là link cho trang danh mục chính của họ:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html - Nếu bạn chỉ lọc áo sơ mi L, một thông số sẽ được thêm vào URL như sau:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=L - Nếu sau đó bạn cũng chỉ lọc những chiếc áo sơ mi màu xanh lá thì một thông số khác sẽ thêm vào ngay sau đó:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=L&color=Green.
Dù nội dung của chúng chỉ khác nhau một chút nhưng trong mắt Google cả 3 link phía trên đều là những trang riêng biệt. Nhưng không chỉ các website thương mại điện tử bị ảnh hưởng bởi Duplicate Content. Dưới đây là một số nguyên nhân khác của nội dung trùng lặp áp dụng cho tất cả các loại trang web:
- Có parameterized URLs cho các tìm kiếm chọn lọc
(VD: example.com?q=search-term) - Có parameterized URLs cho các IDs phiên
(VD: https://example.com?sessionid=3) - Các loại trang có thể thực hiện in riêng biệt
(VD: example.com/page and example.com/print/page) - URL riêng biệt cho mỗi bài đăng trong các danh mục khác nhau
(VD: example.com/services/SEO/ and example.com/specials/SEO/) - Gồm pages cho các loại thiết bị khác nhau
(VD: example.com and m.example.com) - Đồng thời cả AMP và non-AMP trong cùng 1 trang
(VD: example.com/page and amp.example/page) - Cùng một nội dung ở các biến thể non-www và www variants
(VD: http://example.com and http://www.example.com) - Và cung cấp cùng một nội dung ở các biến thể non-https và https variants
(VD: http://www.example.com and https://www.example.com) - Cùng một nội dung có và không có dấu gạch chéo
(VD: https://example.com/page/ and http://www.example.com/page) - Có cùng một nội dung ở các bản mặc định, chẳng hạn như trang index
(VD: https://www.example.com/, https://www.example.com/index.htm,..) - Cùng một nội dung có và không có chữ viết hoa
(VD: https://example.com/page/ and http://www.example.com/Page/)
Trong những tình huống kể trên, việc dùng đúng Canonical URL là rất quan trọng. Hơn nữa, trùng lặp nội dung giữa nhiều miền cũng là điều bạn cần hết sức lưu ý.
Đây là trường hợp khi nội dung được chia sẻ trên 2 web khác nhau với mỗi trang web là một phần nội dung gốc. Nếu bạn là tác giả của bài viết gốc thì nên cài đặt nó trên bài nhằm thông báo đến các công cụ tìm kiếm một cách rõ ràng.
Tất nhiên, bài viết bên thứ 3 đăng lại từ bài viết của bạn vẫn có khả năng hiển thị trong danh sách tìm kiếm. Tuy nhiên, việc gắn Canonical tag sẽ giúp giảm nguy cơ chúng được xếp hạng cao hơn nội dung gốc.
Lưu ý: Vẫn có tình trạng một số web “chày cối” sẽ từ chối thêm Canonical Tag. Trong những trường hợp này, việc có muốn chấp nhận rủi ro hay không tùy thuộc vào bạn.
Cách sử dụng thẻ Canonical Tag hiệu quả và chuyên nghiệp
5 nguyên tắc vàng cần nằm lòng khi dùng thẻ Canonical
Nguyên tắc 1: Sử dụng URL tuyệt đối
John Mueller của Google đã từng nói rằng cách tốt nhất là không dùng đường dẫn tương đối với phần tử rel=“canonical”
. Nghĩa là bạn nên sử dụng cấu trúc sau:
<link rel=“canonical” href=“https://example.com/sample-page/” />
thay vì đường dẫn tương đối với cấu trúc sau:
<link rel=“canonical” href=”/sample-page/” />
Nguyên tắc 2: sử dụng chữ viết thường trong URL
Đồng thời Google sẽ coi các URL viết hoa và viết thường là hai link khác nhau. Tuy nhiên, tôi khuyên bạn nên dùng chữ viết thường trong URL trên máy chủ của mình, sau đó dùng link viết thường cho Canonical Tag.
Nguyên tắc 3: Sử dụng đúng phiên bản miền HTTPS hay HTTP
Nếu bạn đã chuyển sang SSL, hãy đảm bảo rằng bạn không khai báo bất kỳ URL nào không phải SSL (tức là HTTP) trong việc sử dụng thẻ Canonical Tag. Làm như vậy về mặt lý thuyết dẫn đến nhầm lẫn và kết quả không mong muốn.
Đối với secure domain, hãy đảm bảo rằng bạn dùng phiên bản URL sau:
<link rel=“canonical” href=“https://example.com/sample-page/” />.
Còn nếu bạn không dùng HTTPS thì hãy dùng dạng URL này:
<link rel=“canonical” href=“http://example.com/sample-page/” />
Nguyên tắc 4: Sử dụng Canonical Tag tự tham chiếu
John Mueller cho rằng mặc dù không bắt buộc nhưng Canonical URL tự tham chiếu vẫn là sự lựa chọn hợp lý. Vì nó giúp Google hiểu rõ bạn muốn index trang nào hoặc link sẽ có cấu trúc như thế nào khi được index.
Về cơ bản, tự tham chiếu là thẻ Canonical trên một trang mà trỏ link đến chính nó.
Ví dụ, nếu URL là https://example.com/sample-page, thì Canonical tự tham chiếu trên trang đó sẽ có cấu trúc sau:
<link rel=“canonical” href=“https://example.com/sample-page” />
Hầu hết các CMS phổ biến hiện nay đều tự động thêm các URL tự tham chiếu. Còn với CMS tùy chỉnh, bạn cần nhờ đến các nhà phát triển web hardcode nó.
Nguyên tắc 5: Sử dụng 1 Canonical Tag cho mỗi trang
Nếu trong 1 trang có nhiều hơn 1 Canonical Tag, Google sẽ bỏ qua cả thảy. Vì thế, hãy luôn nhớ rằng một trang chỉ sử dụng MỘT thẻ Canonical thôi bạn nhé!
Cách triển khai: Có năm cách để chỉ định link gốc với các tín hiệu chuẩn hóa sau:
- HTML tag
- HTTP header
- Sitemap
- 301 redirect
- Liên kết nội bộ (Internal links)
Cái đặt thẻ Canonical bằng cách sử dụng HTLM “rel = Canonical”
Sử dụng thẻ rel = Canonical chính là cách đơn giản và rõ ràng nhất để chỉ định link gốc. Cách thực hiện vô cùng đơn giản: chỉ cần thêm mã sau vào phần <head>
của bất kỳ trang trùng lặp nào:
<link rel=“canonical” href=“https://example.com/canonical-page/” />
Ví dụ: Giả sử bạn có một web thương mại điện tử bán áo thun. Bạn muốn chỉ định https://yourstore.com/tshirts/black-tshirts/ là URL gốc. Ngay cả khi nội dung của trang đó có truy cập được qua các URL khác, chẳng hạn như: https://yourstore.com/offers/black-tshirts/. Khi ấy, chỉ cần thêm thẻ tag sau vào bất kỳ trang trùng lặp nào:
<link rel=“canonical” href=“https://yourstore.com/tshirts/black-tshirts/” />
Lưu ý rằng nếu bạn đang dùng CMS, bạn không cần phải lo lắng về mã code của trang đâu nhé!
Cài đặt Canonical Tag trong WordPress
Trước hết, cài đặt Yoast SEO để Canonical tự tham chiếu sẽ được thêm tự động vào trang. Để thêm các mục tùy chỉnh cho thẻ, nhấp chọn phần “Nâng cao” trên mỗi bài đăng hoặc trang.
Cài đặt Canonical Tag trên Shopify
Shopify thêm URL gốc tự tham chiếu cho các sản phẩm và bài đăng trên blog theo mặc định. Để thêm mục tùy chỉnh cho URL gốc, bạn cần phải chỉnh sửa trực tiếp các tệp mẫu (liquid).
Cài đặt Canonical Tag trên Squarespace
Squarespace cũng thêm các URL tự tham chiếu theo mặc định và tương tự như trường hợp của Shopify. Bạn cần phải chỉnh sửa mã trực tiếp nếu muốn thêm tùy chỉnh vào URL gốc.
Cài đặt thẻ Canonical trên các dòng tiêu đề HTTP
Đối với các tài liệu định dạng PDF, không có cách nào để sử dụng thẻ Canonical trong tiêu đề vì không có phần trang <head>
.
Trong những trường hợp như vậy, bạn hãy dùng dòng tiêu đề HTTP để đặt cho thẻ. Bạn cũng có thể dùng nó trong tiêu đề HTTP cho những web chuẩn.
Ví dụ: Giả sử tạo một bản PDF của bài blog nhất định và lưu trữ nó trong thư mục con. Khi ấy, file PDF sẽ có cấu trúc dòng tiêu đề HTTP như sau:
HTTP/1.1 200 OK. Content-Type: application/pdf. Link: <https://roimedia.vn/blog/canonical-tags/>; rel=”canonical”
Cài đặt thẻ Canonical với 301 Redirects
Hãy 301 redirects khi bạn muốn chuyển hướng lưu lượng truy cập ra khỏi URL trùng lặp tới URL gốc. Ví dụ: Giả sử web của bạn có thể truy cập được tại các URL sau:
- example.com
- example.com/index.php
- example.com/home/
Hãy chọn một URL làm gốc và chuyển hướng các URL khác đến URL gốc đó.
Thực hiện tương tự với các phiên bản HTTPS / HTTP và www / non – www trên trang web của mình. Chọn một bản chuẩn và chuyển hướng những bản khác đến phiên bản đó. Ví dụ: Phiên bản chuẩn của roimedia.vn là URL HTTPS không có www (https://roimedia.vn). Tất cả các URL sau đều chuyển hướng đến đó:
- http://roimedia.vn/
- http://www.roimedia.vn/
- https://www.roimedia.vn/
Cài đặt thẻ Canonical với các liên kết nội bộ
Cách bạn trỏ link từ trang này sang trang khác trên toàn web của mình cũng được xem là một cách Canonical URL..
Tóm lại, nếu bạn càng nhất quán với tất cả 5 tín hiệu kể trên, thì các công cụ của Google càng dễ dàng xác định URL gốc mong muốn được đưa vào. Như John đã đề cập trong video, Google cũng ưu tiên HTTPS hơn URL HTTP và các URL đẹp hơn.
7 sai lầm thường mắc phải khi sử dụng Canonical URL
Canonicalization là một vấn đề khá phức tạp, được nhiều anh em SEOer đánh giá thuộc TOP những lỗi kỹ thuật trong SEO thường gặp nhất.
Có rất nhiều ý kiến và quan niệm sai lầm về cách dùng Canonical URL đúng cách. Sau đây tôi sẽ đề cập một số sai lầm thường gặp trong quá trình sử dụng thẻ Canonical.
Sai lầm 1: Chặn URL được chuẩn hóa qua Robots.txt
Việc chặn một URL trong robots.txt sẽ ngăn không cho Google thu thập dữ liệu từ URL đó. Có nghĩa là họ không thể thấy bất kỳ Canonical Tag nào trên đó. Kết quả là Google cũng không thể chuyển hóa “link equity” từ Non-Canonical sang Canonical.
Sai lầm 2: Đặt mã trạng thái HTTP 4XX cho URL gốc
Việc đặt mã HTTP 4XX cho URL gốc có tác dụng tương tự như việc dùng thẻ “noindex”. Google sẽ không thể nhìn thấy Canonical Tag để mà chuyển “link equity” sang bản gốc.
Sai lầm 3: Đặt URL được chuẩn hóa thành ‘noindex’
Hãy luôn ghi nhớ rằng tốt nhất là không nên kết hợp “noindex” với thẻ Canonical lại với nhau. Bởi vì chúng là 2 yếu tố hoàn toàn đối lập nhau.
Google thường sẽ ưu tiên Canonical Tag hơn thẻ “noindex”. Trong trường hợp bạn muốn thực hiện đồng thời noindex và gắn Canonical URL, hãy dùng 301 redirects. Còn không thì chỉ có thể dùng rel = canonical mà thôi.
Sai lầm 4: Canonicalizing tất cả các Paginated Page đến Page gốc
Không nên triển khai Canonical URL đến các paginated page đầu tiên trong chuỗi. Thay vào đó, chúng ta sẽ dùng thẻ Tag tự tham chiếu trên những trang này.
John Mueller đã đưa ra câu trả lời cho nghi vấn này như sau: Nếu page A không tương tự như page B. Thì việc page B đang dùng “rel=canonical” muốn trỏ đến page A sẽ không được chấp thuận bởi dùng “rel = canonical” không đúng cách.
Bạn cũng nên sử dụng các thẻ rel="prev"
và rel="next"
để phân chia trang. Mặc dù cấu trúc này hiện nay không còn thịnh hành với Google như một số web khác, chẳng hạn như Bing vẫn còn dùng nó.
Sai lầm 5: Không sử dụng Canonical Tags với Hreflang
Hreflang tags thường được dùng để chỉ định target đối tượng dựa vào ngôn ngữ và vị trí địa lý của website.
Google khuyến cáo rằng khi dùng hreflang: Bạn nên “chỉ định trang gốc có cùng một ngôn ngữ với website hoặc ngôn ngữ thay thế tốt nhất nếu không thể tìm ra ngôn ngữ chung cho cả 2”.
Sai lầm 6: Sử dụng quá nhiều thẻ “rel=canonical”
Hãy chú ý rằng nếu có quá nhiều thẻ “rel = canonical” sẽ khiến Google dễ dàng bỏ qua đó!
Việc này xảy ra do các thẻ được thêm vào hệ thống từ các điểm khác nhau: Chẳng hạn như bởi CMS, theme và (các) plugin. Đây là lý do tại sao hiện nay nhiều plugin có tùy chọn ghi đè đảm bảo chúng là nguồn duy nhất cho các Canonical URL.
Cũng có nhiều trường hợp sử dụng Javascript để thêm thẻ “rel = canonical” . Google sẽ chấp thuận trường hợp này chỉ khi URL gốc không xuất hiện trên HTML và sau đó bạn thêm thẻ “rel = canonical” với JavaScript.
Ngược lại, nếu HTML đã có thẻ rồi mà bạn lại tiếp tục hoán đổi page khác ưa thích bằng JavaScript. Thì có lẽ bạn đang làm khó Google bởi hàng loạt tín hiệu hỗn hợp đấy. Hãy luôn chú ý nhé!
Sai lầm 7: Để tag “rel=canonical” trong phần Body
Hãy nhớ rằng thẻ Rel = canonical chỉ nên xuất hiện trong <head>
của tài liệu. Thẻ chuẩn trong phần <body>
của web rất dễ bị bỏ qua.
Mặc dù mã nguồn của một trang có thể chứa thẻ rel = canonical ở đúng vị trí, nhưng khi nó thực sự được tạo trong trình duyệt hoặc được hiển thị bởi Google thì sẽ có thể phát sinh nhiều vấn đề như: thẻ không được đóng, JavaScript bị chèn hoặc <iframes>
trong phần <head>
,… khiến <head>
phải kết thúc sớm trong khung trình duyệt.
Trong trường hợp này, thẻ Tag sẽ bị chuyển vào <body>
của một trang đang hiển thị mà không được chấp thuận.
Cách kiểm tra Canonical Tag và khắc phục sự cố Canonicalization
Trong quá trình triển khai Canonicalization rất dễ xảy ra sai sót. Cho nên bạn cần kiểm tra website của mình để tìm các lỗi liên quan đến Canonical Tag và khắc phục chúng càng sớm càng tốt.
Tôi khuyên bạn nên sử dụng tính năng SIte Audit cua Ahref. Nhằm giải quyết các nỗi lo về Technical SEO nói chung và Canonical URL nói riêng. Dưới đây là 12 vấn đề liên quan mà Site Audit có thể tìm ra và khắc phục một cách hiệu quả:
Trang Canonical trỏ đến 5XX
Cảnh báo này sẽ được kích hoạt khi 1 hay nhiều trang được chuẩn hóa trỏ đến URL 5XX.
Vấn đề: Mã trạng thái HTTP 5XX cho biết sự cố nằm ở máy chủ. Điều này khiến page gốc không thể truy cập được. Do Google không có khả năng index trang không thể truy cập, trang gốc cũng vì vậy mà bị bỏ qua.
Giải pháp: Thay thế bất kỳ URL gốc nào đang bị sai sót bằng các URL hợp lệ. Trong trường hợp trang gốc vẫn đang hoạt động ổn định thì kiểm tra các cấu hình sai của máy chủ.
Lưu ý: đây có thể là sự cố tạm thời nếu quá trình thu thập thông tin xảy ra khi trang web của bạn ngừng hoạt động để bảo trì hoặc máy chủ website bị quá tải.
Trang Canonical trỏ đến 4XX
Khi 1 hay nhiều trang được chuẩn hóa đến URL 4XX sẽ khiến cảnh báo này kích hoạt.
Vấn đề: Google không index các trang 4XX vì chúng không hoạt động. Do đó, họ sẽ bỏ qua bất kỳ thẻ Canonical nào trỏ đến những trang như vậy. Thay vào đó, Google chọn index ngẫu nhiên 1 trang không có Canonical.
Cách khắc phục: Xem lại các trang bị ảnh hưởng và thay thế các Canonical (4XX) đã chết bằng các liên kết đến các trang (200) đang hoạt động muốn được index.
Trang Canonical trỏ đến URL Redirect
Cảnh báo này sẽ kích hoạt khi 1 hay là nhiều trang được chuẩn hóa đến URL redirect .
Vấn đề: Canonicals phải trỏ đến phiên bản có thẩm quyền nhất của một trang mà URL redirect không thuộc dạng bản này. Trong trường hợp này, các công cụ tìm kiếm có thể hiểu sai hoặc bỏ qua các thẻ Canonical.
Cách khắc phục: Thay thế các Canonical URL bằng các kết nối trực tiếp đến phiên bản có thẩm quyền nhất của trang. Ví dụ như page trỏ về HTTP 200 và không chuyển hướng.
Duplicate Pages không được gắn Canonical Tag
Khi tồn tại một hoặc nhiều trang trùng lặp hoặc giống nhau nhưng không có trang nào trong số đó là bản gốc thì cảnh báo này sẽ được kích hoạt.
Vấn đề: Vì không có trang nào được chỉ định là trang gốc. Nên Google sẽ cố gắng xác định loại phù hợp nhất để tự hiển thị trong kết quả tìm kiếm. Đây có thể không phải là loại mà bạn muốn được index.
Hướng giải quyết: Kiểm tra lại các trang duplicate. Sau đó, chỉ định 1 bản tốt nhất và chọn làm bản gốc để gắn thẻ Canonical tự tham chiếu
Thẻ Canonical không có liên kết nội bộ
Cảnh báo này được kích hoạt khi một hoặc nhiều Canonical URL không có liên kết nội bộ.(internal link)
Vấn đề: Khách truy cập website không thể truy cập được các Canonical URL không có kết nối nội bộ. Khi ấy, họ có thể được chuyển hướng đến các trang non-Canonical.
Cách khắc phục: Thay thế bất kỳ link nội bộ nào đến các trang Canonical bằng các liên kết trực tiếp đến trang gốc.
Liên kết các trang Non-Canonical với thẻ Hreflang
Cảnh báo này nó sẽ được kích hoạt khi 1 hay là nhiều trang chỉ định URL Non-Canonical trong Hreflang.
Vấn đề: Các liên kết trong thẻ Hreflang phải luôn trỏ đến các trang Canonical. Việc liên kết đến Non-Canonical của trang từ các chú thích Hreflang có thể gây nhầm lẫn và đánh lừa Google.
Cách khắc phục: Thay thế các liên kết trong các chú thích Hreflang của các trang bị ảnh hưởng bằng các Canonical.
Trang Non-Canonical trong Sitemap
Khi một hoặc nhiều trang Non-Canonical được liệt kê trong sitemap sẽ kích hoạt cảnh báo này.
Vấn đề: Google khuyên cáo bạn không nên đưa Non-Canonical URLs vào trong sitemap. Lý do đơn giản là các trang hiển thị trong sitemap chỉ nên là Canonical page. Hay nói cách khác là những trang mà bạn muốn được index.
Cách khắc phục: Loại bỏ Non-Canonical URLs ra khỏi Sitemap.
Non-Canonical page được chỉ định thành Canonical Page
Cảnh báo kích hoạt khi một hoặc nhiều trang chỉ định một URL chuẩn. URL này lại được Canonical cho một trang khác. Điều này tạo ra một “chuỗi canonical”. Trong đó trang A được Canonical đến trang B, sau đó được Canonical đến trang C.
Vấn đề: Chuỗi Canonical có thể gây nhầm lẫn và khiến Google bối rối. Do đó, họ có thể hiểu sai hoặc bỏ qua các trang được Canonical.
Cách khắc phục:Thay thế các liên kết Non-Canonical trong Canonical Tag của trang bị ảnh hưởng bằng liên kết trực tiếp đến trang Canonical. Ví dụ: nếu trang A được Canonical đến trang B. Sau đó được Canonical đến trang C. Hãy thay thế liên kết Canonical trên trang A bằng một liên kết trực tiếp đến trang C.
URL bên trong thẻ Open Graph không khớp với Canonical Page
Cảnh báo này sẽ kích hoạt khi Canonical Tag và URL bên trong Open Graph URL không khớp nhau ở trên một hoặc nhiều trang.
Vấn đề: Nếu URL ở bên trong thẻ Open Graph URL sai lệch với Canonical URL. Khi ấy Non-Canonical URL sẽ thay thế, được chia sẻ trên các mạng xã hội.
Cách khắc phục: Thay thế URL trong thẻ Open Graph URL trên các trang bị ảnh hưởng bằng Canonical URL. Hãy đảm bảo rằng lần này hai URL giống nhau nhé! Lưu ý: URL bên trong thẻ Open Graph phải là tuyệt đối và dùng giao thức http:// hoặc https://, như của Canonicals URL.
Canonical từ HTTPS sang HTTP
Cảnh báo này sẽ kích hoạt khi một hoặc nhiều secure (HTTPS) pages chỉ định non-secure (HTTP) page làm trang Canonical.
Vấn đề: HTTPS là một yếu tố xếp hạng. Vì vậy bạn nên chỉ định bản secure pages làm Canonical nếu có thể.
Cách khắc phục: Chuyển hướng trang HTTP sang HTTPS tương đương. Nếu không thể, hãy thêm liên kết rel = “canonical” từ phiên bản HTTP của trang vào phiên bản HTTPS.
Canonical từ HTTP sang HTTPS
Cảnh báo này nó kích hoạt khi một hoặc nhiều non-secure (HTTP) page chỉ định secure (HTTPS) pages làm trang Canonical.
Vấn đề: HTTPS luôn được ưu tiên hơn HTTP. Việc phiên bản HTTP của một trang chỉ định phiên bản HTTPS là trang Canonical là điều không hề hợp lý.
Cách khắc phục: Triển khai chuyển hướng 301 từ HTTP sang HTTPS. Bạn cũng nên thay thế mọi liên kết nội bộ tới phiên bản HTTP của trang bằng các liên kết trực tiếp đến HTTPS.
Non-Canonical Page nhận được lưu lượng truy cập Organic
Cảnh báo này kích hoạt khi một hoặc nhiều trang Non-Canonical hiển thị trong kết quả tìm kiếm và nhận được lưu lượng truy cập organic (điều này sẽ không bao giờ xảy ra).
Vấn đề: Trường hợp này xảy ra có thể là do Canonical tag của bạn được thiết lập không chính xác hoặc Google đã chọn bỏ qua thẻ do bạn tự chỉ định.
Cách khắc phục: Kiểm tra xem các thẻ canonical có được thiết lập chính xác trên tất cả các trang được báo cáo hay không. Nếu đó không phải là vấn đề, hãy dùng công cụ Kiểm tra URL trong Google Search Console để xem liệu họ có chấp thuận URL Canonical do bạn chỉ định không.
Phần kết
Một website có những trang hoặc những phiên bản có nội dung tương tự hoặc giống nhau là điều mà các công cụ tìm kiếm cực “ghét”, coi đó là trùng lặp nội dung” và rất có thể sẽ khiến website của bạn “dính chưởng”. Do đó, việc sử dụng thẻ Canonical hợp lý và chính xác là điều những nhà quản trị website cần hết sức lưu ý.
Hy vọng với những thông tin về Canonical Tags mà tôi đã chia sẻ, các bạn sẽ có thêm những kiến thức bổ ích để tối ưu SEO một cách hiệu quả nhất.