Thẻ Canonical là gì? Không còn là khái niệm mới mẻ với SEOer. Năm 2009, Google, Microsoft và Yahoo đã hợp nhất để cùng tạo ra thẻ này. Với mong muốn hỗ trợ chủ website giải pháp hiệu quả để khắc phục các vấn đề Duplicate Content một cách nhanh chóng và dễ dàng hơn.
Mục Lục
Thẻ Canonical là gì?
Canonical URL (hay còn gọi là Rel Canonical) là thành phần HTML nhằm khai báo URL gốc của trang bị trùng lặp nội dung với công cụ tìm kiếm. Sử dụng thẻ Canonical trong trường hợp nội dung bị Duplicate hoặc giống nhau trên nhiều URL.

Nếu có nội dung giống hoặc tương tự trong các URL khác nhau. Bạn có thể dùng nó để chỉ định loại nào là phiên bản chính và sau đó index nó.
>>>Xem thêm :Những quy tắc bảo mật website cơ bản hiệu quả nhất hiện nay
Cấu trúc chuẩn của Canonical Tag
Canonical có cấu trúc thế nào? Đó là cú pháp đơn giản, nhất quán và đặc biệt thường được đặt trong phần của website, chẳng hạn như:
Ý nghĩa của từng phần trong đoạn mã Canonical URL được hiểu như sau:
link rel=“canonical”
: Liên kết trong thẻ này là bản gốc của trang này.href=“https://example.com/sample-page/”
: truy cập bản gốc tại đây.
Tầm quan trọng của thẻ Canonical trong SEO
Như tôi đã đề cập ban đầu, thẻ Canonical được sinh ra để giải quyết vấn đề Duplicate Content. Chính vì vậy, tôi sẽ phân tích về sự ảnh hưởng của trùng lặp nội dung (Duplicate Content) đến SEO, từ đó bạn sẽ hiểu rõ hơn về tầm quan trọng cũng như lý do thẻ Canonical tag được tạo ra. Tìm hiểu ngay nào!
Bạn phải lưu ý:
Duplicate Content là điều Google cực kỳ “ghét”, do nó sẽ làm Google không xác định được:
- Bản nào của trang cần index.
- Loại nào của trang dùng để xếp hạng cho các truy vấn có liên quan.
- Liệu họ có nên hợp nhất “link equity” trên một trang hay chia nó thành nhiều loại.
Trùng lặp nội dung cũng làm ảnh hưởng đến “ngân sách thu thập dữ liệu”. Nghĩa là, Google sẽ mất thời gian thu thập thông tin nhiều bản cùng một page thay vì khám phá nội dung quan trọng khác trên website. Tuy nhiên, nếu như bạn có sử dụng Canonical tag, thì nó sẽ giúp giải quyết tất cả những vấn đề kể trên bằng cách: Thông báo đến Google biết họ nên index và xếp hạng phiên bản nào của page, cũng như vị trí cần hợp nhất “link equity”.
Còn trong trường hợp bạn không có bất kỳ hành động thông báo nào đến Google về link gốc. Thì Google sẽ thay bạn xem xét và quyết định loại hoặc chọn link tốt nhất. Tất nhiên, dựa vào Google như thế không phải là một ý tưởng hay. Vì họ có thể chọn ngẫu nhiên 1 URL mà bạn không thật sự muốn nó sẽ trở thành link gốc.
Thông báo gây lẫn lộn

Một trong những lỗi thường gặp nhất trong thiết lập thẻ Canonical là thông báo lẫn lộn gây hiểu nhầm cho các công cụ tìm kiếm. Cụ thể:
Khai báo Canonical trồng chéo hoặc thành 1 vòng lặp:
Việc gắn thẻ Canonical thành 1 vòn lặp ví dụ: gắn Canonical tags từ trang A sang B và ngược lại hay khai báo trông chéo (A→B, B→C, C→D) điều này sẽ khiến công cụ tìm kiếm bối rối và bỏ qua thẻ. Vì vậy, hãy gửi tín hiệu rõ ràng, hoặc bạn buộc các công cụ tìm kiếm đưa ra lựa chọn không mong muốn
Thiết lập trang chuẩn không đủ điều kiện Index:
Thẻ Canonical là gì? Một lỗi phổ biến khác là link đến một trang đang bị chặn bởi tệp robots.txt hoặc được thiết lập thuộc tính “noindex“.
Thiết lập nhiều thẻ Canonical:
Trường hợp này thường do website dùng nhiều plugin SEO khác nhau dẫn đến việc khai báo nhiều thẻ Canonical khác nhau cho trang. Lúc này công cụ tìm kiếm sẽ bỏ qua thẻ qua các thẻ Canonical được gắn.
>>>Xem thêm :Học SEO bắt đầu từ đâu? Những điều bạn cần lưu ý
Một số lưu ý khi sử dụng thẻ Canonical
Chủ động chuẩn hoá trang chủ
Do các bản sao trang chủ là rất phổ biến, có thể liên kết đến trang chủ của bạn theo nhiều cách mà bạn rất khó kiểm soát chúng (ví dụ: trường hợp đặt UTM tracking hoặc A/B testing). Vì vậy đặt một thẻ chuẩn trên trang chủ để ngăn ngừa các sự cố là rất cần thiết
Khai báo trang chuẩn cho biến thể di động
Nếu trang chuẩn có biến thể dành cho thiết bị di động thì hãy thêm đường dẫn liên kết rel=”alternate” vào trang đó và trỏ đến phiên bản dành cho thiết bị di động của trang:
<link rel=”alternate” media=”only screen and (max-width: 640px)” href=”http://m.seongon.com/seo/canonical-la-gi”>
Sự thật về Duplicate Content
Thẻ Canonical là gì? Có phải nhiều lúc bạn đã nghĩ rằng: chỉ cần đăng lại nội dung trên trang khác nhau thì sẽ không dính lỗi Duplicate Content. Tuy nhiên, thực tế idea này không thể triển khai. Vì các công cụ thu thập URL, không phải dữ liệu trên page.

Nghĩa là, chúng sẽ nhận định URL example.com/product và URL example.com/product?color=red ở 2 page khác nhau. Mặc dù chúng là cùng một trang web có nội dung giống hệt hoặc tương tự nhau.
Đây được gọi là các parameterized URLs và chúng là nguyên nhân phổ biến dẫn đến Duplicate Content. Đặc biệt là trên web thương mại điện tử có filtered navigation (bộ lọc tùy chỉnh tìm kiếm của người dùng dựa trên những gì họ đang tìm kiếm)
Qua bài viết trên đã cho các bạn biết về Thẻ Canonical là gì? Cách sử dụng và các lỗi thường gặp. Hy vọng những thông tin trên sẽ hữu ích đối với các bạn. Cảm ơn các bạn đã xem qua bài viết nhé.
>>Xem thêm Khái niệm về URL hướng dẫn url tối ưu cho dân seo
Lộc Đạt-tổng hợp
Tham khảo ( chidoanh, gtvseo, … )
Discussion about this post