URL Canonicalization là gì? Cách sử dụng Canonical - Dịch vụ seo

URL Canonicalization là gì? Cách sử dụng Canonical

Tìm hiểu khái niệm URL Canonicalization

Thuật ngữ Canonicalization rất khó để hiểu đúng. Tôi sẽ cố gắng giải thích nó một cách đơn giản. Ví dụ một website có 2 URL:
http://thegioiseo.com
http://www.thegioiseo.com
Cả hai trang đó hiển thị nội dung và không có trang nào chuyển hướng đến nhau. Điều này có thể dẫn đến vấn đề trùng lặp nội dung trên Google và bạn có thể phải đối mặt với một hình phạt.

Chúng ta hãy xem một ví dụ nữa. Có 2 URL của một website mà kết quả dẫn đến một trang tương tự.
http://thegioiseo.com
http://www.thegioiseo.com/index.php
Nếu cả 2 web page hiển thị kết quả tương tự thì điều này là tốt.

Bạn có thể không quan tâm nhiều đến vấn đề này nhưng điều này có thể dẫn đến hình phạt trùng lặp nội dung nghiêm trọng. Vấn đề với bots tìm kiếm là chúng không thể quyết định phiên bản URL được thêm vào chỉ mục của chúng. Nếu 2 trang có cùng nội dung, chúng sẽ được giả định là một bản copy của bản copy khác và trang web của bạn sẽ bị phạt.

Nếu site của bạn được mở trên 2 URL hiển thị cùng nội dung thì bạn phải sửa chữa nó. Bạn phải sử dụng thiết lập máy chủ cho dù người dùng mở bằng www hoặc không phải www, trang web sẽ mở bất kỳ phiên bản nào. Bằng cách này bạn có thể khắc phục canonicalization.

Mặc dù có những lúc bạn muốn chia sẻ cùng một nội dung trên 2 URL thì bạn có thể sử dụng thẻ rel = “canonical” để công cụ tìm kiếm biết rằng đó là một bản gốc và đó là một bản sao của nó. Điều này có thể giúp bạn tránh hình phạt nội dung trùng lặp.

Sử dụng URL Canonicalization như thế nào?

url-canonicalization

Bây giờ chúng ta kiểm tra làm thế nào để áp dụng URL Canonicalization. Chúng ta không cần phải nhập vào dòng code để làm điều đó. Một thẻ rel=”canonical” đơn giản là đủ để áp dụng Canonicalization. ​

Ví dụ, có 2 URL trên website dẫn đến nội dung tương tự khi chúng được giải quyết. 2 URL là:
http://thegioiseo.com
http://www.thegioiseo.com/index.php

HTML Canonicalization

Kết quả URL thứ 2 có nội dung tương tự như URL đầu tiên. Cả 2 đều hiển thị cùng một trang và do đó bạn có thể áp dụng thẻ rel=”canonical”, trong trường hợp này để chỉ ra rằng URL với index.php là một URL Canonical đầu tiên.

Đây là cách nó được áp dụng.
Mã:
<link rel=”canonical” href=”http://thegioiseo.com/index.php”>
HTTP Header Canonicalization

Đánh dấu trên có thể được sử dụng trong trường hợp của nội dung HTML nhưng nếu chúng ta đang đối phó với nội dung non-HTML như một tài liệu PDF thì sao? Trong những trường hợp đó, chúng ta có thể sử dụng HTTP Header Canonicalization.
Mã:
> HTTP/1.1 200 OK
> Content-Type: application/pdf
> Link: <http://www.example.com/white-paper.html>; rel=”canonical”
> Content-Length: 785710
Bạn có thể nhận được thêm thông tin về HTTP Header dựa vào Canonicalization trên blog chính thức của Google Webmaster.

Khi nào thì sử dụng Canonicalization?

Khi bạn đã biết chính xác Canonicalization là gì, bạn có thể xem khi nào bạn nên sử dụng nó. Dưới đây là một vài điều kiện có thể được ngăn chặn bằng URL Canonicalization thích hợp.

– URL khác nhau cho một nội dung tương tự
– Nhiều categories khác nhau và các thẻ có kết quả trong cùng nội dung
– Trang web di động hiển thị nội dung tương tự nhưng URL/subdomain khác nhau
– URL có URL HTTP và HTTPS và cả 2 kết quả trong cùng một nội dung
– Các cổng khác nhau
– Khi website có phiên bản www và non-www
– Trong trường hợp chia sẻ nội dung syndicated

Đây là một số điều kiện chủ yếu mà chúng ta có thể áp dụng URL Canonicalization để tránh đối mặt với hình phạt nội dung trùng lặp.

Lúc không nên thực hiện URL Canonicalization

Kịch bản mà chúng ta không nên thực hiện URL Canonicalization và phần này là mục tiêu hướng tới việc xác định các điều kiện cụ thể. Bạn cũng có thể coi chúng là lỗi khi nói đến URL Canonicalization. Tôi sẽ liệt kê từng cái một, tôi sẽ cố gắng giải thích chúng sao cho đơn giản nhất có thể.

Bỏ qua phân trang canonicalization

Bạn không nên thêm một thẻ canonicalization trên trang thứ 2 của một URL khi URL đó không được index bởi Google.

Nhiều thẻ Canonical là tồi tệ

Nếu một web page có nhiều thẻ rel=”canonical” thì nó sẽ hại bạn. Tạo một thẻ cụ thể và làm cho nó rõ ràng theo những gì bạn thích.

Đừng thêm thẻ Canonical vào URL được rút ngắn

Tôi đã thấy nhiều người áp dụng tag Canonical như thế này:
Mã:
<link rel=”canonical” href=”index.php”>
Loại canonicalization này có chứa nhiều lỗi. Bạn cần phải hiểi rằng bạn cần phải làm cho canonical hoàn chỉnh hơn:
Mã:
<link rel=”canonical” href=”http://thegioiseo.com/index.php”>
Đánh dấu trên là một cách tốt hơn để áp dụng canonicalization.

Không sử dụng canonicalization với #SEO #Google địa phương

Điều này có nghĩa là nhắm mục tiêu và thao túng nội dung của website để phục vụ nó trên khu vực mà bạn nhắm mục tiêu. Nếu bạn thực sự muốn tạo ra một trang web tốt hơn cho khán giả trên toàn cầu, bạn có thể đọc hướng dẫn này để tạo ra trang web đa ngôn ngữ bởi Google.

Canonicalization trên phiên bản mobile của website

Chỉ cần một thẻ canonical để phân biệt một trang web di động trên subdomain của website chính là không đủ. Google khuyến cáo bạn sử dụng rel=”alternate” và rel=”canonical” để hiển thị phiên bản di động của website.

Đây là cách bạn có thể thực hiện nó:
Mã:
> <html>
> <head>
> <link rel=”canonical” href=”http://example.com/” >
> <link rel=”alternate” href=”http://m.example.com/” media=”only screen and (max-width: 640px)”>
> </head>
> <body>
Không sử dụng một thẻ Canonical bên ngoài <head>

Bots tìm kiếm sẽ hoàn toàn bỏ qua thẻ đặt bên ngoài <head>, bạn cần phải thêm nó vào giữa <head></head>.

Không sử dụng nhiều thẻ Canonical trên một website

Việc sử dụng nhiều thẻ Canonical là vô nghĩa. Công cụ tìm kiếm sẽ bỏ qua cả các thẻ và bạn sẽ phải đối mặt với hành vi SEO kì quái và các vấn đề khác. Nhiều thẻ URL canonical đôi khi khiến bạn gặp một vài sự cố, vì vậy hãy theo dõi nó.

Không trỏ Canonical URL vào một website với mã trạng thái non-200

Một trang web với một mã như 301 và 302 sẽ buộc công cụ tìm kiếm thu thập thêm URL và điều này có nghĩa là họ cần phải thu thập 2 URL cùng một lúc. Điều này có thể tăng thêm một số lượng lớn URL được thu thập và nó có thể dễ dàng làm cạn kiệt ngân sách thu thập dữ liệu của bạn.

Một URL với mã trạng thái 404 khiến cho việc thu thập hoàn toàn bị lãng phí và công cụ tìm kiếm sẽ bỏ qua thẻ của bạn.

Không sử dụng Canonicalization cho PageRank Sculpting

PageRank không còn là một thực thể của một website nhưng nó vẫn được xem xét bởi công cụ tìm kiếm. Nếu bạn đang có kế hoạch sử dụng thẻ Canonical cho PageRank sculpting để có thứ hạng tốt hơn thì đó là một suy nghĩ hoàn toàn sai lầm.

Nguồn tổng hợp