Làm gì khi website bị đánh cắp nội dung - Dịch vụ seo

Làm gì khi website bị đánh cắp nội dung

Lấy cắp nội dung là vấn đề phổ biến mà những người sản xuất nội dung thường gặp. Bạn tạo ra nội dung ý nghĩa, thu hút chỉ để cho các website khác thừa cơ lấy mất, tự ý đưa nội dung đó lên website của mình mà không cả chăm chút chỉnh sửa. Việc này giống kiểu các hiệp hội hay các tổ chức phi lợi nhuận đưa ra những nghiên cứu giá trị, và các website khác muốn chia sẻ nội dung đó. Trong một số trường hợp, các hành vi vi phạm có thể không phải là do chủ ý, nhưng không phải tất cả đều như thế.

Vậy làm cách nào bạn có thể khôi phục lại website khi nội dung của nó đã bị đánh cắp? Trước tiên, bạn phải hiểu việc khôi phục này là cả một quá trình lâu dài, không hề dễ dàng như mình mong muốn. Tuy nhiên, Google có thể giúp bạn giải quyết tốt trường hợp này.

Các bước phục hồi website khi bị đánh cắp nội dung

Bước 1: Tìm kiếm vi phạm

Nếu bạn cho rằng website của mình đang bị ảnh hưởng do bản cập nhật Panda và lưu lượng truy cập trên một số trang bị suy giảm nghiêm trọng, hãy ưu tiên tìm kiếm nội dung trùng lặp tương ứng với những mất mát trên các trang đó thông qua công cụ tìm kiếm.

Để bắt đầu, hãy copy một số dòng nội dung từ trang trên website của bạn cho vào trong ngoặc kép, sau đó sử dụng Google tìm kiếm nội dung giống nhau tương tự. Nếu bạn tìm thấy website nào khác có chứa nội dung trùng lặp với nội dung trên website của mình, hãy tìm hiểu xem còn bao nhiêu phần nội dung giống y đúc như thế. Ngoài ra, bạn cũng có thể sử dụng Copyscape để xác định các bản sao nội dung trên những website khác nếu có.

Copy đường dẫn URL từ trang của bạn và URL từ trang khả nghi và paste vào công cụ Content Comparison của Copyscape. Công cụ này sẽ so sánh song song nội dung trên cả 2 trang, sau đó nó sẽ chỉ ra phần trăm nội dung trùng lặp. Tôi thường áp dụng quy tắc, bất cứ nội dung nào có trên 50% trùng lặp thì tôi sẽ tập trung giải quyết ngay. Tuy nhiên, bạn sẽ phải ngạc nhiên khi tần suất bắt gặp những nội dung trùng lặp như thế này thường là 90 – 100 %.

Bước 2: Ghi lại những vi phạm

Khi tìm thấy các nội dung sao chép, hãy ghi lại thông tin vào trong bảng tính (bao gồm cả chỉ số phần trăm trùng lặp). Nếu bạn thấy một website gần như đã copy nguyên bản một phần bất kỳ nội dung trên website của mình, hãy tìm hiểu xem nó còn copy phần nào khác nữa hay không. Tôi phát hiện ra rằng các website khi đã copy nội dung 1 trang, thì nó sẽ copy nội dung của nhiều trang khác. Hãy đăng nhập vào tất cả các trang trên website đó, bạn có thể khám phá ra nhiều thứ khác nữa.

lam-gi-khi-website-bi-danh-cap-noi-dung

Ngoài ra, bạn cũng có thể sử dụng Wayback Machine để kiểm tra website vi phạm đã sử dụng nội dung trùng lặp đó trong thời gian bao lâu. Thu thập thông tin và ghi lại tất cả những gì bạn tìm thấy về hành vi vi phạm bản quyền này.

Bước 3: Tiếp cận với chủ các website vi phạm

Bước tiếp theo đó là bạn phải liên hệ với chủ các website vi phạm. Tôi thường bắt đầu quá trình này bằng cách gửi một email cảnh báo đầy thân thiện về tình trạng vi phạm và lịch sự yêu cầu họ gỡ bỏ trang đó xuống. Ngoài ra, tôi cũng đề nghị chủ các website này phải trả lời email trước một thời hạn nhất định để thông báo cho tôi biết nội dung copy đó đã bị xóa bỏ.

Vậy làm cách nào bạn có thể tìm ra chủ của các website vi phạm? Nếu website không có chứa những thông tin đó, hãy sử dụng hệ thống tra cứu WhoIs lookup để kiểm tra tên miền. Có thể chủ website ẩn thông tin liên lạc, nhưng nếu không phải vậy, bạn có thể nhìn thấy thông tin liên lạc cá nhân và email trên website đó.

Thông thường, thư yêu cầu qua email cũng đủ để khiến chủ các website phải gỡ bỏ nội dung vi phạm xuống. Tuy nhiên, nếu họ không chấp thuận, bạn có thể gửi thư bưu chính với những lời mạnh mẽ, cương quyết hơn, hoặc sử dụng luật sư đại diện nếu thấy cần thiết.

Bước 4: Nếu trang web vi phạm không bị xóa bỏ

Sau tất cả những nỗ lực của bản thân, nếu trang web vi phạm vẫn không bị gỡ bỏ và bạn không thể giải quyết mâu thuẫn với chủ website, đã đến lúc bạn cần phải sử dụng những biện pháp mạnh mẽ hơn.

Vi phạm bản quyền là một hành vi vi phạm đã được liệt kê trong DMCA (Luật bảo vệ bản quyền tác giả trên lĩnh vực công nghệ số). Google và Bing sẽ gỡ bỏ nội dung trùng lặp nếu nó vi phạm DMCA, nhưng trước hết các công cụ này sẽ yêu cầu bạn hãy tự giải quyết mâu thuẫn với các chủ website.

Những tín hiệu xấu của việc cung cấp nội dung cho website khác

Nếu bạn đang cung cấp nội dung hay cho phép một website khác copy nội dung của mình, vấn đề này có thể tương đối rắc rối. Nếu nội dung hoàn toàn trùng lặp, bạn (và website đang sử dụng nội dung đó) có nguy cơ bị ảnh hưởng bởi các bản cập nhật của thuật toán Panda. Đôi khi, Google có thể hiểu sai tác giả gốc của nội dung đó hoặc không xếp hạng cao nhất cho các phiên bản nội dung được ưu tiên. Lời khuyên của Google trong trường hợp này đó là:

Google luôn luôn chỉ hiển thị phiên bản nội dung mà nó cho là phù hợp nhất với người dùng trong kết quả tìm kiếm, đó có thể là phiên bản nội dung bạn không thích. Tuy nhiên, hãy đảm bảo mỗi website mà bạn cung cấp nội dung đều có một liên kết quay lại với bài viết gốc. Bạn cũng có thể yêu cầu những người đang sử dụng nội dung do bạn cung cấp sử dụng thẻ meta noindex để ngăn công cụ tìm kiếm lập chỉ mục cho các phiên bản nội dung đó.

Hãy bảo vệ nội dung website vì mục tiêu dài hạn

Các bước trên nghe có vẻ thật khó thực hiện, nhưng bảo vệ quyền tác giả chính là trách nhiệm của những người sáng tạo nội dung. Một trong những cách để bạn có thể ngăn chặn tình trạng này ngay từ đầu đó là thể hiện rõ quyền tác giả của bản thân – hãy thêm icon quyền tác giả và năm tạo lập vào mỗi trang trên website, tính từ thời điểm khởi tạo cho đến thời điểm hiện tại.

Một công cụ khác bạn có thể sử dụng để tìm kiếm các trang trùng lặp đó là CopySentry của CopyScape. Chi phí sử dụng công cụ này tương đối thấp, nó sẽ liên tục theo dõi các trang cụ thể bạn đã nhận diện trên website của mình và thông báo nếu tìm thấy nội dung trùng lặp. Nếu website có chứa các trang phổ biến, đã từng bị ăn cắp nội dung trước đây, hãy ưu tiên kiểm tra các trang này trước nhé.

Nói tóm lại, quá trình phục hồi website như này rất tốn thời gian, thời gian tìm kiếm trang vi phạm, ghi lại vi phạm, thời gian liên hệ với chủ website, báo cáo đến các công cụ tìm kiếm và thời gian phục hồi (ngay cả khi trang vi phạm đã được gỡ bỏ). Nó có thể khiến bạn bực bội nhưng đây là một việc làm cần thiết để bảo vệ nội dung và duy trì thứ hạng ổn định cho website.

Nguồn tổng hợp