Tối ưu Trùng Lặp Nội Dung - Seo Audit #3

- [tintuc]Trùng lặp nội dung là hiện tượng Google Index nhiều trang trên một Website có nội dung giống nhau hoặc trùng phần lớn nội dung.

Qua tìm hiểu thì trùng nội dung này xuất hiện là do phần lớn bạn không am hiểu đến nền tảng Website mà bạn đang sử dụng nên sử dụng các hàm gọi tiêu đề (tiêu đề website, tiêu đề bài viết)/ mô tả (meta description).. y chang nhau ở nhiều trang mà không phân điều kiện hiển thị ở từng trang...

Một phần nữa là phân trang, hay sắp xếp nội dung thông qua các tham số xuất hiện trong URL nên tự động sản sinh ra URL mới được Google cập nhật.

Trùng lặp nội dung phổ biến nhất (hầu hết mọi nền tảng)

  1. Trùng lặp tiêu đề/mô tả trên các phân trang tin tức (lỗi phổ biến nhất xuất hiện hầu hết các nền tảng)
  2. Trùng lặp nội dung trên các trang Catelogy/Label
  3. Tham số url sinh ra để lọc và sắp xếp nội dung
Chủ yếu loanh quanh về Tiêu đề và Mô tả Meta Description.

Hiện trượng trùng tiêu đề Mô tả tại các phân trang thuộc trường hợp 1

Vì sao phải sửa lỗi trùng lặp nội dung?

Mình nghĩ là Google thừa sức biết được việc trùng lặp nội dung là điểm yếu trên các nền tảng Website. Ví dụ Blogger.com của google không có khai báo Meta Description riêng cho trang Nhãn nên bị trùng lặp hầu như là 95%.

Nhưng! Google lại đánh giá kém những Website này. Ai cũng bị nhưng lại đánh giá kém!!!?
Là vì Google muốn tìm những "ứng viên" ưu tú nhất tối ưu những khuyến điểm ở mỗi nên tảng.

Riêng trùng lặp nội dung trên Blogspot 

Xảy ra cụ thể ở 3 trường hợp
1. Phân trang ở trang bài viết mới nhất: 
  • URL: https://www.toilaquantri.com/search 
hoặc 
  • https://www.toilaquantri.com/search/label
2. Phân trang ở trang nhãn:
  • https://www.toilaquantri.com/search/label/Blogspot%20Tips?&max-results=10
3. Trang lưu trữ:
Có định dạng URL
  • Domain.com/nam
  • Domain.com/nam/thang
Ví dụ:
https://www.toilaquantri.com/2016 (lưu trữ các bài viết xuất bản năm 2016)

Cách xử lý trùng lặp nội dung trên Blogger

Yêu cầu:
Robots.txt cho phép Allow: ?updated-max* và Allow: max-results và Allow: Pageno
Xem hướng dẫn dưới sẽ hiểu

1. Fix Trùng lặp nội dung ở bài viết mới nhất:

Hình thức sửa: Cấu hình tham số URL trong Webmaster Tools
  1. Tham số PageNo (Chỉ dùng tham số này khi bạn dùng code phân trang của mình tại đây)
  2. Dạng chỉ định (Vì phân loại nội dung từ mới đến cũ)
  3. Chọn Hãy để cho Googlebot quyết định
Tham số PageNo, phân trang ở tất cả bài viết

         4. Sau khi đã xử lý tham số URL bạn thêm dòng sau vào Robots.txt
Allow: ?updated-max* (chỉ áp dụng với blogger vì đường dẫn phân trang xuất hiện ?updated-max*)
Lưu ý:
Các trang ở phân lúc này Title trống, Meta Description trống lúc này để cho Google tự quyết định.
Bạn kiểm tra bằng SEO Quake sau đó tối ưu các thẻ meta, nói chung cần có kiến thức code.

2. Fix Phân trang ở trang nhãn:

Mình đã hướng dẫn tại bài viết trước: Xem tại đây
Phần này xử dụng tham số: max-results, giá trị 10

Thiết lập tham số URL

3. Fix trang lưu trữ

  • Phần này yêu cầu phải để trống Title (hoặc lấy giá trị năm tháng điều được) và meta Description để trống để Google tự quyết định
  • Nếu tự động lấy Title của Blog và meta Description của trang chủ thì bạn đặt điều kiện phần thẻ meta lại
  • Xem điều kiện trên Blogger: Thẻ điều kiện trên Blogger

Kết quả: Xử lý tham số URL cho trang Label

Nên phần Meta Description của trang nhãn mình đề xuất để giá trị rỗng cho Google tự tối ưu. Đặc biệt trang nhãn nào bạn muốn tối ưu để SEO thì xem bài viết: Hướng dẫn tối ưu SEO trang Label Blogger

Xem cách sửa: https://www.toilaquantri.com/2018/05/xu-ly-trung-noi-dung-phan-trang-bang-tham-so-URL.html

Sau khi đã xử lý tham số URL bạn thêm dòng sau vào Robots.txt
Allow: ?updated-max* (chỉ áp dụng với blogger)
 Allow: /page/ (chỉ áp dụng với wordpress)
Mục đích: Để cho bọ tìm kiếm Index các phân trang trong trang nhãn.
Như mình đã lưu ý: Khi đã tiến hành xử lý bằng tham số URL thì đảm bảo tất cả phân trang phải được Google index hết để dùng các trang đó để tăng độ Trust. Lúc này bạn dùng các phần mềm kiểm tra trùng lặp nội dung có cảnh báo bạn cũng không cần quan tâm nữa.... Mình đã có nói rõ ý đồ trong link trên sẽ khác với mục đích chặn Robots.txt để tránh trùng lặp, 2 cách làm phục vụ cho 2 mục đích khác nhau nên không có cách làm nào là sai cả.
[/tintuc]
Huỳnh Phụng Blogger

TLQT là Blog chia sẻ kiến thức về Marketing, Digital Marketing, Kinh nghiệm làm SEO, Tối ưu Website và nhiều thứ khác

Đăng nhận xét

➔ Gửi kèm hình ảnh trên bài viết để được hỗ trợ tốt nhất.
➔ Để bình luận kèm hình ảnh, bạn vào trang Upload Ảnh, kéo thả để Upload hình ảnh lên.
➔ Bạn dán URL link hình ảnh vào khung bình luận và ấn Xuất bản, ảnh sẽ được tự động tải lên.
➔ Không spam trong khung bình luận, hạn chế viết tắt.
➔ Tích vào ô Thông báo cho tôi (Notify me) để nhận thông báo phản hồi của Admin

Mới hơn Cũ hơn

POST ADS1

POST ADS 2