Thuật toán Google Panda là gì

Update thuật toán google panda

Ngày thuật toán Google Panda được ra mắt: 23 tháng Hai năm 2011

Mục đích chính của thuật toán Google Panda là để thưởng cho các trang web chất lượng cao và giảm thiểu sự hiện diện của các trang web chất lượng thấp trong kết quả của công cụ tìm kiếm tự nhiên của Google. Ban đầu, thuật toán này được gọi là Farmer – Nông dân. Theo Google, đợt giới thiệu ban đầu của Panda trong thời gian vài tháng đã ảnh hưởng tới 12% kết quả tìm kiếm bằng tiếng Anh. Chúng tôi đã theo dõi 28 cập nhật dữ liệu của Panda từ năm 2011 đến năm 2015.

Hiểu nhanh về Panda

Thuật toán Panda và các bản cập nhật của nó giải quyết một số vấn đề trong trang kết quả tìm kiếm của Google, bao gồm:

  • Nội dung quá ít – Các trang web ít hoặc quá ít văn bản và tài nguyên có liên quan, chẳng hạn như tập hợp các trang mô tả một loạt các điều kiện sức khỏe chỉ với một vài câu ở mỗi trang.

 

  • Nội dung trùng lặp – Nội dung được sao chép và đã xuất hiện trên Internet ở nhiều nơi. Các vấn đề về nội dung bị trùng lặp cũng có thể xảy ra trên trang web của riêng bạn khi bạn sở hữu nhiều trang có cùng nội dung với ít hoặc không có biến thể nào. Ví dụ, một công ty vệ sinh ống khói có thể tạo 10 trang web khác nhau, một trang cho mỗi thành phố mà họ phục vụ, với nội dung gần như giống nhau trên tất cả các trang và chỉ có tên thành phố được đổi (ví dụ: “Chúng tôi vệ sinh ống khói ở Denver” trên một trang và “Chúng tôi vệ sinh ống khói ở Boulder” ở trang khác, và “Chúng tôi vệ sinh ống khói ở Aspen” ở trang tiếp theo).

 

  • Nội dung chất lượng thấp – Các trang cung cấp ít giá trị cho người đọc vì họ thiếu các thông tin chuyên sâu.

 

  • Thiếu nguồn gốc/không đáng tin cậy – Nội dung được tạo ra bởi các nguồn không được coi là xác thực hoặc đáng tin tưởng. Một đại diện của Google tuyên bố rằng các trang web muốn tránh tác động của Panda nên cố gắng để được công nhận là cơ quan chức năng về chủ đề và ngành nghề họ đang kinh doanh để người dùng cảm thấy thoải mái khi cung cấp thông tin thẻ tín dụng của họ.

 

  • Tạo ra nội dung bằng cách chắp vá nội dung từ các trang web khác – Một số lượng lớn các trang chất lượng thấp thường có nội dung được tổng hợp từ các trang web khác. Ví dụ điển hình cho vấn đề này là một trang web sử dụng số lượng lớn người viết bài mức lương thấp để tạo các bài viết ngắn chuẩn SEO cho Google, tạo ra nội dung thiếu giá trị và xác thực cho người đọc vì mục đích cốt lõi của nó chỉ đơn giản là để đạt được thứ hạng trong công cụ tìm kiếm cho các thuật toán hiện nay.

 

  • Nội dung chất lượng kém do người dùng tạo ra (UGC) – Ví dụ về loại nội dung kém do người dùng tạo ra là blog chuyên đăng các bài viết ngắn, đầy lỗi chính tả và ngữ pháp và thiếu thông tin có thẩm quyền do khách hàng của họ viết.

 

  • Tỷ lệ quảng-cáo-so-với-nội-dung cao – Trang được tạo thành do phần lớn các quảng cáo thay vì nội dung có liên quan dịch vụ và sản phẩm đang kinh doanh.
Tỷ lệ quảng cáo so với nội dung chênh lệch quá nhiều
                                              Tỷ lệ quảng cáo so với nội dung chênh lệch quá nhiều

 

  • Nội dung chất lượng thấp bao quanh các liên kết ngoại – Nội dung nghèo nàn xung quanh các liên kết trỏ đến các trang web quảng cáo trả tiền khác.

 

  • Trang web bị người dùng chặn – Trang web mà người dùng đang chặn trực tiếp trong kết quả của công cụ tìm kiếm hoặc bằng cách sử dụng tiện ích trình duyệt Chrome để làm như vậy, cho thấy đây chính là một website chất lượng thấp.

 

  • Nội dung không tương thích với truy vấn tìm kiếm – Các trang web “hứa hẹn” sẽ cung cấp câu trả lời có liên quan nếu được nhấp vào trong kết quả tìm kiếm, nhưng sau đó lại không thể đưa ra được câu trả lời thuyết phục cho vấn đề mà người dùng đang tìm kiếm. Ví dụ: một trang web có thể có tiêu đề “Phiếu thưởng cho Whole Foods”, nhưng khi được nhấp vào, có thể không có phiếu giảm giá hoặc có thể chỉ là một trang quảng cáo, dẫn đến thất vọng cho người dùng.

Làm sao tôi biết được tôi đã bị phạt bởi Panda hay chưa?

Một dấu hiệu dễ nhận thấy của hình phạt Panda tiềm ẩn là sự sụt giảm đột ngột về lưu lượng truy cập (traffic) tự nhiên hoặc xếp hạng công cụ tìm kiếm trên trang web của bạn giảm đáng kể trong hoặc sau các ngày cập nhật thuật toán.

Mỗi khi Google cập nhật thuật toán, traffic sẽ giảm đáng kể
                                                          Mỗi khi Google cập nhật thuật toán, traffic sẽ giảm đáng kể

Tuy nhiên, có rất nhiều yếu tố có thể ảnh hưởng đến thứ hạng và lưu lượng truy cập của một trang web. Điều này bao gồm sự nổi lên của đối thủ cạnh tranh trong thị trường mà bạn đang hoạt động (xem ai là người xếp hạng cao hơn bạn để xem liệu ai đó mới đã vượt lên trước bạn hay không), hình phạt thủ công (kiểm tra Google Search Console cho các vấn đề được báo cáo), sự giảm hứng thú của khách hàng theo mùa hoặc các kỳ đặc biệt trong năm, hoặc thậm chí một bản cập nhật hoàn toàn khác với Google so với một trong những thuật toán mà bạn nghi ngờ (ví dụ, Penguin thay vì Panda).

Khi một bản cập nhật đã được đặt tên và công bố rộng rãi phát huy tác dụng của nó, điều quan trọng là nghiên cứu tài liệu trong ngành về các điều khoản có liên quan đến bản cập nhật này. Nếu việc mất thứ hạng hoặc lưu lượng truy cập của bạn tương ứng với ngày cập nhật thuật toán, hãy xem qua các danh sách các hành vi xấu để khám phá xem chúng có đang diễn ra trên trang web của bạn hay không. Sau đó, nếu bạn tin rằng bạn đã tìm thấy mối tương quan giữa thực tiễn trang web của mình và bản cập nhật, hãy hành động để khắc phục chúng.

Làm sao để khắc phục sau khi bị hình phạt Panda?

Trong lĩnh vực Seo, thuật toán google Panda đã được thường xuyên được nhắc đến như là một bản cập nhật của Google khiến chủ các trang web khó khăn trong việc khắc phục lại sau khi bị phạt. Tuy nhiên, các biện pháp khắc phục bao gồm:

  • Ngừng ngay việc tạo nội dung bằng cách chắp vá nội dung từ các trang web khác

 

  • Trùng tu nội dung trang web về chất lượng, tính hữu dụng, mức độ liên quan, và sự tin cậy.

 

  • Sửa đổi quảng cáo/nội dung hoặc tỷ lệ liên kết/nội dung để các trang không bị chi phối bởi quảng cáo hoặc liên kết ngoại.

 

  • Đảm bảo rằng nội dung của trang đáp ứng được truy vấn tìm kiếm của người dùng

 

  • Xóa bỏ các nội dung bị trùng lặp

 

  • Sàng lọc hoặc chỉnh sửa các nội dung do người dùng tạo ra và đảm bảo rằng nội dung này chính thống, không có lỗi và hữu ích cho người đọc

 

  • Sử dụng robot noindex, nofollow để ra lệnh nhằm chặn các nội dung trang web nội bộ trùng lặp hoặc gần trùng lặp hoặc các phần tử có vấn đề khác được index trên hệ thống tìm kiếm của Google

Tóm lại, các trang web thường xuyên xuất bản nội dung chất lượng cao có ít lo sợ từ bản cập nhật này, nhưng nếu trang web của bạn dính vào các vấn đề được nêu trên thì có thể đã bị Panda phạt vào một thời điểm nào đó. Từ quan điểm kinh doanh, thực tế, cách tốt nhất để tránh bị Panda phạt là là phát triển một thương hiệu được công nhận và là một đơn vị đáng tin cậy trong lĩnh vực của mình, thêm vào đó hãy xây dựng một trang web trở thành một nguồn thông tin đáng tin cậy bởi nội dung tuyệt vời của nó.

Một số sự thật khác vụ bản cập nhật Panda

  • Panda ban đầu được tung ra riêng biệt từ thuật toán cốt lõi nhưng sau đó được tích hợp vào nó vào tháng 3 năm 2012 (tuy chưa được Google công nhận về thời gian này).
  • Panda được đặt tên theo nhân viên của Google – Navneet Panda.