Nếu bạn là một content SEO thì ắt không thấy xa lạ với cụm từ “Google Panda”. Đây là một thuật toán lọc và đánh giá chất lượng bài viết nhằm xếp hạng các kết quả tìm kiếm. Tuy nhiên, nếu bạn chưa biết hay chưa hiểu rõ về thuật ngữ trên thì bài viết này sẽ cung cấp các thông tin chi tiết về thuật toán Google Panda để bạn đọc hiểu được khái niệm, cách khắc phục khi bị phạt và các vấn đề khác liên quan.
Thuật toán Panda hay Google Panda là một thuật toán được phát triển bởi Google, phát hành đầu tiên vào tháng 2/2011. Google Panda có nhiệm vụ đánh giá lại chất lượng của trang web để xếp hạng các kết quả tìm kiếm được công bằng và hiệu quả hơn. Thuật toán này sẽ lọc những nội dung kém chất lượng, nội dung copy, và các trang web có thương hiệu kém.
Trước đó, có những web kém chất lượng hoặc quá ít nội dung được xếp hạng cao hơn các trang web chất lượng. Đặc biệt, có web chuyên đi sao chép lại nội dung dễ làm các thuật toán cũ của Google nhận nhầm và được đẩy thứ hạng lên cao hơn các trang gốc. Do đó, Google Panda lọc và đưa những trang chất lượng về đúng vị trí mà nó xứng đáng.
Theo một bài viết của trang CNET, sau khi thuật toán này xuất hiện, vị trí của các trang tin tức và mạng xã hội có sự thay đổi mạnh. Các trang chứa lượng lớn quảng cáo được đánh tụt xuống vị trí thấp hơn so với các trang khác. Cụ thể, ước tính khoảng 12% các kết quả tìm kiếm bị thuật toán này thay đổi thứ hạng. Google Panda đưa các trang chất lượng lên đầu và cảnh cáo các trang vi phạm bản quyền và vấn đề khác. Điều này giúp các trang kém chất lượng dốc sức cải thiện để được có thứ hạng đề xuất cao hơn.
Google đã hỗ trợ người dùng cải thiện nội dung bằng cách công bố các chỉ tiêu đo và xếp hạng. Hành động này giúp Google tạo được một môi trường chất lượng và lành mạnh cho khách hàng. Matt Cutts, một chuyên gia của Google, cho rằng quyết định này là sáng suốt nhằm cải thiện chất lượng thông tin trên mạng vì nó ảnh hưởng trực tiếp đến thu nhập của người dùng.
Google Panda lần đầu tiên được ra mắt vào ngày 24 tháng 2 năm 2011. Được cấp bằng sáng chế số 8,682,892 vào ngày 25/3/2014. Trong chỉ 2 năm đầu tiên, Google Panda đã được cập nhật mỗi tháng một lần và các cập nhật sẽ còn tiếp tục nhằm tối ưu thuật toán này.
Trong hai năm đầu, thuật toán này được cập nhật liên tục mỗi tháng. Đến hiện tại, Google vẫn không ngừng cải thiện thuật toán để đánh giá hiệu quả và công bằng hơn. Tính đến nay, phiên bản mới nhất là phiên bản Panda 25 cập nhật vào 15/3/2013
Thông qua công bố chỉ tiêu của Google, sau đây là các yếu tố thuật toán Panda xem xét khi đánh giá chất lượng của một trang web bất kỳ:
Để tận dụng Google Panda giúp trang web của bạn được đề xuất đầu tiên, bạn cần biết đối tượng thuật toán nhắm đến. Đồng thời, việc này giúp bạn tránh được các lệnh phạt và duy trì chất lượng trang web.
Thin content là những nội dung kém về cả chất và lượng. Khi nội dung của bạn quá ít hoặc không đạt yêu cầu khác đều bị đánh giá là kém chất lượng.
Các dạng lỗi được đánh giá là nội dung kém chất lượng có thể kể đến là:
Trùng lặp nội dung là một trong những lỗi phổ biến khi làm nội dung cho các trang web. Lỗi này xuất hiện khi người viết không có chuyên môn về lĩnh vực đang viết hoặc không biết diễn đạt nó theo cách hiểu của bản thân. Điều này dẫn đến việc sao chép nội dung từ các bài viết khác để ghép lại thành một bài “mới”.
Ngoài ra, việc viết lại cùng một nội dung đôi khi bị thuật toán Panda cho là rác nên vẫn sẽ bị loại bỏ. Mặt khác, việc loại bỏ này có thể diễn ra tại chính trang web của bạn nếu Google phát hiện có nhiều trang có nội dung gần như tương đồng.
Nội dung bị đánh giá là chất lượng thấp vì các thông tin không được sâu. Việc này có thể do người viết không đủ kiến thức về lĩnh vực đó hoặc chưa tìm hiểu kĩ về nội dung cần viết.
Các dấu hiệu nhận biết khi bài viết mắc lỗi này:
Những trang web không được tin tưởng được cho là tính thẩm quyền (authority), độ tin cậy (trust) thấp hoặc tính bảo mật không cao (security). Do đó, các trang web này dễ bị Google Panda nhòm ngó và có thể giảm xếp hạng, thậm chí loại bỏ.
Đây là thuật ngữ chỉ những trang web chỉ chú trọng việc nhồi nhét các từ khóa, thông tin không cần thiết. Các web này thường thực hiện SEO tốt. Do đó, chúng được xếp hạng cao trong kết quả tìm kiếm trên Google. Tuy nhiên, nếu bài viết không chú trọng chất lượng nội dung thì vẫn không được thuật toán đánh giá cao.
Quảng cáo trong web là cách giúp người làm web kiếm tiền. Nhưng đặt quá nhiều quảng cáo vào bài viết mà không đầu tư nội dung sẽ gây bất lợi cho chủ website. Vì nếu có quá nhiều banner quảng cáo, thuật toán Panda sẽ cho rằng đó là trang kém chất lượng.
Schema là đoạn code dùng để đánh dấu dữ liệu có cấu trúc. Schema cung cấp dữ liệu để search engine nhận biết chủ đề và nội dung chính của bài viết. Lỗi schema hay lạm dụng nó thể hiện bạn khai báo sai so với con số thực tế.
Ví dụ: bạn khai có 100 lượt review trên web khi làm schema review thì trên trang web của bạn phải hiển thị được các con số đó. Nếu các thông tin này trên thực tế không đúng với bản khai thì bạn có thể sẽ nhận phạt khi google quét đến trang bạn quản lý. Do đó, cần trung thực vì sẽ dễ dàng nhận “thẻ đỏ” nếu có sự gian dối trong công việc.
Khi tạo và duy trì một trang web, không ai muốn vi phạm các quy tắc của Google. Tuy nhiên, ta cần biết được khi nào bị google cảnh cáo để chỉnh sửa lại cho phù hợp. Sau đây là các dấu hiệu giúp bạn nhận biết trang web của bạn nhắm tới.
Đây là dấu hiệu phổ biến và dễ nhận thấy nhất. Lỗi này xuất hiện khi mức trùng lặp nội dung lên vượt quá 20% trong thời gian dài. Trong thời gian đầu, bạn có thể sẽ không bận tâm đến việc giảm lượng traffic. Sự nghiêm trọng của vấn đề sẽ xuất hiện rõ sau 1 2 tháng hay có thể chỉ là 1 tuần. Độ giảm traffic sẽ càng tăng mạnh nếu không khắc phục lỗi. Đồng thời, Google Panda sẽ gây ảnh hưởng không tốt đến trang web bạn quản lý.
Google webmaster tool (hay google console) sẽ gửi cho bạn các thông báo của google để bạn có thể lập kế hoạch khắc phục lỗi. Khi nhận được các thông báo này, có thể một trong số đó là cảnh cáo về “án phạt” của Google dành cho bạn.
Không may web bị dính lỗi và bị phạt, nếu bạn khắc phục thì trang web sẽ có thể trở lại hoạt động tiếp, bằng không sẽ bị loại bỏ. Để khắc phục được lỗi, sau đây là một số cách bạn có thể tham khảo.
Noindex và canonical là hai khái niệm được sử dụng khá nhiều để SEO onpage. Bạn có thể sử dụng chúng để cắt những nội dung dư thừa kém chất lượng để giúp Google Panda “ưng ý” hơn.
Để cải thiện được chất lượng nội dung, bạn cần tìm hiểu rõ về chủ đề đang viết. Thuật toán của Google hoạt động liên tục để nhằm loại bỏ các nội dung không đạt yêu cầu hoặc giảm xếp hạng của chúng. Google Panda sẽ scan qua nội dung của các trang trong web để đánh giá tổng quan về chất lượng. Do đó bạn cần đầu tư kỹ cho từng bài viết để được Google đánh giá cao hơn.
Ngoài cải thiện chất lượng nội dung, bạn cần tăng chất lượng tổng thể của web để được đánh giá cao hơn. Thực hiện điều này bằng cách:
Để tiện lợi trong việc kiểm tra, bạn có thể dùng các công cụ sau để hỗ trợ để kiểm tra, tránh việc nhận phạt từ Google.
Copy scape là trang web phải trả phí. Nó hỗ trợ bạn kiểm tra các nội dung bạn đã sao chép từ trang khác, và nội dung của bạn bị trang khác sử dụng lại. Khi kiểm tra, nếu cột Risk bài viết có màu càng đậm thì bài viết đó có tính unique càng thấp. Đây là dấu hiệu tiêu cực. Nếu không được khắc phục, Google Panda sẽ cảnh cáo và đưa ra hình phạt.
Siteliner thông qua trùng lặp nội dung trong trang của bạn (Duplicate content on your site) để tìm nội dung sao chép. Sau đó, nó sẽ đưa ra các chỉ số phần trăm giống nhau giữa các bài viết nhằm giúp bạn cải thiện tính độc quyền cho nội dung của mình. Tuy nhiên, giống với Copy scape, Siteliner cần trả phí để hỗ trợ bạn.
Google sẽ luôn thông báo mọi vấn đề về website của bạn qua công cụ này. Hãy luôn chú ý dành thời gian cho nó và xem thêm bài viết hướng dẫn cách sử dụng google search console để chăm sóc website của bạn tốt nhất.
Tóm lại, Google Panda là thuật toán mà Google tạo ra để quản lý và nâng cấp chất lượng bài viết trên các trang web nhờ vào những tiêu chuẩn, nguyên tắc kiểm tra và xử lý khác nhau. Chỉ cần không vi phạm hoặc nếu có và biết cách khắc phục lỗi khi bị phạt, bạn sẽ không cần phải lo Google Panda gây ảnh hưởng đến trang web của mình. Bên cạnh google panda thì Google Penguin cũng là một thuật toán khác rất nổi tiếng của google.