Google Penguin: Triệu chứng, nguyên nhân và cách chữa trị

Vào năm 2012, Google đã chính thức ra mắt bản cập nhật thuật toán webspam đánh mạnh vào các link spam và việc xây dựng liên kết.

Thuật toán webspam sau đó được biết đến chính thức là bản cập nhật thuật toán Google Penguin. Thông tin này được biết đến thông qua một tweet của Matt Cutts – người đứng đầu nhóm webspam của Google.

Mặc dù Google đặt tên cho thuật toán này là Penguin. Nhưng không có thông báo chính thức nào về việc tên gọi này đến từ đâu.

Tên thuật toán Panda xuất phát từ một trong những kỹ sư chủ chốt liên quan đến nó. Nhiều khả năng cái tên Penguin cũng có nguồn gốc tương tự. Một trong những giả thuyết tôi yêu thích đó là cái tên Penguin này dùng để tỏ lòng tôn kính đến The Penguin của DC’s Batman.

Trước khi có sự xuất hiện của thuật toán Google Penguin, link volume đóng góp một phần quan trọng trong việc xác định web score khi nó được crawl, index và phân tích bởi Google.

Điều này có nghĩa là khi xếp hạng các website theo scores cho các trang kết quả tìm kiếm thì những website có chất lượng thấp và một số mẫu content lại được xuất hiện ở những vị trí tốt trong kết quả organic search.

thuật toán penguin là gì
Thuật toán penguin là gì?

Google Penguin có thể khiến organic traffic và thứ hạng của keyword giảm đột ngột không báo trước.

Thuật toán này sẽ không phạt mạnh trên toàn bộ website, nó chỉ đánh vào một số từ khóa hoặc nhóm từ khóa nhất định.

Hơi rắc rối đúng không? Để tôi phân tích chi tiết cho bạn!

Lý do xuất hiện Google Penguin

Google bắt đầu cuộc chiến với các website có chất lượng thấp bằng thuật toán Google Panda. Google Penguin được xem là một phần mở rộng và bổ sung vào kho vũ khí để Google tiếp tục chiến đấu.

google panda là gì
Thuật toán Google Penguin là phiên bản mở rộng của Google Panda

Penguin được xem là phản ứng của Google trước việc các website áp dụng black hat link building thâu tóm kết quả tìm kiếm và bảng xếp hạng.

“Chúng tôi xem xét và tìm kiếm một giải pháp để giải quyết những content có chất lượng thấp. Đầu tiên là với thuật toán Panda. Sau đó chúng tôi nhận thấy rằng vẫn còn rất nhiều spam. Vì thế Penguin được thiết kế để giải quyết vấn đề trên.”

Cutts phát biểu tại hội nghị SmX Advanced 2012.

Mục tiêu của thuật toán này là giành lại thứ hạng cho các website có content chất lượng. Ngoài ra nó còn làm giảm hiệu quả của một số kĩ thuật spam mũ đen.

Bằng cách hiểu rõ và xử lý nhiều loại links websites mà các webmaster có được, Google Penguin hoạt động để đảm bảo rằng các link tự nhiên, có thẩm quyền và các link liên quan sẽ được đánh giá cao. Trong khi đó các spam links sẽ bị hạ cấp.

Google Penguin chỉ xử lý các liên kết đến của một website. Google chỉ xem xét các link trỏ đến website. Nó không quan tâm đến các out links của website đó.

Đọc thêm về các án phạt của Google:

Ra mắt lần đầu và các ảnh hưởng

Khi Penguin ra mắt lần đầu tiên vào tháng 4 năm 2012, theo ước tính của Google thì nó đã ảnh hưởng đến hơn 3% kết quả tìm kiếm.

Penguin 2.0, đây là bản cập nhật thứ 4 (bao gồm cả lần khởi chạy đầu tiên) đã được phát hành vào tháng 5 năm 2013. Lần này nó đã gây ảnh hưởng khoảng 2,3% đến tất cả các queries.

Thuật toán Google Penguin giảm thứ hạng website

Ngay sau khi thuật toán Google Penguin được giới thiệu, các webmaster và nhiều doanh nghiệp sử dụng các kĩ thuật link building và các backlinks có chất lượng thấp đã thấy được lượng organic traffic và vị trí xếp hạng bị giảm đáng kể.

Xem thêm Organic Traffic là gì? 5 Cách tăng traffic tự nhiên cho website: tại đây

thuật toán google penguin, thuat toan google penguin, cập nhật google
Thuật toán Google Penguin lần đầu tiên được cập nhật vào ngày 24/04/2012 gây ảnh hưởng đến 3.1% của truy vấn tìm kiếm

Thuật toán Google Penguin không làm tụt hạng toàn bộ website. Nó chỉ xử lí một số phần và chỉ ảnh hưởng đến một số nhóm từ khóa nhất định (bị spam hay được tối ưu hóa quá nhiều). Ví dụ như các sản phẩm chính và trong một số trường hợp có thể ảnh hưởng đến toàn thương hiệu.

Tác động của Penguin cũng có thể thông qua các tên miền. Vì thế mà việc thay đổi tên miền hay chuyển hướng tên miền cũ sang tên miền mới có thể gây ra nhiều vấn đề về lâu dài.

Các thử nghiệm và nghiên cứu cho thấy rằng sử dụng 301 và 302 redirect sẽ không thể loại bỏ tác dụng của Google Penguin.

Trong Google Webmasters Forum, John Mueller đã xác nhận rằng sử dụng meta refresh từ một domain sang một domain mới cũng có thể gây ra các rắc rối.

“Nói chung, chúng tôi khuyên bạn không nên sử dụng meta-refresh type redirects. Điều này có thể gây nhầm lẫn với người dùng và search engine crawlers. Họ có thể nhầm lẫn rằng đó là một attempted redirect.”

Thoát khỏi thuật toán Google Penguin

Đầu tiên, bạn không thể bỏ qua bước vô cùng quan trọng – Kiểm tra website có bị Google phạt. Nghe có vẻ hơi thừa đúng không? Nhưng tôi muốn bạn đảm bảo rằng website của bạn thực sự bị Google phạt chứ không phải website bị giảm traffic, thứ hạng vì đối thủ làm tốt hơn mình.

Vậy nếu website thực sự bị dính án phạt Google Penguin thì làm sao để khôi phục, thoát khỏi google penguin đây?

Disavow tool được xem như là điều mà những người làm SEO có thể áp dụng để xử lý khi bị Google phạt. Và điều này vẫn không thay đổi khi sự xuất hiện của Penguin được xem như một phần của thuật toán cốt lõi.

Trên thực tế, đã có nhiều nghiên cứu và giả thuyết công bố rằng các disavowing links không ảnh hưởng gì đến các thuật toán hạ cấp link-based và manual actions. Tuy nhiên lý thuyết này đã bị đại diện của Google bắn hạ công khai.

Google khuyến nghị rằng disavow tool chỉ nên được sử dụng như là phương sách cuối cùng khi xử lý các link spam. Bởi vì việc loại bỏ một link dễ hơn nhiều so với việc gửi yêu cầu xem xét lại các link tốt.

Disavow File là gì?

Disavow File là một tệp bạn gửi tới Google. Nó dùng để báo với Google hãy bỏ qua tất cả các links có trong tệp.

disavow file là gì, disavow link, disavow link bẩn
Mẫu file disavow sử dụng notepad

Hơn nữa Google sẽ khiến chúng không có bất kì tác động nào trên website của bạn. Kết quả là các links xấu sẽ không còn gây ra ảnh hưởng tiêu cực đến thứ hạng website.

Lưu ý khi disavow file

Tuy nhiên nếu bạn đưa nhầm những links chất lượng vào Disavow File của mình thì các link đó sẽ không còn tác dụng. Bạn không cần phải thêm bất kì ghi chú nào trong Disavow File của mình. Trừ khi bạn dùng chúng để tham khảo. Disavow File tốt nhất chỉ bao gồm các links.

Google sẽ không đọc bất kì ký hiệu nào bạn đã thêm vào Disavow File. Tất cả đều được xử lý tự động. Một số người cảm thấy việc ghi chú thêm các kí hiệu sẽ hiệu quả hơn. Chẳng hạn như ngày các URL được thêm vào Disavow File hay các nhận xét về nỗ lực của họ với các webmaster về việc loại bỏ các links.

Khi bạn đã tải lên Disavow File của mình, Google sẽ gửi xác nhận. Nhưng trong khi Google xử lý thì nó sẽ không được loại bỏ ngay. Vì thế bạn cũng sẽ không thể phục hồi thứ hạng của mình một cách tức thời.

Google vẫn phải ra ngoài và crawl dữ liệu của các link riêng lẻ mà bạn đưa vào Disavow File. Tuy nhiên chính Disavow File sẽ nhắc nhở Google không crawl các trang đó một cách cụ thể.

Ngoài ra, không có cách nào để xác định link đã được và chưa được loại bỏ. Google vẫn sẽ đưa các links đó vào linking report trong Google Search Console.

Nếu trước đây bạn đã gửi Disavow File tới Google, và giờ muốn gửi thêm Disavow File khác. Disavow File mới cần bao gồm các link của file cũ. Google sẽ thay file cũ bằng file mới của bạn. Bạn có thể tải một bản sao của Disavow File hiện tại trong Google Search Console.

Bạn nên loại bỏ các link ở cấp độ tên miền thay vì loại bỏ các link riêng lẻ. Sẽ có một số trường hợp bạn muốn loại bỏ các link cụ thể riêng lẽ. Chẳng hạn như trên một website lớn bao gồm các paid links chất lượng.

Nhưng đối với phần lớn các links bạn có thể loại bỏ chúng dựa trên các domain. Google chỉ cần crawl dữ liệu trên một page để link đó được loại bỏ trên website của bạn.

Thực hiện các loại bỏ dựa theo tên miền cũng có nghĩa là bạn không phải lo lắng về việc các liên kết đó được index theo www hay không có www. Việc loại bỏ link dựa theo tên miền sẽ tính tới điều này.

Nếu bạn nghi ngờ website của mình bị ảnh hưởng tiêu cực bởi Penguin. Bạn cần thực hiện kiểm toán links và xóa hay loại bỏ các links kém chất lượng và link spam.

Google Search Console cung cấp danh sách các backlinks cho chủ sở hữu website. Nhưng bạn cần lưu ý rằng nó cũng bao gồm các nofollow links.

Nếu các links được nofollow, nó sẽ không có bất kì tác động nào đến website của bạn. Nhưng hãy nhớ, website có thể xóa nofollow đó trong tương lai mà không cần cảnh báo.

thuật toán google penguin, cách disavow link
Loại bỏ các backlink bẩn là cách thức để khôi phục website sau khi bị Google Penguin phạt

Ngoài ra còn có nhiều công cụ của bên thứ ba sẽ hiển thị các link đến website của bạn. Nhưng vì một số website chặn các bot của bên thứ ba crawl dữ liệu trên web của họ. Nó sẽ không thể hiển thị các links trỏ đến web.

Một số website chặn các bot này là các trang web nổi tiếng chất lượng cao. Họ không muốn lãng phí băng thông trên các bot đó. Tuy nhiên nó cũng đang được một số web spam sử dụng để che giấu các link chất lượng thấp. Tránh việc bị report.

Giám sát các backlinks cũng là một nhiệm vụ thiết yếu. Đôi khi ngành công nghiệp mà tôi làm việc không hoàn toàn trung thực khi có các sự tấn công của negative SEO. Đó là khi một đối thủ cạnh tranh mua các link spam và trỏ chúng đến website của bạn.

Nhiều người sử dụng negative SEO như một cái cớ khi website của họ bị Google phạt vì các link chất lượng thấp. Tuy nhiên, Google đã nói rằng họ khá giỏi trong việc nhận ra điều này. Vì vậy đó không phải là điều mà hầu hết các chủ sở hữu trang web cần lo lắng.

Điều này cũng có nghĩa là chủ động sử dụng tính năng loại bỏ mà không cần dấu hiệu rõ ràng về hình phạt thuật toán hay các thông báo về manual action là một ý tưởng hay.

Tuy nhiên, có một cuộc thăm dò do SEO thực hiện vào tháng 9. Nó cho thấy 38% SEO không bao giờ từ chối các backlinks. Bạn cần xem qua profile các backlinks và xem xét kĩ lưỡng từng link domain. Đây là nhiệm vụ vô cùng quan trọng.

>> Bạn có biếtXây dựng link đa tầng là một phương pháp vô cùng hiệu quả, có khả năng giúp bạn tránh hình phạt của google không? Tôi đã có bài viết nói cụ thể về vấn đề này rồi. Bạn có thể tham khảo tại đây nhé!

Google khuyên bạn nên cố gắng liên lạc với các website và webmaster nơi bắt nguồn của các links xấu. Đồng thời yêu cầu họ xóa chúng trước khi tiến hành loại bỏ.

Một số chủ sở hữu website yêu cầu một khoản phí để loại bỏ một link. Google khuyến nghị không bao giờ trả tiền cho việc xóa liên kết. Thay vào đó, chỉ cần đưa các link đó vào Disavow File và chuyển sang bước loại bỏ tiếp theo.

Mặc dù outreach là một cách hiệu quả để khôi phục từ các hình phạt liên quan đến link nhưng không phải lúc nào cũng cần thiết. Thuật toán Google Penguin cũng tính đến toàn bộ link profile, volume của liên kết chất lượng, các links tự nhiên so với số lượng các link spam.

Mặc dù trong các trường hợp bị một phần (tác động đến các từ khóa được tối ưu hóa hay bị nhồi nhét quá mức), thuật toán vẫn có thể ảnh hưởng đến bạn. Các backlinks cần được duy trì và giám sát một cách chặt chẽ.

Nhiều người gặp khó khăn khi đánh giá chất lượng links.

Đừng cho rằng một links đến từ một website .edu thì nó sẽ có chất lượng cao.

Rất nhiều sinh viên bán các link từ các website cá nhân của họ với domain .edu. Nó cực kì spam và nên được loại bỏ. Tương tự, có rất nhiều website bị tấn công bởi các tên miền .edu có link chất lượng thấp.

google penguin, domain .edu
Link từ các edu domain chưa hẳn là tốt

Không đưa ra phán xét nghiêm ngặt dựa trên loại domain. Mặc dù bạn không thể thực hiện các giả định tự động trên các tên miền .edu. Điều tương tự cũng áp dụng cho tất cả các TLD và ccTLD.

Google xác nhận rằng chỉ cần biết cách sử dụng một TLD cụ thể. Điều đó không giúp ích hay làm tổn hại đến thứ hạng tìm kiếm. Nhưng bạn cần phải thực hiện các đánh giá cá nhân.

Có một số nhận định cho rằng chưa bao giờ có một trang chất lượng với tên miền .info. Rất nhiều spammers sử dụng chúng. Nhưng trên thực tế có một số links chất lượng tuyệt vời đến từ TLD này. Nó cho thấy lý do tại sao các kiểm tra và đánh giá cá nhân lại vô cùng quan trọng.

chất lượng link
Dựa vào đánh giá chất lượng link

Đừng đánh giá các links đến từ các website tốt là links chất lượng. Trừ khi bạn biết chắc chắn là link cụ thể đó thật sự tốt. Đừng vì bạn có một link đến từ một trang web lớn như Huffington Post hoặc BBC mà cho rằng đó là một link chất lượng cao trong mắt Google.

Nhiều website lớn cũng đang bán các links. Mặc dù một số được ngụy trang dưới dạng quảng cáo hoặc được thực hiện bởi một cộng tác viên lừa đảo bán các links trong các bài viết của họ. Các links xấu đến từ các website chất lượng cao đã được xác nhận bởi nhiều SEOers. Và vâng nó có thể góp phần vào việc website bạn bị Google Penguin phạt.

Khi nội dung quảng cáo tăng lên, chúng ta sẽ thấy ngày càng nhiều links như thế này với chất lượng thấp. Luôn luôn kiểm tra các links tới website. Đặc biệt nếu bạn đang cân nhắc việc không xóa bất kì link nào dựa trên sites mà links đến.

Cũng như việc quảng cáo, bạn cần suy nghĩ về bất kì links nào được các website chỉ ra là các links quảng cáo. Paid links không phải lúc nào cũng có nghĩa là tiền có thể đổi được links.

Ví dụ, trong mắt Google các links quảng cáo là các paid links và bất cứ links nào được đưa ra để đổi cho việc review một sản phẩm miễn phí hay giảm giá cho các sản phẩm.

link quảng cáo, link trả phí, liên kết có trả phí
Paid link không được Google đánh giá cao

Mặc dù các loại links này có thể tốt trong nhiều năm trước. Nhưng bây giờ chúng cần phải được theo dõi. Bạn vẫn sẽ nhận được giá trị của links. Nhưng thay vì nó giúp bạn xếp hạng website, nó sẽ thông qua nhận thức về thương hiệu và lượng traffic.

Bạn có thể có các links out từ một chiến dịch quảng cáo được thực hiện nhiều năm trước và hiện đang có tác động tiêu cực đến một trang web.

Vì tất cả những lí do này, điều quan trọng nhất là bạn phải đánh giá từng link. Bạn muốn xóa các links chất lượng thấp vì chúng đang tác động với Penguin hoặc có thể gây ra các manual action trong tương lai. Nhưng bạn không muốn xóa các links tốt vì đó là các links giúp bạn xếp hạng website trong bảng kết quả tìm kiếm.

Các links quảng cáo không được nofollow cũng có thể kích hoạt các manual action cho các liên kết trên cùng website đã đặt các links đó.

Khôi phục website sau Penguin cần nhiều thời gian

Đôi khi các webmasters đã cố gắng dọn sạch các link profiles. Nhưng họ vẫn không thấy lượng traffic hay thứ hạng tăng.

Có một số lý do gây ra điều này bao gồm:

  • Lượng traffic ban đầu và sự gia tăng thứ hạng trước khi có hình phạt từ thuật toán là không chính xác và ngắn hạn. Traffic này có thể đến từ các backlinks xấu.
  • Khi các links đã bị xóa, không có nỗ lực nào được thực hiện để có được các backlinks giá trị hơn.
  • Không phải tất cả các backlinks bẩn đều bị loại bỏ
  • Vấn đề tụt traffic không phải do link gây ra

Khi bạn khôi phục từ Penguin, đừng hi vọng thứ hạng của bạn sẽ quay trở lại giống như trước. Quá nhiều SEOer có niềm tin rằng họ sẽ ngay lập tức bắt đầu được xếp hạng cho các top search queries của họ sau khi được Google Penguin dỡ bỏ.

Đầu tiên, một số links mà bạn không thích có khả năng đóng góp cho việc tăng thứ hạng tạm thời. Vì vậy bạn không thể có được thứ hạng cao đó như trước đây.

Thứ hai, vì nhiều chủ sở hữu website gặp khó khăn trong việc đánh giá chất lượng links nên một số links chất lượng chắc chắn đã bị loại bỏ trong quá trình thực hiện. Thêm vào đó, Google thay đổi thuật toán xếp hạng của họ liên tục. Vì vậy các yếu tố có lợi cho bạn trước đây có thể không có tác động lớn trong thời điểm này và ngược lại.

Quan niệm sai lầm về Google Penguin

sai lầm về google penguin, quan niệm sai lầm thuật toán penguin, penguine
Những lời đồn đại về Google Penguin và quan niệm sai lầm

Ngành công nghiệp SEO và những người tham gia vào đó là một cộng đồng năng nổ và sôi động. Họ luôn có những giả thuyết và các kết quả thử nghiệm mới được công bố mỗi ngày.

Đương nhiên điều này dẫn đến một số tin đồn và quan niệm sai lầm về các thuật toán cơ bản của Google được sinh ra. Penguin cũng là một ví dụ. Dưới đây là một vài tin đồn và quan niệm sai lầm về thuật toán Google Penguin mà chúng ta đã thấy trong nhiều năm qua.

Tin đồn: Penguin là một hình phạt

Một trong những tin đồn lớn nhất về thuật toán Google Penguin là mọi người coi nó là hình phạt. Hay cái mà Google gọi là manual action. Penguin là thuật toán tự nhiên khá nghiêm ngặt. Nó không được sự nâng đỡ của Google.

Mặc dù thực tế là cả việc cập nhật thuật toán và hình phạt đều là nguyên nhân làm giảm thứ hạng của website một cách đáng kể. Tuy nhiên có một số khác biệt khá lớn giữa chúng.

Một hình phạt hoặc manual action xảy ra khi một thành viên trong nhóm webspam của Google phản hồi rằng họ đã điều tra và thấy cần phải thi hành một hình phạt trên domain. Bạn sẽ nhận được thông báo qua Google Search Console liên quan đến manual action này.

Khi bạn bị tấn công bởi một manual action, bạn phải xem lại các backlinks của mình. Sau đó gửi một Disavow cho những thứ spam trái với luật của Google. Ngoài ra bạn cũng cần gửi yêu cầu xem xét lại tới Google’s webspam team.

Nếu thành công, hình phạt đó sẽ bị hủy bỏ. Nếu không thành công nó sẽ quay lại xem xét profile backlinks của bạn. Việc hạ cấp Penguin xảy ra mà không có sự tham gia của Google team. Tất cả đều được thực hiện tự động bằng thuật toán.

Trước đây, bạn phải chờ làm mới hoặc chờ Google cập nhật thuật toán. Nhưng bây giờ Penguin chạy trong real time để việc phục hồi có thể diễn ra nhanh hơn (nếu bạn đã thực hiện đầy đủ các công việc để khắc phục)

Tin đồn: Google sẽ thông báo cho bạn nếu web bị phạt Google Penguin

Một tin đồn khác về thuật toán Google Penguin là bạn sẽ được thông báo nếu nó đã được áp dụng.

google penguin, google update
Google không thông báo đến webmaster nếu website họ bị Google Penguin phạt

Thật không may là điều này không đúng. Search Console sẽ không thông báo cho bạn rằng thứ hạng của bạn đã giảm do sự có mặt của Google Penguin.

Một lần nữa, điều này cho thấy sự khác biệt giữa thuật toán và hình phạt. Bạn sẽ được thông báo nếu bị phạt. Tuy nhiên, quá trình phục hồi từ Penguin tương tự như quá trình phục hồi từ một hình phạt.

Mặc dù chiến thuật này sẽ loại bỏ rất nhiều links xấu. Nhưng nó hoàn toàn tốn thời gian và gây lãng phí tài nguyên.

Google Penguin xem xét tỷ lệ phần trăm giữa các links tốt so với các links có tính chất spam.

Vì vậy, thay vì tập trung vào việc xóa thủ công các links chất lượng thấp. Bạn nên tập trung vào việc tăng số lượng links tốt cho website. Điều này sẽ tác động tốt hơn đến tỷ lệ phần trăm mà Penguin xem xét.

Tin đồn: Bạn không thể khôi phục từ Penguin

Có, bạn có thể khôi phục từ Google Penguin. Có thể nhưng nó sẽ đòi hỏi một số kinh nghiệm trong việc xử lý bản chất hay thay đổi của các thuật toán của Google.

Cách tốt nhất để rũ bỏ các tác động tiêu cực của thuật toán Google Penguin là quên tất cả các links hiện có trên website của bạn. Sau đó bắt đầu thu thập các links chất lượng mới.

Bạn càng có được nhiều links chất lượng bạn sẽ càng dễ dàng kiểm soát website của mình thoát khỏi sự kìm kẹp của Penguin.

Phần kết

Bài viết trên đây là những thông tin đầy đủ về thuật toán Google Penguin mà tôi muốn chia sẻ với bạn. Nếu có bất kì thắc mắc hay bổ sung gì hãy comment cho tôi biết nhé!

có thể bạn quan tâm

Posted

in

by