TopDev

PHÂN TÍCH TÌNH TRẠNG INDEX & TOÁN TỬ TÌM KIẾM

seoyttop 📖 5 phút đọc

Dạo này nhiều anh em thắc mắc về vấn đề gõ site:url thấy nhưng khi kiểm tra title lại không thấy, hoặc gõ site:url thấy nhưng công cụ báo không index,... và dĩ nhiên, điểm chung của tất cả là đều mất TOP.

Khi nói về các giai đoạn Google thu thập dữ liệu và lập chỉ mục, mình thường dùng các ví dụ minh họa sau cho khách "low tech". Hãy nghĩ rằng việc tất cả anh em viết content như đang tham gia một cuộc thi lớn, mà Google chính là ban giám khảo nhận bài thi và chấm điểm. Bây giờ:

  • Lúc bạn làm bài thi = lúc bạn viết content.

  • Không cần submit mà Google vẫn thu thập và lập chỉ mục = BGK tự đi thu bài.

  • Bạn submit = bạn nộp bài cho BGK.

  • BGK thu nhận và đọc bài = thu thập dữ liệu.

  • BGK chấm bài của bạn và cho điểm = thu thập, lập chỉ mục và xếp hạng (kể cả ngoài 100 vẫn là xếp hạng).

  • BGK nhận bài, đọc bài nhưng không chấm, đem cất vào tủ = vẫn thu thập, vẫn index nhưng tìm không thấy bài.

  • BGK đã thu thập, đã chấm điểm nhưng trả bài rồi thu lại bài và đem cất = đã thu thập, lập chỉ mục và xếp hạng nhưng sau đó thu hồi lại và đem cất vào tủ (bạn và người dùng tìm không ra). Anh em cũng đang gặp trường hợp này.

Nói chung, ví dụ vậy để dễ hình dung. Mình hay tư vấn khách kiểu đó để họ dễ hiểu thay vì dùng thuật ngữ chuyên ngành mà họ nghe như vịt nghe sấm.

Cách kiểm tra tình trạng index#

Để kiểm tra tình trạng index, có nhiều cách, nhưng trước đây đa phần anh em sẽ check kiểu site:url hoặc sử dụng công cụ check index hoặc Google Search Console để kiểm tra.

Toán tử site:url thường dùng nhiều nhất cho domain chính, để xem giới hạn kết quả trả về từ một trang web cụ thể. Hiện nay, cách kiểm tra của các công cụ check index hay ép index trên thị trường chủ yếu là bỏ URL lên Google search và tìm kiếm. Nếu xuất hiện thì đã index, không thì là noindex (không phải site:url).

Cách kiểm tra Google thu thập dữ liệu và lập chỉ mục#

Dưới đây là 5 cách mình thường sử dụng:

  • site:url trên Google search.

  • "url" trên Google search.

  • Gõ URL trên Google search.

  • "title" hoặc allintitle:"title" trên Google search.

  • Copy một đoạn văn trong bài viết đó rồi tìm nó trên Google, hoặc sử dụng công cụ check đạo văn để xem Google có thu thập đoạn văn đó hay không.

Với một URL đang bình thường, dùng cả 5 cách trên sẽ đều trả về kết quả có mặt của website bạn. Những URL đang có TOP thì càng ra kết quả đầu tiên và chính xác. Tuy nhiên, nếu thấy một trong 5 cách trên có lúc URL xuất hiện, có lúc không thấy, thì URL đó sẽ không còn TOP (nếu trước đó có TOP thì giờ cũng đã mất).

Minh họa bằng hình ảnh#

  • Hình 1: Kiểm tra "url" còn xuất hiện.

  • Hình 2: Kiểm tra site:url còn xuất hiện.

  • Hình 3: Kiểm tra gõ URL thì mất tích.

  • Hình 4:allintitle:"tiêu đề" cũng mất tích.

  • Hình 5:site:url + từ khóa thì xuất hiện.

  • Hình 6: Kiểm tra đạo văn thì Google đã bỏ thu thập một số đoạn (có chữ độc đáo, tức là nó ghi nhận đoạn đó chưa web nào viết, bao gồm cả web mình).

  • Hình 7: Copy thử một đoạn mà check ra "độc đáo" và search nó trên Google thì không xuất hiện.

  • Hình 8: Copy thử một đoạn check đạo văn ra "trùng lặp" với domain mình, thì dĩ nhiên nó xuất hiện và đúng đoạn đó in đậm.

Bạn thấy đấy, việc mình bị mất TOP ở bài đó là do sau khi sửa lại một chút nội dung và submit lại ở Google, bài viết đã bị Google cho ra đảo. Có thể ít bữa nó sẽ về lại, mình đã theo dõi nhiều bài như thế và thấy nó quay lại.

Nguyên nhân Google cho bài mất TOP là do thu thập dữ liệu không đủ nội dung website. Nếu kiểm tra cả 5 cách mà lúc có lúc không thì từ khóa chưa thể về.

Cách giải quyết#

Hiện tại mình đang làm như sau:

  • Viết lại những đoạn văn bị đưa vào "độc đáo". Cố gắng cái nào dài thì dài, rút gọn ngắn bớt thì ngắn. Có thể dùng Google Cloud Natural Language để kiểm tra điểm sentiment level hoặc dùng Hemingway App để check quy tắc Hemingway (chỉ tương đối vì tool nước ngoài dùng kiểm tra tiếng Việt thường không chính xác).

  • Cố gắng làm sao cho Google thu thập lại dữ liệu của bài viết: submit lại URL (ít tác dụng), tăng tín hiệu người dùng truy cập URL đó, chạy ads, sử dụng thêm internal link, backlink...

  • Chờ đợi và hy vọng bài viết sẽ về lại TOP.

Kết luận#

Bài viết này chỉ nhằm giúp mọi người dễ hình dung và giảm thắc mắc chứ mình chưa có giải pháp cụ thể. Dù đã áp dụng một số cách và có kết quả, nhưng chưa phải là công thức nên không thể chia sẻ. Nhiều dự án bên mình trước đó bị mất 25-40% traffic, nhưng nay đang bắt đầu quay lại mốc trước khi Google update.

Về toán tử tìm kiếm, có thể dùng thêm:

  • related: (tìm từ cụm từ liên quan).

  • inurl: hoặc allinurl: (tìm từ hay cụm từ chứa trong URL).

  • intext: hoặc allintext: (tìm từ hay cụm từ trong nội dung).

  • cache: (xem cache của URL đó).

  • intitle: hoặc allintitle: (tìm tiêu đề).

Nói về toán tử tìm kiếm thì có rất nhiều, nhưng chỉ cần quan tâm đến chục cái toán tử như trên là đủ.

Làm SEO thì cần nghiên cứu, thử nghiệm để tự tìm ra giải pháp và có kinh nghiệm. Không phải cái gì cũng áp dụng kiểu step-by-step là xong.

Chúc anh em "tay cứng web mềm" và cuối tuần vui vẻ!

Bài liên quan trong #SEO

✓ Đã sao chép link