9 bước xử lý “Crawled – currently not indexed” trong Google Search Console

Nội dung chính

Xử lý nhanh chóng lỗi Crawled – currently not indexed trong Google Search Console

Trạng thái Crawled – currently not indexed trong Google Search Console là vấn đề phổ biến mà quản trị viên web gặp phải. Nó cho biết rằng Googlebot đã thu thập dữ liệu thành công một trang cụ thể trên trang web của bạn nhưng trang này chưa được lập chỉ mục trong kết quả tìm kiếm của Google, điều này có thể ảnh hưởng trong quá trình SEO website của bạn. Dưới đây là một số bước có thể thực hiện được để giải quyết vấn đề này và cải thiện khả năng các trang của bạn được Google lập chỉ mục:

  • Bước 1: Tìm kiếm nhãn “Crawled – currently not indexed” trong Google Search Console
  • Bước 2: Sử dụng Công cụ kiểm tra URL “Inspect URL” các trang bị ảnh hưởng
  • Bước 3: Xem xét và cải thiện chất lượng nội dung
  • Bước 4: Kiểm tra và khắc phục các vấn đề kỹ thuật, tối ưu hóa liên kết nội bộ
  • Bước 5: Nâng cao cấu trúc trang web và tốc độ tải trang
  • Bước 6: Đảm bảo sự ổn định của máy chủ
  • Bước 7: Theo dõi ngân sách thu thập thông tin
  • Bước 8: Giải quyết các yếu tố liên kết ngược
  • Bước 9: Yêu cầu lập chỉ mục các trang Crawled – currently not indexed trong Google Search Console

Sau khi thực hiện các bước trên, hãy liên tục theo dõi hiệu suất trang web của bạn trong Google Search Console. Thường xuyên kiểm tra để biết bất kỳ trường hợp mới nào về trạng thái “Crawled – currently not indexed” và giải quyết chúng kịp thời.

Các bước xử lý lỗi Crawled - currently not indexed
Các bước xử lý lỗi Crawled – currently not indexed

Tìm hiểu nguyên nhân, ảnh hưởng và cách khắc phục lỗi Crawled – currently not indexed

Những nguyên nhân gây ra lỗi Crawled – currently not indexed

Crawled – currently not indexed Google Search Console cho biết Googlebot đã thu thập dữ liệu thành công một trang cụ thể trên trang web của bạn nhưng đã quyết định không đưa trang đó vào chỉ mục tìm kiếm. Dưới đây là những nguyên nhân phổ biến gây ra lỗi Crawled – currently not indexed:

Nội dung chất lượng thấp

  • Nội dung mỏng: Các trang có nội dung không đầy đủ, chẳng hạn như những trang có rất ít nội dung hoặc thông tin tối thiểu, thường không được lập chỉ mục. Google ưu tiên các trang cung cấp giá trị đầy đủ cho người dùng.
  • Nội dung trùng lặp: Các trang có nội dung tương tự hoặc giống hệt với các trang khác trên trang web của bạn có thể bị gắn cờ là nội dung trùng lặp. Google có thể chọn chỉ lập chỉ mục trang gốc hoặc trang có liên quan nhất.
  • Chất lượng nội dung kém: Các trang có nội dung chất lượng thấp, chẳng hạn như những trang có quá nhiều lỗi ngữ pháp, khả năng đọc kém hoặc nội dung không đáp ứng được mục đích của người dùng, có thể không được lập chỉ mục.

Vấn đề về kỹ thuật

  • Thẻ chuẩn: Việc sử dụng thẻ chuẩn không chính xác có thể báo hiệu cho Google rằng các trang tương tự không nên được lập chỉ mục. Ví dụ: nếu nhiều trang trỏ đến một URL chuẩn, Google có thể quyết định chỉ lập chỉ mục phiên bản chuẩn.
  • Thẻ meta: Thẻ meta “noindex” trên trang sẽ hướng dẫn rõ ràng Google không lập chỉ mục trang. Đôi khi, các thẻ này được thêm vào một cách vô tình trong quá trình phát triển hoặc cập nhật trang web.
  • Tài nguyên bị chặn: Nếu các tài nguyên quan trọng như CSS, JavaScript hoặc hình ảnh bị chặn thu thập dữ liệu, điều đó có thể ảnh hưởng đến cách Googlebot diễn giải và lập chỉ mục trang.

Liên kết nội bộ không đầy đủ

  • Các trang không có liên kết nội bộ trỏ đến chúng sẽ khó tìm và lập chỉ mục hơn cho Googlebot. Google dựa vào các liên kết nội bộ để khám phá và đánh giá tầm quan trọng của các trang trong trang web của bạn.
  • Một trang web có cấu trúc kém có thể cản trở khả năng thu thập dữ liệu và lập chỉ mục các trang của Googlebot một cách hiệu quả. Các trang nằm sâu trong hệ thống phân cấp trang web có thể không được ưu tiên lập chỉ mục.
Những vấn đề gây nên lỗi Crawled - currently not indexed
Những vấn đề gây nên lỗi Crawled – currently not indexed

Sự cố máy chủ

  • Thời gian tải chậm: Các trang tải rất chậm có thể không được lập chỉ mục do Googlebot gặp phải thời gian chờ. Google ưu tiên lập chỉ mục các trang tải nhanh và cung cấp trải nghiệm tốt cho người dùng.
  • Lỗi máy chủ: Các sự cố máy chủ không liên tục, chẳng hạn như lỗi Server error (5xx), có thể khiến các trang không được thu thập thông tin và lập chỉ mục đúng cách.

1.5 Giới hạn ngân sách thu thập dữ liệu và thiếu liên kết

  • Trang web lớn: Các trang web rất lớn có thể vượt quá ngân sách thu thập dữ liệu, khiến một số trang được thu thập dữ liệu nhưng không được lập chỉ mục. Ngân sách thu thập dữ liệu là số trang Googlebot sẽ thu thập dữ liệu trên trang web của bạn trong một khung thời gian nhất định.
  • Cập nhật thường xuyên: Các trang web được cập nhật thường xuyên hoặc có lượng nội dung mới lớn có thể có các trang được thu thập thông tin nhưng không được lập chỉ mục ngay lập tức do được ưu tiên.
  • Thiếu liên kết ngược: Các trang không có bất kỳ liên kết ngược nào từ các trang web bên ngoài có thể bị Google coi là kém giá trị hoặc ít có thẩm quyền hơn, dẫn đến việc chúng không được lập chỉ mục.

Đó là một số yếu tố có thể dẫn đến tình trạng lỗi Crawled – currently not indexed, mỗi yếu tố ảnh hưởng đến quá trình lập chỉ mục theo những cách khác nhau. Hiểu những nguyên nhân này là rất quan trọng để chẩn đoán và giải quyết vấn đề.

Lỗi Crawled – currently not indexed ảnh hưởng như thế nào đến website?

Lỗi Crawled – currently not indexed trong Google Search Console có thể ảnh hưởng đáng kể đến hiệu suất và khả năng hiển thị của trang web. Trạng thái này cho biết rằng Google đã thu thập dữ liệu một trang nhưng chưa thêm trang đó vào chỉ mục tìm kiếm của mình, nghĩa là trang đó sẽ không xuất hiện trong kết quả tìm kiếm. Dưới đây là một số tác động chính mà lỗi này có thể gây ra trên một trang web:

Lỗi Crawled – currently not indexed làm giảm khả năng hiển thị khi tìm kiếm

  • Mất lưu lượng truy cập: Các trang không được Google lập chỉ mục không thể xuất hiện trong kết quả tìm kiếm, dẫn đến mất trực tiếp lưu lượng tìm kiếm không phải trả tiền. Điều này có thể đặc biệt bất lợi đối với các trang nhằm thu hút khách truy cập hoặc khách hàng mới.
  • Khả năng khám phá giảm: Nếu các trang quan trọng không được lập chỉ mục, người dùng tìm kiếm từ khóa có liên quan sẽ không tìm thấy nội dung của bạn, làm giảm khả năng khám phá tổng thể trang web của bạn.

Lỗi Crawled – currently not indexed có tác động tiêu cực đến SEO

  • Tiềm năng xếp hạng thấp hơn: Các trang chưa được lập chỉ mục không đóng góp gì vào tiềm năng xếp hạng tổng thể của trang web của bạn. Các trang không được lập chỉ mục không thể chuyển bất kỳ giá trị liên kết nào mà chúng có thể nhận được, điều này có thể ảnh hưởng đến thứ hạng của các trang khác trên trang web của bạn.
  • Ngân sách thu thập dữ liệu bị lãng phí: Khi Googlebot dành thời gian thu thập dữ liệu các trang không được lập chỉ mục, điều đó có thể lãng phí ngân sách thu thập dữ liệu của bạn, điều này đặc biệt quan trọng đối với các trang web lớn. Điều này có nghĩa là ít trang quan trọng hơn có thể được thu thập thông tin và lập chỉ mục trong cùng một khung thời gian.
Crawled - currently not indexed có nhiều tác động tiêu cực đến website
Crawled – currently not indexed có nhiều tác động tiêu cực đến website

Lỗi Crawled – currently not indexed tác động đến trải nghiệm người dùng

  • Cung cấp nội dung chưa hoàn chỉnh: Nếu các trang quan trọng như trang sản phẩm, mô tả dịch vụ hoặc bài đăng blog giàu thông tin không được lập chỉ mục, người dùng có thể bỏ lỡ nội dung có giá trị có thể giúp họ đưa ra quyết định sáng suốt.
  • Sự tin cậy và tương tác của người dùng: Một trang web bị thiếu trang trong kết quả tìm kiếm có thể có độ tin cậy hoặc toàn diện kém hơn, có khả năng ảnh hưởng đến niềm tin và mức độ tương tác của người dùng.

Lỗi Crawled – currently not indexed ảnh hưởng đến doanh thu

  • Mất khách hàng tiềm năng: Các trang tạo ra khách hàng tiềm năng hoặc doanh số bán hàng rất quan trọng cho sự phát triển của doanh nghiệp. Nếu các trang này không được lập chỉ mục, tiềm năng thu hút khách hàng tiềm năng và chuyển đổi thông qua tìm kiếm không phải trả tiền sẽ giảm đi.
  • Tác động đến doanh thu: Các trang web thương mại điện tử hoặc doanh nghiệp phụ thuộc nhiều vào lưu lượng truy cập không phải trả tiền để bán hàng có thể sẽ bị giảm doanh thu nếu các trang sản phẩm hoặc dịch vụ chính không được lập chỉ mục.

Lỗi Crawled – currently not indexed ảnh hưởng đến danh tiếng thương hiệu

  • Nhận thấy là thiếu thẩm quyền: Một trang web có nội dung quan trọng nhưng không được lập chỉ mục có thể bị coi là ít có thẩm quyền hoặc ít liên quan hơn trong lĩnh vực của nó, ảnh hưởng đến danh tiếng thương hiệu.
  • Giảm lợi thế cạnh tranh: Đối thủ cạnh tranh có các trang được lập chỉ mục đầy đủ và hiển thị sẽ có lợi thế hơn trang web của bạn trong việc thu hút lưu lượng truy cập không phải trả tiền và khách hàng tiềm năng.

Crawled – currently not indexed ảnh hưởng việc theo dõi và phân tích hiệu suất

  • Dữ liệu chưa đầy đủ: Các trang không được lập chỉ mục không đóng góp vào số liệu hiệu suất tìm kiếm. Điều này có thể dẫn đến dữ liệu phân tích không đầy đủ, khiến việc đo lường tác động thực sự của nội dung và nỗ lực SEO website của bạn trở nên khó khăn hơn.
  • Chỉ số hiệu suất gây hiểu lầm: Việc thiếu lập chỉ mục có thể làm sai lệch các chỉ số hiệu suất, khiến việc đánh giá chính xác hiệu quả của chiến lược SEO của bạn trở nên khó khăn.
Crawled - currently not indexed cho biết các có thể các trang quan trọng không được index
Crawled – currently not indexed cho biết các có thể các trang quan trọng không được index

Hướng dẫn từng bước để giải quyết lỗi Crawled – currently not indexed

Xác định URL bị ảnh hưởng bởi Crawled – currently not indexed

  • Truy cập vào Google Search Console
  • Điều hướng đến mục “Page” trong vùng “Indexing”
  • Tìm kiếm nhãn “Crawled – currently not indexed”, tại đây sẽ thấy được các URL bị ảnh hưởng

Sử dụng Công cụ kiểm tra URL

  • Kiểm tra URL: Trong Google Search Console, hãy sử dụng công cụ Kiểm tra URL để kiểm tra trạng thái của các trang bị ảnh hưởng bởi Crawled – currently not indexed. Công cụ này cung cấp thông tin chi tiết về cách Google nhìn thấy trang này.
  • Yêu cầu lập chỉ mục: Nếu URL hợp lệ và không hiển thị bất kỳ vấn đề rõ ràng nào, hãy nhấp vào nút “Yêu cầu lập chỉ mục” để yêu cầu Google thu thập dữ liệu lại và lập chỉ mục trang.
Sử dụng công cụ kiểm tra URL để biết được lý do URL không được index
Sử dụng công cụ kiểm tra URL để biết được lý do URL không được index

Xem xét và cải thiện chất lượng nội dung

  • Nâng cao nội dung: Đảm bảo trang cung cấp nội dung độc đáo, có giá trị và toàn diện. Nội dung mỏng hoặc trùng lặp thường là nguyên nhân không được lập chỉ mục.
  • Thêm đa phương tiện: Kết hợp hình ảnh, video và các yếu tố đa phương tiện khác để làm cho trang trở nên hấp dẫn và có giá trị hơn đối với người dùng.

Kiểm tra các vấn đề kỹ thuật và liên kết nội bộ

  • Thẻ Meta: Đảm bảo không có thẻ meta “noindex” trên trang. Bạn có thể làm điều này bằng cách xem nguồn trang hoặc sử dụng công cụ SEO.
  • Canonical tag: Xác minh rằng thẻ chuẩn được đặt chính xác và trỏ đến đúng phiên bản của trang.
  • Blocked by robot.txt: Đảm bảo rằng các tài nguyên quan trọng (CSS, JavaScript, hình ảnh) không bị robots.txt chặn.
  • Thêm liên kết nội bộ: Đảm bảo trang bị ảnh hưởng được liên kết tốt trong trang web của bạn. Bao gồm các liên kết đến trang này từ các trang có thẩm quyền và có liên quan khác trên trang web của bạn.

Nâng cao cấu trúc trang web và tốc độ tải trang

  • Cải thiện điều hướng: Đảm bảo trang web của bạn có cấu trúc hợp lý và phân cấp giúp Googlebot dễ dàng thu thập dữ liệu.
  • Gửi sơ đồ trang web: Đảm bảo sơ đồ trang web XML của bạn được cập nhật và gửi trong Google Search Console. Bao gồm các trang bị ảnh hưởng trong sơ đồ trang web.
  • Tối ưu hóa hiệu suất: Sử dụng các công cụ như Google PageSpeed ​​Insights để xác định và khắc phục các vấn đề về hiệu suất có thể làm chậm thời gian tải trang.
  • Giảm thời gian tải: Nén hình ảnh, giảm thiểu JavaScript và tận dụng bộ nhớ đệm của trình duyệt để cải thiện tốc độ trang.

Kiểm tra nhật ký và hiệu suất máy chủ

  • Theo dõi nhật ký máy chủ: Tìm kiếm bất kỳ lỗi máy chủ nào (lỗi 5xx) có thể ngăn Googlebot thu thập dữ liệu trang đúng cách.
  • Đảm bảo tính ổn định của máy chủ: Sử dụng nhà cung cấp dịch vụ lưu trữ đáng tin cậy để giảm thiểu thời gian ngừng hoạt động và lỗi máy chủ.

Tối ưu hóa ngân sách thu thập dữ liệu

  • Ưu tiên các trang quan trọng: Đảm bảo rằng các trang quan trọng nhất được ưu tiên trong ngân sách thu thập dữ liệu của bạn. Thường xuyên cập nhật và gửi sơ đồ trang web để giúp Googlebot tìm thấy các trang của bạn.
  • Giảm nội dung trùng lặp: Giảm thiểu nội dung trùng lặp để tận dụng ngân sách thu thập dữ liệu của bạn tốt hơn.

Thực hiện các hành động về liên kết ngược

  • Liên kết ngược: Khuyến khích liên kết ngược từ các trang uy tín đến trang bị ảnh hưởng. Các liên kết bên ngoài có thể giúp báo hiệu cho Google rằng trang này có giá trị.
  • Chia sẻ trên mạng xã hội: Quảng cáo trang trên các trang mạng xã hội để tăng lưu lượng truy cập và mức độ tương tác, điều này có thể ảnh hưởng gián tiếp đến việc lập chỉ mục.

Yêu cầu index trong Google Search Console

  • Tìm URL mà bạn muốn yêu cầu index lại
  • Nhấp vào Kiểm tra URL và sau đó chọn biểu tượng “Yêu cầu index lại” (Request indexing)
  • Nhấp vào nút “Gửi” (Submit) để gửi yêu cầu Index cho URL mong muốn
Sau khi giải quyết các vấn đề cần yêu cầu lập chỉ mục URL
Sau khi giải quyết các vấn đề cần yêu cầu lập chỉ mục URL

Kết luận

Việc giải quyết lỗi “Crawled – currently not indexed” bao gồm sự kết hợp giữa tối ưu hóa kỹ thuật, nâng cao nội dung và giám sát thường xuyên. Bằng cách làm theo các bước được nêu ở trên, bạn có thể nhanh chóng giải quyết các vấn đề tiềm ẩn và cải thiện khả năng các trang của bạn được Google lập chỉ mục, từ đó nâng cao khả năng hiển thị và hiệu suất của trang web của bạn trong kết quả tìm kiếm. Kiểm tra thường xuyên và quản lý SEO chủ động là điều cần thiết để duy trì một trang web lành mạnh và có thể lập chỉ mục.

Verified Kiểm duyệt nội dung bởi

Bài viết liên quan

Gửi thông tin thành công
Cảm ơn bạn đã để lại thông tin. SEOoneclick sẽ liên lạc bạn trong thời gian sớm nhất.