13 thực tiễn tốt nhất để tối ưu sitemaps XML

Sitemaps XML – dạng sơ đồ trang web, là một phần quan trọng trong việc tối ưu hóa bất kỳ website nào.

Sitemaps XML được biết đến với mục đích cung cấp thông tin chi tiết cho công cụ tìm kiếm thu thập và index site nhanh hơn.

Ngoài ra, sơ đồ này còn cho chúng ta nhiều dữ liệu có giá trị như:

  • + Tần suất mỗi trang được cập nhật
  • + Thay đổi lần cuối
  • + Các trang quan trọng có liên quan với nhau như thế nào?
Sitemaps XML sẽ hỗ trợ trang của bạn được Google index nhanh hơn.

Vậy nên, sơ đồ trang đặc biệt quan trọng với website. Tìm ra cách tối ưu chúng là việc nên làm. Bài viết này sẽ đưa ra 13 thực tiễn tốt nhất nhằm tối ưu sitemaps XML.

1. Sử dụng công cụ và plugin để tự động tạo sơ đồ trang

Tạo sơ đồ trang web rất dễ dàng khi có công cụ phù hợp. Chẳng hạn là phần mềm xây dựng XML Sitemap hoặc plugin phổ biến như Google XML Sitemaps.

Trên thực tế, các trang WordPress đã sử dụng Yoast SEO có thể cho phép tạo sơ đồ trang web XML trực tiếp trong plugin.

Bạn cũng có thể tạo sơ đồ trang theo cấu trúc mã trang web XML. Về mặt kỹ thuật, sơ đồ trang web của bạn thậm chí không cần phải ở định dạng XML. Tuy nhiên, cần thiết phải tạo một sơ đồ trang XML hoàn chỉnh nếu muốn thực hiện thuộc tính hreflang. Dó đó, hãy nhờ đến công cụ ngay thôi.

Truy cập trang chính thức của Google và Bing để biết thêm thông tin về cách thiết lập sơ đồ trang web theo cách thủ công.

2. Submit sơ đồ trang của bạn đến Google

Bạn có thể gửi sơ đồ website của mình tới Google Search Console. Từ trang tổng quan (dashboard), click Crawl > Sitemaps > Add Test Sitemap.

Nhớ kiểm tra lại sơ đồ trang và xem kết quả trước khi nhấp vào submit để kiểm ra lỗi có thể khiến quá trình lập chỉ mục bị ngăn cản. Lý tưởng nhất là nhận được số trang lập chỉ mục bằng với số trang được gửi.

Lưu ý: Bạn thường chọn trang chất lượng cao để gửi đi, nhưng Google không đảm bảo tất cả chúng sẽ được lập chỉ mục.

Nhưng cứ gửi đi vì sẽ có lợi ích đấy:

  • + Giúp Google hiểu cách trình bày trang
  • + Khám phá các lỗi và sửa chữa chúng, đảm bảo đúng cách để Google lập chỉ mục lần sau.

3. Ưu tiên các trang chất lượng cao trong sơ đồ trang

Chất lượng trang web tổng thể là yếu tố quan trọng trong xếp hạng. Nếu sơ đồ trang dẫn đến nhiều trang chất lượng thấp, Google sẽ xem đây không phải là nơi khách truy cập muốn ghé xem. Các trang lý tưởng là:

  • + Đã tối ưu cao
  • + Bao gồm hình ảnh và video
  • + Nội dung độc đáo, hấp dẫn
  • + Nhiều đánh giá và nhận xét

4. Phân lập các vấn đề lập chỉ mục

Nếu bạn gửi đi 2000 trang và chỉ có 1500 trang được lập chỉ mục. 500 trang còn lại bạn không biết có vấn đề gì?

Điều này thường xảy ra với các trang thương mại điện tử vì nhiều sản phẩm có mô tả giống nhau.

Và các chuyên gia SEO khuyên bạn nên cô lập các vấn đề này ra. Khi cô lập, nếu không được index bạn sẽ nhanh chóng và dễ dàng xác định nguyên nhân. Sau đó tiến hành sửa lỗi, không làm ảnh hưởng đến chất lượng trang tổng thể.

5. Chỉ bao gồm phiên bản URLs Canonical trong sitemap

Khi có nhiều trang giống nhau, ví dụ sản phẩm A có 5 màu, bạn nên sử dụng thẻ “link rel=canonical” để cho Google biết trang nào là chính, họ nên thu thập và lập chỉ mục.

6. Sử dụng Robots Meta Tag trên Robots.txt bất cứ khi nào có thể

Khi không muốn index cho một trang nào đó, bạn thường sử dụng thẻ meta robots “noindex,follow”. Điều này ngăn không cho Google index nhưng vẫn giữ nguyên giá trị của link. Nó đặc biệt hữu ích cho các trang tiện ích của website, trang không kém phần quan trọng nhưng không hiển thị trong kết quả tìm kiếm.

7. Không bao gồm các URL noindex trong sitemaps.

Bạn không thể gửi đi các URL noindex để Google index. Đây rõ ràng là điều thiếu nhất quán, một sai lầm vẫn thường gặp.

8. Tạo sitemaps XML động cho các trang lớn

Gần như không thể theo dõi kịp tất cả robot meta trên một trang web không lồ. Thay vào đó, bạn nên thiết lập quy tắc xác định một trang có bao nhiêu index, hoặc có thay đổi từ noindex sang index bằng sitemaps XML động cho các trang lớn.

9. Sử dụng XML Sitemaps & nguồn cấp dữ liệu RSS/Atom

Nguồn cấp dữ liệu RSS / Atom thông báo cho các công cụ tìm kiếm khi bạn cập nhật trang hoặc thêm nội dung mới vào trang web của bạn.

Google khuyến cáo sử dụng cả sơ đồ trang web và nguồn cấp dữ liệu RSS / Atom để giúp các công cụ tìm kiếm hiểu trang nào nên được lập chỉ mục và cập nhật.

Bằng cách chỉ đưa nội dung cập nhật gần đây trong nguồn cấp dữ liệu RSS / Atom của bạn, bạn sẽ tìm thấy nội dung được cập nhật mới dễ dàng hơn cho cả công cụ tìm kiếm và khách truy cập.

10. Chỉ cập nhật sửa đổi khi có sự thay đổi đáng kể

Đừng cố lừa công cụ tìm kiếm bằng cách cập nhật thời gian sửa đổi nhưng không có bất kỳ thay đổi đáng kể nào cho trang của bạn. Google sẽ nhanh chóng thâu tóm và biết ngay việc cập nhật liên tục mà không cung cấp thêm giá trị mới.

11. Đừng lo lắng quá nhiều về các cài đặt ưu tiên

Một số sitemaps có cột “Ưu tiên” , no cho công cụ tìm kiếm thấy trang nào là quan trọng nhất.

Cho dù tính năng này thực sự hoạt động nhưng vẫn có nhiều tranh luận. Đầu năm ngoái, Gary Illyes của Google đã viết trên tweet rằng Googlebot bỏ qua cài đặt ưu tiên trong khi thu thập dữ liệu.

12. Giữ kích thước file nhẹ nhất có thể

File sitemaps nhẹ giúp bạn bớt căng thẳng khi đặt nó lên máy chủ. Google và Bing đều tăng kích thước các file sitemaps từ 10 MB lên 50 MB vào năm 2016, nhưng giữ file càng nhẹ càng tốt nhất và nên ưu tiên cho các trang đích chính của site.

13. Tạo ra nhiều Sitemaps nếu site có hơn 50,000 URL

Bạn được giới hạn tối đa 50.000 URL cho mỗi sơ đồ trang web. Số lượng như thế đã đủ cho đa số các website. Tuy nhiên, vẫn có một số web về thường mại điện tử vượt mức URL đó. Nếu vậy, bạn phải tạo một sơ đồ bổ sung nhé.

GOBRANDING – Công ty SEO được đầu tư từ Nhật Bản đầu tiên tại Việt Nam

Nhận tư vấn
phát triển website với SEO

 

 

Xem thêm:

Cách tốt nhất để Google index trang của bạn nhanh hơn

3 cách để so sánh nhanh website của bạn với đối thủ