Sitemap là gì? 3 hình thức Sitemap phổ biến

Sitemap là tập hợp tất cả các trang, nội dung, hình ảnh,… của một website. Sitemap phục vụ cho nhiều mục đích khác nhau, từ điều hướng khách hàng cho đến làm việc với công cụ tìm kiếm.

Có bao giờ bạn tìm đọc một quyển sách và phát hiện ra nó không có mục lục không? Hẳn là rất hiếm. Gần như tất cả các quyển sách đều có mục lục, có thể ở đầu, có thể ở cuối, nhưng phải có. Vai trò của mục lục rất rõ ràng, đôi khi là hiển nhiên đến mức khiến chúng ta bỏ qua nó.

Mục lục cung cấp một hệ thống tất cả những gì có trong quyển sách và trình tự sắp xếp của chúng. Đầu tiên là chương A, rồi đến chương B, sau đó là chương C,… cứ thế cho đến chương cuối cùng của tác phẩm. Điều này giúp người đọc dễ dàng tìm được thông tin cần thiết và nắm được mạch nội dung, từ đó có trải nghiệm đọc tốt hơn.

Câu chuyện tương tự cũng áp dụng đối với Sitemap. Giống như mục lục, Sitemap đóng vai trò như một công cụ định hướng, giúp người dùng (và Google) nắm được cấu trúc của Website, qua đó có trải nghiệm tốt hơn với website.

Nhưng cụ thể Sitemap là gì, tại sao nó quan trọng và có bao nhiêu loại Sitemap mà chúng ta cần biết? Đó sẽ là chủ đề của bài chia sẻ lần này.

Sitemap

Đội ngũ thiết kế website tại Vũ Digital đang thảo luận sitemap (ảnh:vudigital.co)

Bài viết không chỉ dành cho những UI/UX Designer, người làm SEO hay sinh viên chuyên ngành thiết kế, marketing,… Đội ngũ Vũ Digital cũng muốn chia sẻ kiến thức này đến những bạn đọc mà chúng tôi gọi vui là không-phải-dân-công-nghệ.

Bạn có thể là một chủ thương hiệu mới bắt đầu kinh doanh, một marketer muốn biết thêm về thiết kế web, hoặc chỉ đơn giản là một người yêu thích việc tìm hiểu tri thức. Nhưng Vũ tin rằng, kiến thức về Sitemap sẽ giúp bạn hiểu về cách mà những trang web được tạo ra, từ đó sẽ hỗ trợ phần nào cho công việc trong tương lai. Biết đâu một ngày nào đó bạn sẽ muốn xây dựng website riêng và cần đến nội dung này.

Khoan nói về những thứ nghe “có vẻ chuyên môn” như SEO hay khai báo Google, chúng ta sẽ tìm hiểu Sitemap từ các khái niệm cơ bản nhất.

Hiểu cách Google hoạt động

Trước khi giải thích Sitemap là gì, Vũ muốn tóm tắt cách mà công cụ tìm kiếm gợi ý kết quả cho người dùng khi họ search từ khóa. Cụ thể, chúng ta sẽ tìm hiểu Google – một trong những trang web phổ biến nhất thế giới. Việc hiểu Google hoạt động như thế nào sẽ giúp chúng ta hình dung được vai trò của Sitemap.

Sitemap

Hiểu cách Google hoạt động sẽ giúp chúng ta hình dung rõ hơn về vai trò của Sitemap (ảnh: PhotoMIX Company)

Để có thể đưa ra những kết quả phù hợp với nhu cầu tìm kiếm của người dùng, chẳng hạn như với từ khóa “thương hiệu”, Google sẽ thực hiện 03 bước như sau:

  • Tìm kiếm những trang web có nội dung liên quan đến “thương hiệu”
  • Lưu trữ chúng vào hệ thống dữ liệu
  • Xếp hạng trang web đó trên trang kết quả khi người dùng tìm từ khóa “thương hiệu”

Chúng ta gọi các công đoạn trên lần lượt là: Crawling – Indexing – Ranking, hay tạm dịch tiếng Việt là thu thập thông tin – lập chỉ mục – xếp hạng.

Crawling – Thu thập thông tin

Bước đầu tiên Google cần làm là tìm ra những trang nào đang tồn tại trên môi trường Internet. Google liên tục tìm kiếm các trang mới và cập nhật và thêm chúng vào danh sách của mình. Nói cách khác, không phải cứ trang web nào được đăng ký tên miền, đăng một vài mẩu tin tức là các công cụ tìm kiếm sẽ tự động biết đến sự tồn tại của nó.

Quá trình khám phá này được gọi là thu thập thông tin và Google có một công cụ chuyên tìm kiếm, thu thập dữ liệu từ các website tên là “GoogleBot”, còn được gọi bằng nhiều cái tên như “Crawler” hay “Spider”

sitemap

Crawling là từ để chỉ việc GoogleBot thu thập thông tin từ các trang web (ảnh: Moz)

GoogleBot ban đầu chỉ tìm thấy được dữ liệu từ một vài trang web, sau đó sẽ đi đến những đường dẫn khác mà các trang web đó đặt trong nội dung của mình, hay còn gọi là backlink. Ví dụ, đây là một backlink cho Google, vì link này được đặt trong nội dung của Vũ và trỏ về Google.

Một trang web có thể đặt hàng chục hoặc thậm chí hàng trăm backlink. Từ đó chúng tạo nên một hiệu ứng dây chuyền giúp GoogleBot tiếp cận được hàng tỷ trang web khác nhau, và sau đó là lưu trữ chúng trong kho dữ liệu của mình.

Indexing – Lập chi mục

Nếu Crawling là hoạt động khám phá ra những trang web, thì Indexing mô tả việc Google lưu trữ chúng vào một hệ thống dữ liệu chung (Google Database). Ta gọi công đoạn này là “Lập chỉ mục”.

sitemap

Sau khi thu thập thông tin và kiểm tra chất lượng websites, Google sẽ lưu trữ chúng vào một hệ thống dữ liệu chung (ảnh: Manuel Geissinger)

Chúng ta có thể xem nó như cách mà một thủ thư sắp xếp sách vào các kệ phù hợp trong một “thư viện” khổng lồ. Thư viện này là nơi toàn bộ các website sẽ được phân loại, sắp xếp gọn gàng, ngăn nắp. Và khi người dùng tìm kiếm nội dung, người thủ thư – tức Google – sẽ “lấy ra” những trang web phù hợp và hiện có trong “thư viện” để gửi lại cho họ. Lúc này, nó sẽ xếp những trang web theo một trật tự nhất định để người dùng lựa chọn, đó là bước Ranking.

Ranking – Xếp hạng

Google sử dụng hàng trăm thuật toán nhỏ khác nhau để xếp hạng các trang web. Các thuật toán nhỏ này cộng lại để tạo thành thứ chúng ta gọi là “thuật toán xếp hạng của Google”. Họ thường xuyên cập nhật thuật toán của mình nhằm tối ưu hóa trải nghiệm của người dùng (User Experience).

Dựa trên hành vi, từ khóa, lịch sử tìm kiếm, địa điểm và rất nhiều yếu tố khác, Google sẽ hiển thị những trang web mà nó nghĩ là phù hợp với nhu cầu của chúng ta. Đây là lúc các yếu tố xếp hạng sẽ được xem xét: tính liên quan, chất lượng nội dung, backlinks, cấu trúc website… Từ đó, website của bạn sẽ được xuất hiện với một vị trí cụ thể trên trang tìm kiếm.

Sitemap

Tóm tắt cách công cụ tìm kiếm hoạt động (ảnh: Mangools)

Trên đây là tóm lược quy trình Google tìm thấy, lưu trữ và hiển thị trang web đến chúng ta. Tất nhiên nó sẽ phức tạp hơn nhiều so với phần tóm tắt của Vũ, nhưng hiểu được cách hoạt động của công cụ tìm kiếm sẽ giúp các nội dung về sitemap trở nên “dễ nuốt” hơn.

Vũ sẽ chia sẻ kỹ hơn những nội dung trên vào dịp khác. Còn bây giờ hãy cùng bước vào chủ đề chính của bài chia sẻ hôm nay.

Sitemap là gì?

Sitemap, tạm dịch là sơ đồ web, là một file chứa danh sách tất cả các trang và tệp tin hiện có trong trang web. Các trang web hiện nay thường sở hữu nhiều kiểu sitemap khác nhau như sitemap page, sitemap bài viết và sitemap hình ảnh, video.

Sitemap được thiết kế như một sơ đồ phân tầng, đi từ thông tin quan trọng nhất (ví dụ như trang chủ) đến những thông tin ít quan trọng hơn (ví dụ như những bài blog). Nhiệm vụ của đội ngũ xây dựng website và cả khách hàng là thống nhất những nội dung cần có của trang web và phân cấp chúng theo một trật tự, từ đó xây dựng Sitemap cuối cùng.

Sitemap

Sitemap, tạm dịch là sơ đồ web, là một file chứa danh sách tất cả các trang và tệp tin hiện có trong trang web. (ảnh: Izadora)

Sitemap rất hữu ích trong việc giúp người dùng nắm được cấu trúc website và tìm kiếm những thông tin cần thiết. Ngoài ra, Sitemap còn tạo điều kiện để các công cụ tìm kiếm “khám phá” được tất cả những trang hoặc nội dung mà bạn muốn được Google chỉ mục. Cụ thể như thế nào thì sau đây chúng ta sẽ tìm hiểu những loại sitemap phổ biến và mục đích của chúng.

Có bao nhiêu loại Sitemap?

Sau đây là 03 loại sitemap đội ngũ Vũ Digital muốn chia sẻ đến bạn đọc: UX Sitemap, HTML Sitemap và XML Sitemap. Đừng vội nản lòng nếu thấy chúng có vẻ rắc rối, đó chỉ là cái tên, về mặt bản chất thì chúng đơn giản hơn nhiều. Vũ sẽ giải thích chi tiết từng dạng Sitemap ngay sau đây.

Sitemap dành cho đội ngũ thiết kế Website (UX Sitemap)

Trước khi bắt đầu thiết kế giao diện hoặc lập trình, ta cần phải biết trang web sẽ bao gồm những nội dung gì và phân tầng ra sao, nếu chỉ suy tính trong đầu thì ta rất dễ mắc sai lầm khi bắt tay vào làm. Mặt khác, những thành viên trong nhóm cũng phải nắm được cấu trúc website sẽ như thế nào để thực hiện công việc của mình.

Dù cho website của bạn là một trang nhỏ hay lớn, Vũ cho rằng bạn đều nên phác thảo ra giấy Sitemap của nó. Không cần phải dùng các phần mềm chuyên dụng, chỉ cần một tờ giấy đủ to và một cây bút chì (hoặc bảng và bút lông). Bước này giúp mọi người hình dung được hệ thống của trang web, từ đó thảo luận và nhanh chóng đưa ra những điều chỉnh cần thiết.

Ví dụ bên dưới là một Sitemap như thế.

Sitemap

UX Sitemap dành cho đội ngũ xây dựng Website (ảnh: Medium)

Mục đích của UX Sitemap là để hỗ trợ công việc giữa các thành viên trong quá trình xây dựng website. Nó có vai trò tương đối quan trọng và sẽ tác động lớn đến trải nghiệm cuối cùng của người dùng.

Chính vì UX Sitemap là một trong những điểm khởi đầu của quá trình thiết kế web, nó cần sự hợp tác và thống nhất giữa các bên liên quan, chẳng hạn như khách hàng cùng nhóm thiết kế. Thông thường, khách hàng sẽ gửi một danh sách các trang mà họ mong muốn có trên web của mình và nhóm thiết kế sẽ điều chỉnh, phác thảo Sitemap dựa trên danh sách đó.

Sitemap dành cho người dùng (HTML Sitemap)

Loại thứ hai là HTML Sitemap.

HTML Sitemaps chủ yếu được dành cho người dùng khi họ sử dụng website. Nó hiển thị danh sách tất cả các trang, giúp người dùng tìm được nội dung cụ thể trong trường hợp không nhớ vị trí hoặc khi trang web quá phức tạp.

Tuy nhiên, HTML Sitemap không thay thế menu điều hướng sẵn có, nó chỉ đóng vai trò như một bản tóm tắt để người dùng nắm được cấu trúc tổng thể của website.

Không phải tất cả các trang đều cần được đưa vào HTML Sitemap và phần lớn, chỉ các trang công khai mới được liệt kê. “Công khai” tức là nội dung mà bạn muốn khách hàng tìm thấy, và ngược lại, “Không công khai” là những phần cần được ẩn đi.

Chẳng hạn, trang quản trị viên là một phần của Sitemap, nhưng nó là một nội dung “không công khai”, do đó nó sẽ không được hiển thị trên HTML Sitemap.

sitemap

HTML Sitemap được hiển thị trên website của Apple (ảnh: Apple)

Với sự cải thiện liên tục về mặt UX, người dùng giờ đây dễ dàng điều hướng các trang web và tìm được những nội dung mình cần. Do đó, HTML Sitemap đôi khi sẽ không cần thiết. Nhưng một số thương hiệu lớn như Disney hay Apple vẫn cho hiển thị HTML Sitemap để người dùng có thể tham khảo.

Nếu trang web của bạn là một trang web nhỏ và chỉ có một trang chính (Landing Page), bạn sẽ không cần HTML Sitemap. Tương tự, nếu website chỉ có một vài trang (web kinh doanh đơn giản, blog,…), tất cả nội dung đều thể hiện rõ ràng và dễ dàng tìm thấy từ menu chính, bạn cũng sẽ không cần HTML Sitemap.

Sitemap dành cho công cụ tìm kiếm (XML Sitemap)

Loại Sitemap cuối cùng Vũ muốn giới thiệu là XML.

XML Sitemap được nhiều người quan tâm, vì nó ảnh hưởng trực tiếp đến việc Google có tìm ra những nội dung trên website, lưu trữ chúng và hiển thị khi người dùng tìm kiếm hay không.

Nói cách khác, XML Sitemap có tác động trực tiếp đến quá trình tối ưu hóa công cụ tìm kiếm (SEO), hay nói dễ hiểu hơn là gia tăng vị trí xếp hạng của website.

Sitemap

XML Sitemap được dùng để hỗ trợ các công cụ tìm kiếm (ảnh: Yoast)

Cụ thể, XML Sitemap giúp GoogleBot biết được trang web có nội dung nào, đang muốn hiển thị những gì và tần suất website được cập nhật. Chắc chắn chúng ta sẽ muốn báo cho GoogleBot biết nếu có những thay đổi trên Website, ví dụ như viết lại một bài Blog, để nó nắm được thông tin và lưu trữ những điều chỉnh này.

Mặt khác, cũng giống như HTML Sitemap, chỉ các trang công khai mới cần được liệt kê trên XML Sitemap. Bạn không cần liệt kê những nội dung mà bạn không muốn hiển thị khi người dùng tìm kiếm vào XML Sitemap.

Đây là tổng quan về 03 loại Sitemap phổ biến. Tóm lại, về đối tượng sử dụng, UX Sitemap dành cho đội ngũ xây dựng Website, HTML Sitemap dành cho người dùng còn XML Sitemap sẽ dành cho các công cụ tìm kiếm. Về mục đích, cả ba loại đều giúp hệ thống lại cấu trúc website nhằm giúp người xem hình dung được cách tổ chức của những trang web.

Khi nào chúng ta cần Sitemap?

Như Vũ đã chia sẻ, UX Sitemap sẽ cần thiết cho quá trình thiết kế website giữa các thành viên trong nhóm. Trong khi đó, HTML sẽ hữu ích nếu bạn có một trang web lớn, chứa nhiều nội dung và bạn muốn người dùng dễ dàng hơn khi sử dụng. Tương đối rõ ràng đúng không?

Tuy nhiên, XML Sitemap thì lại là một câu chuyện khác. Vì nó là cầu nối để ta làm việc trực tiếp với Google. Mà Google thì lại… khó lường! Ta luôn muốn biết liệu trang web của mình có lọt được vào top 10 trong hai tuần tới không, nội dung có được Index không và Sitemap sẽ đóng góp bao nhiêu phần trăm vào quá trình đó.

sitemap

Sitemap không phải là công cụ đảm bảo thứ hạng trang web trên các công cụ tìm kiếm (ảnh: Edho Pratama)

Nếu bạn đang thắc mắc liệu một XML Sitemap hoàn chỉnh có giúp Google “tặng điểm thưởng” cho mình không, thì rất tiếc, câu trả lời là không. Chưa nói đến việc “Ranking”, Sitemap cũng sẽ không đảm bảo chắc chắn nội dung sẽ được “Index”.

Về Index, Google không lập chỉ mục trang web chỉ vì bạn đã “khai báo” một cách đầy đủ. Google lưu trữ nội dung dựa trên hai tiêu chí:

  • GoogleBot tìm thấy website và thu thập thông tin (tức Crawling thành công)
  • GoogleBot đánh giá website đủ tốt để được index (chất lượng, thiết kế của trang,…)

Về Ranking, Google sẽ dựa vào nhiều yếu tố khác nhau để xếp hạng nội dung:

  • Chất lượng nội dung
  • Mức độ liên quan
  • Backlinks từ các trang khác
  • Tốc độ tải trang

Và còn rất nhiều yếu tố khác ảnh hưởng đến việc hiển thị website của bạn. Nhưng nói như thế không phải là chúng ta bỏ qua và không làm XML Sitemap. Nó vẫn sẽ hữu dụng trong những trường hợp sau:

Trường hợp 1: Website lớn và phức tạp

Một trang web lớn sẽ bao gồm rất nhiều dữ liệu và nội dung khác nhau. Trong quá trình “Crawling”, có khả năng GoogleBot sẽ vô tình bỏ qua việc thu thập thông tin từ một số trang hoặc những nội dung vừa được cập nhật gần đây.

Sitemap

Một trang web lớn và phức tạp sẽ cần đến Sitemap (ảnh: unsplash)

Mặt khác, Google cần sử dụng nguồn lực của mình hợp lý. Nó phân bổ “ngân sách” – tức một lượng thời gian nhất định – để GoogleBot khám phá các trang web. Chúng ta gọi đó là “Crawl Budget”.

GoogleBot không nhất thiết phải thu thập dữ liệu thuộc về trang web mọi lúc, mọi nơi. Nó thường phân chia việc thu thập dữ liệu thành nhiều đợt. Có những website cần vài ngày để thu thập thông tin, nhưng cũng có những trang cần nhiều tuần để hoàn thành việc đó.

Vì vậy, nếu web của bạn sở hữu lên đến cả nghìn trang và gần đây bạn vừa cập nhật khoảng vài trăm trong số đó, bạn sẽ cần giúp Google nhận biết điều này nhanh chóng hơn. Làm cách nào? Bằng cách cập nhật thông tin trong XML Sitemaps, GoogleBot sẽ biết rằng nó cần tập trung vào đâu, từ đó sẽ tìm thấy và index thông tin nhanh hơn.

Trường hợp 2: Các trang trên Website không liên kết tốt với nhau

Như đã chia sẻ ở phần đầu của bài viết, GoogleBot khám phá website dựa trên các đường link. Vậy nếu trang web mới lập (nghĩa là rất ít backlinks) và bạn lại không liên kết các trang lại với nhau, điều gì sẽ xảy ra? Câu trả lời tương đối dễ đoán: GoogleBot sẽ bỏ qua một vài trang mà nó “chưa kịp” khám phá.

Sitemap sẽ có ích trong trường hợp này. Bạn có thể liệt kê tất cả các trang con vào Sitemap để đảm bảo rằng Google không bỏ qua bất kỳ trang nào trong số đó.

Ngược lại, nếu Google có thể tìm ra các trang quan trọng bằng những đường dẫn nội bộ (internal links), bạn sẽ không cần đến sitemap. Ví dụ, đây là một đường link nội bộ dẫn đến trang dự án của Vũ từ bài viết này.

Trường hợp 3: Website có rất ít backlinks

“Có ít backlinks” nghĩa là không ai hoặc ít người đặt link của bạn trong nội dung bài viết của họ. Có nhiều nguyên nhân dẫn đến việc này (website mới lập, nội dung chưa phù hợp,…), và cũng có nhiều hướng giải quyết (tự đặt backlinks, chèn vào các bài đăng Facebook,…).

Việc có quá ít backlinks trỏ về website sẽ khiến Google chậm khám phá ra sự tồn tại của web hơn. Cũng như trường hợp trên, Sitemap sẽ hỗ trợ phần nào đó để bù đắp sự thiếu hụt này.

Trường hợp 4: Website có nhiều hình ảnh, video

Nội dung trên một website thường không chỉ có các bài viết, đó còn là hình ảnh và đôi khi là video. Chúng ta gọi chung đó là “Rich Content”. Nếu bạn muốn hiển thị những nội dung liên quan khi người dùng tìm kiếm bằng hình ảnh, thì một XML sitemap riêng chỉ dành cho hình ảnh sẽ cần thiết để Google xem xét.

sitemap

Những trang web có nhiều hình ảnh hoặc video sẽ cần Sitemap để giúp Google thu thập thông tin của những nội dung này (ảnh: Designecologist)

Đó là những trường hợp mà chúng ta sẽ cần đến XML Sitemap. Nhưng như Vũ đã chia sẻ, nó không phải là điều đảm bảo thành công của website. Đến cuối cùng, mục tiêu của chúng ta khi xây dựng website, đăng tải nội dung, làm đủ các thủ thuật SEO,… cũng là để phát triển thương hiệu trên môi trường kỹ thuật số, để tìm được khách hàng, để được nhiều người biết đến. Đó là cả một quá trình và cần đến nhiều yếu tố khác nhau.

Nhưng quan trọng, chúng ta vẫn chỉ nên tập trung trả lời câu hỏi: ta mang đến giá trị nào cho khách hàng, cho người dùng? Điểm khác biệt nào làm nên thương hiệu mà ta tự tin nhất? Liệu nó có giúp khách hàng giải quyết được vấn đề của họ không? Chính những câu hỏi này sẽ hướng sự chú ý của chúng ta đến nơi cần được chú ý: khách hàng, chứ không phải các “tuyệt chiêu” lan truyền trên mạng.

Khi khách hàng tìm được giải pháp tại website của bạn, họ sẽ tin tưởng website hơn, ở lại website lâu hơn, tìm đọc nhiều nội dung hơn, và giới thiệu cho những người khác. Đây mới là những yếu tố giúp tạo nên hình ảnh thương hiệu về lâu dài.

Lời kết

Đội ngũ Vũ Digital hy vọng bạn đọc đã hiểu được Sitemap là gì và phân loại được các dạng Sitemap hiện có, cũng như vai trò của chúng đối với các hoạt động truyền thông.

Sitemap có nhiều tác dụng trong việc xây dựng website, gia tăng trải nghiệm người dùng và “hợp tác” với Google, nhưng nó không phải là yếu tố bắt buộc phải có đối với mọi Website. Việc hoàn thiện một XML Sitemap và gửi nó đến Google sẽ không đảm bảo rằng Google sẽ lập chỉ mục và xếp trang web vào top 10 ngay ngày mai.

Còn nhiều yếu tố khác ảnh hưởng đến quá trình này và Sitemap chỉ là một trong số đó. Chúng ta nên dành thời gian nghiên cứu và mang đến nhiều nội dung chất lượng cho người đọc, từ đó sẽ phát triển website nói riêng và thương hiệu nói chung.

Xin chân thành cảm ơn,

* Nguồn: Vũ Digital