Marketer Phương Quyên
Phương Quyên

Content Executive @ Brands Vietnam

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

 Nội dung chính

Định nghĩa
- 1. Biểu đồ vùng chồng lấp (Overlapping Area Chart)
- 2. Biểu đồ vùng xếp chồng (Stacked Area Chart)
Cách biểu diễn
Những lưu ý khi sử dụng biểu đồ vùng
- 1. Trục tung luôn bắt đầu từ 0
- 2. Lưu ý số đường trong biểu đồ vùng chồng lấp
- 3. Sắp xếp thứ tự các đường với biểu đồ vùng xếp chồng
Các trường hợp đặc biệt
- 1. Biểu đồ tần suất tương đối (Percentage Stacked Area Chart)
- 2. Biểu đồ Ridgeline
- 3. Biểu đồ dòng chảy (Stream Graph)

Biểu đồ vùng (Area Chart) là một công cụ trực quan hóa dữ liệu đặc biệt hiệu quả khi cần thể hiện sự thay đổi của một đại lượng theo thời gian đồng thời thể hiện tương đối cách các thành phần khác nhau đóng góp vào tổng thể đó.

Data Visualization được phát triển nhằm cung cấp các bối cảnh sử dụng những loại biểu đồ phổ biến thường gặp và những biểu đồ phức tạp để phục vụ việc đọc – hiểu thông tin quan trọng từ dữ liệu. Bằng cách kết hợp giữa chia sẻ góc nhìn chuyên gia và các ví dụ/bài tập cụ thể, series hy vọng các bạn có thể thành thạo việc “tạo hình” data hơn.

Định nghĩa

Biểu đồ vùng là một biến thể đặc biệt của biểu đồ đường, nhằm thể hiện sự thay đổi của một hoặc nhiều biến số theo biến ở trục X – thường là thời gian. Trong đó thay vì chỉ nối các điểm dữ liệu bằng một đường liên tục, biểu đồ vùng có phần được tô màu bên dưới đường giá trị giúp làm nổi bật độ lớn của giá trị.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ trên minh họa số lượng lead hằng tháng trong năm 2023.
Nguồn dữ liệu: Bold BI

Biểu đồ trên minh họa số lượng lead của một công ty theo từng tháng trong năm 2023. Số lead mỗi tháng không chỉ được thể hiện bằng vị trí của đường nối các điểm, mà còn bởi chiều cao được tô màu giữa đường nối các điểm và đường cơ sở trên trục X. Ta có thể thấy số lead mỗi tháng dao động từ 75 đến 85 người, tuy nhiên đến tháng 8/2023 giảm mạnh chỉ còn 24 người.

Khi nhìn biểu đồ đường (line graph), người đọc tập trung vào sự thay đổi giá trị trên trục tung (tăng giảm) theo các mốc thời gian trên trục hoành. Người đọc thường so sánh các đường với nhau nhiều hơn là so sánh độ cao của chúng so với trục hoành. Do đó, biểu đồ đường phù hợp hơn với việc thể hiện sự thay đổi của giá trị theo thời gian, hơn là biểu thị giá trị chính xác tại mỗi điểm được đo.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ đường thể hiện sự thay đổi của giá trị theo thời gian.
Nguồn dữ liệu: Storytelling with Data

Tuy nhiên, khi tô màu giữa đường giá trị và đường cơ sở (baseline), biến biểu đồ đường thành biểu đồ vùng (area graph), lúc này người đọc sẽ có xu hướng nhìn mỗi chuỗi dữ liệu như một hình đa giác, như một hình dạng cụ thể; và đánh giá mỗi chuỗi dữ liệu không còn chủ yếu dựa trên sự thay đổi theo thời gian, mà dựa vào cảm nhận về diện tích tổng thể của vùng màu.

Biểu đồ vùng làm thay đổi mục đích ban đầu của biểu đồ đường — từ việc chỉ đơn thuần thể hiện sự thay đổi tương đối theo thời gian, sang việc thể hiện cả khối lượng hoặc số lượng tổng của từng nhóm dữ liệu nữa.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ vùng không chỉ thể hiện sự thay đổi tương đối theo thời gian mà còn cho thấy cả khối lượng hoặc số lượng tổng của từng nhóm dữ liệu
Nguồn dữ liệu: Storytelling with Data

Bên cạnh đó, biểu đồ vùng cũng thường dùng để biểu diễn nhiều nhóm (nhiều đường) có thể cộng gộp lại với nhau giúp dễ dàng thể hiện giá trị tổng qua thời gian, đồng thời cho thấy sự phân chia, đóng góp của các danh mục con.

Chẳng hạn, biểu đồ người dùng hoạt động qua thời gian theo từng phân khúc (người dùng miễn phí, người dùng trả phí) hoặc tổng traffic của website chia theo các nguồn như ví dụ bên dưới.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ vùng biểu diễn nhiều nhóm có thể cộng gộp lại với nhau để thể hiện giá trị tổng qua thời gian, đồng thời cho thấy sự phân chia, đóng góp của các danh mục con.
Nguồn dữ liệu: Bold BI

Cách biểu diễn nhiều nhóm này giúp nhấn mạnh cơ cấu của các danh mục con, nhất là khi một danh mục con chiếm tỷ trọng rất lớn trong tổng thể, hoặc thay đổi đáng kể qua thời gian như từ rất lớn thành rất nhỏ hoặc ngược lại.

Tuy nhiên, biểu đồ vùng không phải là lựa chọn lý tưởng trong các trường hợp người biểu diễn muốn làm nổi bật sự khác biệt rất nhỏ giữa các giá trị hay tập trung vào việc so sánh từng giá trị cụ thể.

Dựa trên các đặc điểm và mục đích sử dụng, ta sẽ thường gặp hai loại biểu đồ vùng khác nhau:

1. Biểu đồ vùng chồng lấp (Overlapping Area Chart)

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ biểu diễn số người vào (Entries) và ra (exits) mỗi giờ tại ga Embarcadero năm 2018.
Nguồn dữ liệu: Atlassian

Biểu đồ trên biểu diễn số người vào (Entries) và ra (exits) mỗi giờ tại ga Embarcadero năm 2018. Trong đó, có thể khoảng 17 giờ có nhiều người vào ga nhất, gần 2,5 triệu người, và 8 giờ sáng là khung giờ có số người rời ga cao nhất với hơn 3 triệu người. Cách biểu diễn này dùng để so sánh trực tiếp giữa các nhóm số liệu.

Mỗi nhóm sẽ có một đường riêng được nối qua các điểm giá trị tại các thời điểm (trục hoành). Phần diện tích giữa đường giá trị và đường cơ sở sẽ được tô màu, các vùng màu này chồng lên nhau, nên người biểu diễn cần điều chỉnh độ trong suốt (transparency) hoặc dùng tính năng làm nổi bật từng nhóm trong các công cụ trực quan hóa để có thể quan sát rõ từng nhóm. Đối với biểu đồ vùng chồng lấp, người biểu diễn phải đảm bảo thể hiện rõ phần màu bị chồng lấp giữa các vùng với nhau để tránh nhầm lẫn với biểu đồ vùng xếp chồng.

Thực tế để thể hiện giá trị, độ lớn, biểu đồ cột cũng là một lựa chọn đáng cân nhắc (nguyên tắc của biểu đồ cột cũng bắt buộc biểu diễn từ mốc 0 ở trục tung).

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ cột cũng là một lựa chọn đáng cân nhắc để thể hiện giá trị, độ lớn nhưng không thuận tiện để so sánh các giá trị liên tục qua thời gian.
Nguồn dữ liệu: Atlassian

Tuy nhiên, điểm hạn chế của biểu đồ cột là không thuận tiện khi người biểu diễn muốn so sánh các giá trị liên tục qua thời gian. Chẳng hạn với ví dụ trên nếu như muốn biểu diễn toàn bộ người ra vào ga trong 24 giờ một ngày, hay hiển thị dữ liệu ở mức độ chi tiết hơn — thì dạng biểu đồ này nhanh chóng trở nên cồng kềnh. Mỗi thời điểm tương ứng với hai cột (hình bên trái) hay một cột chia 2 phần (hình bên phải), nên khi quá nhiều cột được vẽ liên tiếp, người xem sẽ rất khó nắm bắt xu hướng hoặc so sánh tổng thể.

Ngoài ra, Area Chart có thể truyền tải tổng giá trị tích lũy của từng biến một cách trực quan thông qua diện tích mà nó bao phủ. Ví dụ, trong biểu đồ trên, người biểu diễn chỉ cần thêm chú thích cho phần diện tích màu cam (A) thể hiện tổng lượng người rời ga trong ngày, trong khi phần màu xanh (B) thể hiện tổng lượng người vào ga. Từ đó, người xem dễ dàng thấy diện tích phần cam lớn hơn phần xanh, tương ứng với tổng số người rời ga nhiều hơn số người đến ga trong một ngày.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Số người vào (Entries) và ra (exits) mỗi giờ tại ga Embarcadero biểu diễn bằng biểu đồ vùng.
Nguồn dữ liệu: Atlassian

Biểu đồ cột khó thể hiện điều này bởi diện tích không có ý nghĩa tích lũy tương tự, và việc cộng dồn hoặc so sánh tổng là thao tác phải làm thủ công hoặc cần chú thích phụ trợ.

2. Biểu đồ vùng xếp chồng (Stacked Area Chart)

Khi nhắc đến cụm “Area Chart”, phần lớn trường hợp người ta thường nghĩ đến biểu đồ vùng xếp chồng. Ở dạng này, mỗi nhóm không được tô từ trục hoành, mà sẽ xếp chồng lên trên giá trị của nhóm trước đó, và giá trị của các nhóm có thể được cộng gộp thành số tổng theo từng mốc thời gian. Như vậy, đường trên cùng thể hiện tổng cộng của tất cả các nhóm tại từng thời điểm.

Cách biểu diễn này được dùng khi người biểu diễn muốn thể hiện tổng giá trị qua thời gian, đồng thời hiểu được phần đóng góp của từng nhóm vào tổng thể.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ tổng doanh thu của Apple từ tháng 12/2007 đến tháng 6/2011 được chia theo các dòng sản phẩm.
Nguồn dữ liệu: Business Insider

Biểu đồ trên cho thấy tổng doanh thu của Apple từ tháng 12/2007 đến tháng 6/2011 được chia theo các dòng sản phẩm. Kể từ khi ra mắt, iPhone đã liên tục tăng trưởng về doanh thu và nhanh chóng trở thành sản phẩm mang lại nguồn thu lớn nhất cho Apple.

Ngược lại, iPod – từng là sản phẩm chủ lực vào thời điểm tháng 12/2007 – dần mất đi vị thế và đến tháng 6/2011, mức đóng góp doanh thu của iPod không còn đáng kể. Cùng thời điểm này, ba dòng sản phẩm chính gồm iPhone, Mac và iPad đã trở thành những trụ cột doanh thu quan trọng nhất của Apple.

Một minh hoạ khác cho biểu đồ vùng xếp chồng như dưới đây biểu diễn tác động của khuyến mãi đối với doanh số.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ vùng xếp chồng biểu diễn tác động của khuyến mãi đối với doanh số.
Nguồn dữ liệu: Kantar – Báo cáo triển vọng FMCG Việt Nam 2025

Việc dùng biểu đồ vùng giúp thể hiện rõ đồng thời hai yếu tố: tăng trưởng doanh số trong thời gian chạy chiến dịch và xác định được các nguồn của tăng trưởng. Qua biểu đồ này, người đọc thấy được tăng trưởng thực sự đến từ việc thu hút người mua mới và gia tăng số lượng đơn hàng từ khách hàng hiện tại, chứ không chỉ dựa vào hành vi mua hàng do săn khuyến mãi.

Cụ thể, trong tổng mức doanh số tăng trưởng ở giai đoạn khuyến mãi, chỉ có 40% tăng trưởng do những người mua hiện tại quyết định mua hàng sớm hơn dự kiến để trữ hàng (và sẽ hoãn thời điểm mua hàng tiếp theo như thường lệ), trong khi đó đến 60% tăng trưởng là mới hoàn toàn bao gồm 20% đến từ việc người mua hiện tại mua lượng hàng nhiều hơn, 20% đến từ “lôi kéo” khách hàng từ doanh nghiệp đối thủ và 20% là từ những khách hàng mới mua ngành hàng.

Cách biểu diễn

Tính chất các biến số ở biểu đồ vùng khá giống với biểu đồ đường, trục tung là biến định lượng trong khi trục hoành thường là biến thời gian.

Để vẽ biểu đồ vùng, người biểu diễn cần tổng hợp dữ liệu thành một bảng bao gồm các mốc thời gian và giá trị tương ứng của các biến ở từng mốc thời gian.

Giả sử với bảng dữ liệu thô thống kê doanh thu của một công ty theo từng dòng sản phẩm từ quý I/2020 đến quý IV/2022 như dưới đây:

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Bảng dữ liệu thô thống kê doanh thu của một công ty theo từng dòng sản phẩm từ quý I/2020 đến quý IV/2022.
Nguồn dữ liệu: Brands Vietnam

Bước 1 – Xác định mục đích biểu diễn: Tương tự với mọi loại biểu đồ khác, trước tiên cần xác định mục tiêu thể hiện. Trong trường hợp này, ta muốn theo dõi xu hướng doanh thu theo thời gian, đồng thời thể hiện mức đóng góp của từng danh mục sản phẩm (Phones, Chairs, Storage, Tables).

Bước 2 – Tạo biểu đồ vùng: Chọn loại biểu đồ vùng (Area Chart), tốt nhất là biểu đồ vùng xếp chồng (stacked area) nếu muốn thể hiện giá trị tổng doanh thu và tỷ lệ đóng góp của từng nhóm theo thời gian. Biểu đồ vùng có cách dựng gần giống biểu đồ đường, nhưng có phần màu sắc tô giữa từng nhóm với nhau và với trục cơ sở, giúp làm rõ phần chiếm tỷ trọng. Người biểu diễn nên lựa chọn màu sắc phù hợp, dễ nhìn để người đọc nhanh chóng phân biệt được các nhóm sản phẩm.

Bước 3 – Sắp xếp thứ tự hiển thị các nhóm sản phẩm: Khác với biểu đồ đường, thứ tự các nhóm trong biểu đồ vùng ảnh hưởng lớn đến cách người đọc hiểu dữ liệu, người biểu diễn có thể chọn sắp xếp theo thứ tự giá trị từ lớn đến nhỏ hoặc ngược lại tùy mục đích biểu diễn. Để sắp xếp theo thứ tự, có thể tham khảo các bước:

  • Xác định thời điểm đo lường cuối cùng hoặc thời điểm muốn so sánh chính (ví dụ: Quý IV/2022).
  • So sánh giá trị doanh thu tại thời điểm đó:
    • Phones: 189.624
    • Chairs: 172.863
    • Storage: 100.492
    • Tables: 99.934
  • Sắp xếp từ cao đến thấp để nhóm có giá trị lớn hơn đặt ở dưới cùng (tăng tính trực quan): Phones → Chairs → Storage → Table.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ vùng thống kê doanh thu của một công ty theo từng dòng sản phẩm từ quý I/2020 đến quý IV/2022.
Nguồn dữ liệu: Brands Vietnam

Những lưu ý khi sử dụng biểu đồ vùng

1. Trục tung luôn bắt đầu từ 0

Khi vẽ biểu đồ vùng, ta thường tô màu từ đường dữ liệu xuống trục cơ sở (trục x) và chiều cao của các vùng màu sẽ được dùng để so sánh kích thước giá trị của từng nhóm. Do đó, tương tự biểu đồ cột, trục tung phải bắt đầu từ giá trị 0 để không gây hiểu nhầm về độ lớn thật sự giữa các nhóm dữ liệu. Ví dụ, nhóm A và nhóm B xấp xỉ nhau, nhưng nếu không bắt đầu từ 0, biểu đồ có thể khiến chúng ta tưởng rằng nhóm A gấp đôi, gấp ba nhóm B, như đã đề cập trong bài biểu đồ cột.

Tuy nhiên, trong một số trường hợp đặc biệt, biểu đồ vùng hoặc biểu đồ cột có thể bắt đầu từ một giá trị khác 0 nếu mục tiêu là nhấn mạnh sự khác biệt nhỏ nhưng có ý nghĩa lớn. Ví dụ, khi thể hiện sự thay đổi về thị phần giữa hai công ty, việc công ty A mất 4% thị phần vào tay đối thủ có thể là một biến động rất đáng kể trong bối cảnh cạnh tranh khốc liệt.

Nếu vẽ biểu đồ vùng từ mốc 0 đến 100% như thông thường, phần chênh lệch 4% này có thể bị “chìm” trong tổng thể, khiến người xem không cảm nhận được mức độ quan trọng. Khi đó, việc bắt đầu trục tung từ một giá trị gần hơn với phạm vi dao động (ví dụ từ 85% đến 100%) có thể giúp làm nổi bật sự thay đổi thực sự có ý nghĩa này.

Cần lưu ý rằng đây là một ngoại lệ có chủ đích và nên được sử dụng cẩn trọng, kèm theo chú thích rõ ràng, bởi vì biểu đồ vùng vốn dĩ được thiết kế để thể hiện tỷ lệ tương đối dựa trên chiều cao từ trục cơ sở.

2. Lưu ý số đường trong biểu đồ vùng chồng lấp

Càng có nhiều chuỗi dữ liệu (series) trong một biểu đồ vùng chồng lấp, thì càng có nhiều tổ hợp màu sắc xuất hiện khi các vùng dữ liệu chồng lên nhau. Việc này có thể gây khó khăn trong việc diễn giải biểu đồ. Chẳng hạn biểu đồ dưới đây với ba chuỗi dữ liệu cùng một mốc thời gian có thể tạo ra tổng cộng bảy màu trên biểu đồ.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Càng có nhiều chuỗi dữ liệu (series) trong một biểu đồ vùng chồng lấp, thì càng có nhiều tổ hợp màu sắc xuất hiện khi các vùng dữ liệu chồng lên nhau.
Nguồn dữ liệu: Atlassian

Do vậy, việc so sánh hai chuỗi cùng mốc thời gian thường dễ dàng hơn, hoặc nhiều chuỗi trải dài các mốc thời gian khác nhau. Tuy nhiên giả sử chuỗi A luôn có giá trị lớn hơn chuỗi B, biểu đồ rất dễ bị nhầm thành biểu đồ vùng xếp chồng. Vì thế, một lần nữa, người biểu diễn cần đảm bảo thể hiện rõ phần màu giữa các vùng “giao nhau” để phân biệt với biểu đồ vùng xếp chồng.

Vì vậy, khi vẽ biểu đồ vùng chồng lấp, hãy lưu ý bao nhiêu chuỗi dữ liệu thì người đọc bắt đầu khó trích xuất thông tin. Khi đó, các biến thể đặc biệt như biểu đồ ridgeline (phần bên dưới) sẽ phù hợp hơn biểu đồ vùng chồng lấp thông thường.

3. Sắp xếp thứ tự các đường với biểu đồ vùng xếp chồng

Như đề cập ở phần hướng dẫn vẽ, người biểu diễn nên lựa chọn thứ tự hợp lý để giúp người xem đọc biểu đồ dễ dàng hơn. Với biểu đồ vùng, việc đọc chính xác giá trị của từng nhóm thường khó khăn, trừ nhóm nằm dưới cùng. Tùy thuộc mục đích sử dụng mà người biểu diễn nên dành vị trí này cho nhóm quan trọng nhất, đồng thời có thể dùng màu sắc làm nổi bật các biến quan trọng để truyền tải hiệu quả ý chính biểu đồ.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Tùy thuộc mục đích sử dụng mà người biểu diễn nên nên dành vị trí dưới cùng cho nhóm quan trọng nhất, đồng thời dùng màu sắc làm nổi bật các biến quan trọng để truyền tải hiệu quả ý chính biểu đồ.
Nguồn dữ liệu: Adtwodigital

Các trường hợp đặc biệt

1. Biểu đồ tần suất tương đối (Percentage Stacked Area Chart)

Một dạng biểu đồ vùng phổ biến là biểu đồ vùng xếp chồng theo tỷ lệ phần trăm, hay còn gọi là biểu đồ tần suất tương đối. Thay vì chồng các giá trị tuyệt đối, biểu đồ này xếp chồng tỷ lệ hoặc phần trăm đóng góp của từng nhóm so với tổng thể qua thời gian, sao cho tổng chiều cao luôn là 100%.

Dạng biểu đồ này không thể hiện xu hướng của giá trị tổng nhưng giúp so sánh rõ ràng hơn mức độ đóng góp tương đối giữa các nhóm. Một điểm cộng nữa là biểu đồ này có thêm một đường cơ sở thứ hai ở phía trên giúp ước lượng mức đóng góp của từng nhóm dễ hơn.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ tần suất tương đối không thể hiện xu hướng của giá trị tổng nhưng giúp so sánh rõ ràng hơn mức độ đóng góp tương đối giữa các nhóm.
Nguồn dữ liệu: Six Colors

Ví dụ, biểu đồ trên cho thấy tỷ trọng doanh thu của Apple theo từng dòng sản phẩm từ quý II/2020 đến quý I/2025. Từ biểu đồ này, người xem có thể dễ dàng nhận ra rằng iPhone luôn là sản phẩm mang lại doanh thu lớn nhất cho Apple trong suốt giai đoạn này, chiếm khoảng 40% đến hơn 50% tổng doanh thu tùy thời điểm. Đứng thứ hai là mảng dịch vụ, cũng đóng góp một phần đáng kể trong cơ cấu doanh thu của công ty.

2. Biểu đồ Ridgeline

Một lựa chọn thay thế khác cho biểu đồ vùng chồng lấp khi có nhiều chuỗi dữ liệu và vùng “giao nhau” là biểu đồ Ridgeline. Thay vì vẽ trên cùng 1 biểu đồ, biểu đồ Ridgeline tách mỗi biến số (mỗi chuỗi dữ liệu) thành một biểu đồ riêng và xếp thẳng hàng với nhau theo trục hoành. Dạng biểu đồ này sẽ phù hợp khi có từ khoảng 10 nhóm dữ liệu trở lên và chồng lấp lên nhau khiến người đọc khó quan sát.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ Ridgeline tách mỗi biến số (mỗi chuỗi dữ liệu) thành một biểu đồ riêng và xếp thẳng hàng với nhau theo trục hoành.
Nguồn dữ liệu: Daily Dose of Data Science

Biểu đồ Ridgeline trên minh họa xu hướng tìm kiếm trong năm 2024 để thể hiện mức độ quan tâm tìm kiếm theo từng chủ đề trong suốt năm. Có thể thấy OpenAI và AI Agents là những chủ đề nổi bật nhất trong năm 2024. Mức độ tìm kiếm của OpenAI ổn định và tương đối cao trong hầu hết các tháng trong khi AI Agents bắt đầu tăng vọt lên từ các tháng cuối năm.

Một số chủ đề chỉ thu hút sự quan tâm trong thời gian ngắn, như Wimbledon, Nhật thực và Giải vô địch cờ vua thế giới, thể hiện qua các đỉnh nhọn và hẹp. Biểu đồ ridgeline giúp thể hiện nhiều chuỗi dữ liệu theo thời gian một cách rõ ràng hơn và dễ nhìn thấy những xu hướng chính, hạn chế các vùng “giao nhau” giữa các chuỗi dữ liệu.

3. Biểu đồ dòng chảy (Stream Graph)

Một biến thể khác là biểu đồ dòng chảy (Stream Graph). Đối với biểu đồ vùng xếp chồng, tất cả các đường được xếp chồng lên nhau dựa trên cùng một đường cơ sở nằm ở đáy biểu đồ, dữ liệu mỗi vùng là phần cộng thêm tính từ đỉnh của vùng liền kề bên dưới hay hiểu nôm na lấy đỉnh của vùng ở dưới làm đường cơ sở cho vùng ở trên chứ không phải tính từ đường cơ sở nằm ở đáy biểu đồ như biểu đồ chồng lấp.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Biểu đồ vùng chồng lấp đặt đường cơ sở ở dưới đáy biểu đồ.
Nguồn dữ liệu: Storytelling With Data

Còn với Stream Graph, đường cơ sở lại được đặt canh giữa biểu đồ dựa trên tổng giá trị của các vùng cộng lại, sau đó sắp xếp các vùng sao cho tổng giá trị trên và dưới đối xứng xung quanh đường trung tâm này. Dạng biểu đồ này thường dùng để xem xu hướng hay các hình mẫu (pattern) thay đổi qua thời gian không chỉ của các danh mục/thành phần con mà còn xem được cả giá trị tổng thể.

Tuy nhiên, điểm hạn chế là rất khó để xác định chính xác giá trị của từng nhóm, hay thậm chí của tổng thể. Vì thế, khi sử dụng loại chart này, chúng ta cần phải thể hiện luôn giá trị dữ liệu ngay trên biểu đồ như ví dụ minh hoạ bên dưới.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Với Stream Graph, đường cơ sở được đặt canh giữa biểu đồ dựa trên tổng giá trị của các vùng cộng lại, sau đó sắp xếp các vùng sao cho tổng giá trị trên và dưới đối xứng xung quanh đường trung tâm này.
Nguồn dữ liệu: Storytelling with data

Theo lập luận của một chuyên gia, Stream Graph phù hợp nhất khi được sử dụng dưới dạng tương tác, đặc biệt khi cần trình bày lượng lớn dữ liệu cho đối tượng khán giả rộng. Vì sao yếu tố “tương tác” lại quan trọng? Vì nó cho phép người xem tự khám phá và rút ra những nhận định của riêng họ từ biểu đồ.

Data Visualization #4: Area Chart – Hướng dẫn toàn diện về biểu đồ vùng

Stream Graph cho phép người xem tự khám phá và rút ra những nhận định của riêng họ từ biểu đồ.
Nguồn dữ liệu: Visualizing Data

Ngược lại, trong những trường hợp cần đánh giá chính xác, coi giá trị cụ thể hoặc trình bày dữ liệu một cách tĩnh (ví dụ như trong báo cáo hay in ấn), sử dụng các dạng biểu đồ truyền thống sẽ hiệu quả hơn, bằng cách tổng hợp dữ liệu sao cho làm nổi bật được thông điệp chính mà người biểu diễn muốn truyền tải.

Nhìn chung, biểu đồ vùng đặc biệt phù hợp trong các tình huống cần biểu diễn xu hướng hay sự thay đổi liên tục qua thời gian của tổng giá trị tích lũy – chẳng hạn như tổng doanh thu, lượng truy cập người dùng và các thành phần danh mục con – chẳng hạn như doanh thu của các dòng sản phẩm, lượng truy cập của các nhóm người dùng.

Như đã đề cập trong bài, dạng biểu đồ này không phù hợp khi cần đọc hoặc so sánh chính xác từng giá trị riêng lẻ giữa các nhóm – lúc đó biểu đồ đường hoặc biểu đồ cột sẽ là lựa chọn hợp lý hơn.

Đây là series đào sâu cách sử dụng biểu đồ trong những bối cảnh khác nhau. Nếu bạn đọc có bất kỳ ví dụ minh họa hay biểu đồ cụ thể nào cần chuyên gia phân tích, hãy để lại bình luận cho Brands Vietnam nhé!

Bạn có thể xem lại các bài viết khác cùng chuyên mục tại đây.

Phương Quyên / Brands Vietnam
* Nguồn: Brands Vietnam