Data Visualization #2: Bar Chart – Hướng dẫn toàn diện về biểu đồ cột

Nếu biểu đồ đường có thế mạnh về biểu diễn xu hướng thì biểu đồ cột (Bar Chart) là công cụ trực quan hóa dữ liệu giúp so sánh giá trị giữa các nhóm một cách rõ ràng hơn. Bài viết này cung cấp hướng dẫn toàn diện về cách sử dụng biểu đồ cột hiệu quả – từ cấu trúc cơ bản, các dạng biểu diễn phổ biến đến những lưu ý quan trọng để truyền tải dữ liệu dễ hiểu.
Data Visualization được phát triển nhằm cung cấp các bối cảnh sử dụng những loại biểu đồ phổ biến thường gặp và những biểu đồ phức tạp để phục vụ việc đọc – hiểu thông tin quan trọng từ dữ liệu. Bằng cách kết hợp giữa chia sẻ góc nhìn chuyên gia và các ví dụ/bài tập cụ thể, series hy vọng các bạn có thể thành thạo việc “tạo hình” data hơn.
Định nghĩa
Biểu đồ cột (bar chart) là loại biểu đồ biểu diễn giá trị của các biến phân loại dưới dạng cột, được sử dụng hiệu quả trong việc biểu diễn các giá trị tuyệt đối và so sánh độ lớn giữa các biến định tính. Thay vì nhấn mạnh xu hướng (trend) theo thời gian như biểu đồ đường, biểu đồ cột giúp người dùng dễ dàng quan sát và so sánh mức độ, sự tăng/giảm hay chênh lệch giữa các nhóm dữ liệu tại một thời điểm nhất định.
Ví dụ, nếu cần phân tích số giao dịch theo từng loại người dùng (guest, new user, existing user) tại một thời điểm cụ thể, biểu đồ cột sẽ là lựa chọn tối ưu, vì nó cho phép hiển thị rõ ràng sự khác biệt về số lượng giữa các nhóm. Trục ngang thể hiện loại người dùng (biến phân loại/biến định tính), và chiều cao của mỗi cột biểu diễn số lượng giao dịch tương ứng (giá trị của biến).
Biểu đồ cột hiển thị rõ ràng sự khác biệt về số lượng giữa các nhóm người dùng (guest, new user, existing user).
Nguồn dữ liệu: Atlassian
Từ biểu đồ trên, người đọc có thể xác định nhóm nào có giá trị cao nhất hoặc phổ biến nhất, và so sánh giá trị giữa các nhóm với nhau. Với ví dụ trên, số lượng giao dịch từ người dùng mới tạo tài khoản (New User) cao gấp ba lần so với người dùng không tạo tài khoản (Guest), nhưng cả hai đều thấp hơn đáng kể so với số lượng giao dịch của người dùng hiện tại (Existing User).
Trong marketing và kinh doanh, một số chỉ số thường được biểu diễn dưới dạng biểu đồ cột có thể gặp như doanh số của từng sản phẩm qua các năm, giúp doanh nghiệp xác định sản phẩm nào đóng vai trò chủ chốt.
Bên cạnh đó, biểu đồ cột có thể dùng để đánh giá tỷ lệ tương tác (engagement rate) giữa các chiến dịch/các kênh tại cùng một thời điểm, hỗ trợ doanh nghiệp đánh giá hiệu suất marketing một cách toàn diện và dễ dàng hơn. Đây cũng là thế mạnh của biểu đồ cột khi vừa có thể hiển thị giá trị tại từng thời điểm cho các biến phân loại, vừa có thể giúp người đọc so sánh trực tiếp giữa chúng một cách trực quan.
Thời lượng trung bình một phiên của các kênh khác nhau (so sánh với cùng kỳ trước đó – phần màu xám).
Nguồn dữ liệu: Semrush
Cách biểu diễn
Để vẽ biểu đồ cột, trước hết, người biểu diễn cần lưu ý đến biến số ở 2 trục:
- Trục hoành thường thể hiện biến rời rạc như các thể loại/danh mục như quốc gia, ngành nghề… và đôi khi cũng có thể thể hiện các biến liên tục như thời gian.
- Trục tung là trục thể hiện giá trị (biến định lượng): đây là biến ghi nhận các dữ liệu số (numeric data), xác định chiều dài của mỗi cột.
Sau khi đã hiểu rõ về biến số ở 2 trục, ta thực hiện các bước tương tự như vẽ biểu đồ đường với cùng một bảng dữ liệu ở bài trước:
Bảng dữ liệu thô thống kê doanh thu theo quý của một công ty từ quý I/2018 đến quý IV/2022.
Nguồn dữ liệu: Brands Vietnam
- Bước 1: Xác định thông điệp mà biểu đồ muốn nhấn mạnh. Với bộ số liệu trên và đề bài biểu diễn doanh thu trong năm 2022, người biểu diễn muốn so sánh doanh thu giữa các khu vực theo từng quý hay so sánh doanh thu giữa các quý ở từng khu vực.
- Bước 2: Tạo trước biểu đồ mặc định của phần mềm đang được sử dụng để vẽ.
- Bước 3: Điều chỉnh cách sắp xếp các cột để người đọc dễ dàng nắm bắt thông tin quan trọng. Tương tự như trong bài về biểu đồ đường, sử dụng dữ liệu doanh thu của một công ty từ Quý I/2018 đến Quý IV/2022.
Trường hợp so sánh giữa các khu vực theo từng quý như sau, chúng ta có thể vẽ biểu đồ cột như sau:
Biểu đồ cột minh họa doanh thu năm 2022 và so sánh giữa các khu vực theo từng quý.
Nguồn dữ liệu: Brands Vietnam
Cách biểu diễn này giúp người đọc xác định khu vực Miền Trung có đóng góp doanh thu nhiều nhất ở mỗi Quý, đồng thời cho thấy quý I/2022 đóng góp đáng kể vào doanh thu của năm.
Trường hợp so sánh doanh thu giữa các quý ở từng khu vực, ta có thể đổi biến ở trục hoành thành biến phân loại các khu vực (Bắc – Trung – Nam) như sau:
Biểu đồ cột so sánh doanh thu giữa các quý năm 2022 ở từng khu vực.
Nguồn dữ liệu: Brands Vietnam
Khác với trường hợp 1, cách biểu diễn này sẽ cho người đọc biết từng khu vực có doanh thu nhiều nhất/ít nhất vào thời điểm nào, chẳng hạn miền Bắc có doanh thu cao nhất vào quý I, thấp nhất vào quý IV. Đồng thời, người đọc dễ dàng thấy khu vực Miền Trung đóng góp đáng kể vào tổng doanh thu năm 2022.
Đến đây, ắt hẳn bạn đọc sẽ thắc mắc rằng nếu biểu đồ cột vẫn minh họa sự thay đổi của 1 biến qua thời gian (sử dụng mốc thời gian làm biến số chính) – điều này khá tương đồng với biểu đồ đường. Vậy khi nào người biểu diễn nên sử dụng biểu đồ đường, khi nào nên sử dụng biểu đồ cột?
Để đưa ra lựa chọn phù hợp, chúng ta hãy quay về so sánh một số đặc điểm quan trọng của hai loại biểu đồ này một cách cô đọng:
Bảng so sánh một số đặc điểm quan trọng của biểu đồ đường và biểu đồ cột.
Nguồn: Brands Vietnam
Những lưu ý quan trọng
1. Phải biểu diễn từ 0
Khác với biểu đồ đường, khi biểu diễn biểu đồ cột, giá trị ở gốc phải bắt đầu từ 0. Đường cơ sở này không chỉ giúp người xem dễ dàng so sánh chiều dài các cột, mà còn đảm bảo tính chính xác của hình ảnh dữ liệu. Một biểu đồ cột bắt đầu với giá trị khác 0 hoặc có sự gián đoạn trong thang đo trục có thể làm sai lệch sự so sánh giữa các nhóm, vì tỷ lệ chiều dài cột lúc này sẽ không phản ánh đúng tỷ lệ giá trị thực tế.
Khi biểu diễn biểu đồ cột, giá trị ở gốc phải bắt đầu từ 0.
Nguồn dữ liệu: Atlassian
Chẳng hạn với biểu đồ trên, khi thay đổi giá trị ở gốc ở trục tung, bắt đầu từ 90, ta sẽ thấy dù giá trị của 2 cột chỉ cách nhau 4 điểm (96 và 92) nhưng việc thay đổi gốc trục tung khiến người xem cảm thấy sự chênh lệch bị phóng đại thành tỷ lệ 1:3.
2. Sắp xếp thứ tự cột hợp lý
Thông thường, nếu các cột không có thứ tự tự nhiên (như các tháng/quý trong năm), người biểu diễn nên sắp xếp các cột theo giá trị từ cao đến thấp (hoặc ngược lại) để người đọc dễ nắm bắt các thông tin quan trọng trong biểu đồ (biến có giá trị cao nhất, biến có giá trị thấp nhất…)
Nếu các cột không có thứ tự tự nhiên, người biểu diễn nên sắp xếp các cột theo giá trị từ cao đến thấp (hoặc ngược lại).
Nguồn dữ liệu: Ajelix
3. Sử dụng màu sắc có “ý đồ”
Một yếu tố khác cần cân nhắc là cách sử dụng màu sắc trong biểu đồ cột. Một số công cụ sẽ mặc định tô mỗi cột một màu khác nhau, nhưng điều này có thể gây xao lãng, hoặc khiến người đọc không hiểu ý chính đang được truyền tải qua biểu đồ. Thay vào đó, hãy sử dụng màu sắc có chủ đích hơn, làm nổi bật các cột cụ thể nhằm kể câu chuyện nhất định.
Người biểu diễn làm nổi bật số liệu của khách hàng A để diễn tả ý chính của biểu đồ tốt hơn.
Nguồn dữ liệu: Storytelling with Data
Những trường hợp sử dụng đặc biệt
1. Kết hợp với biểu đồ đường
Tương tự như đã chia sẻ ở bài viết về biểu đồ đường, biểu đồ kết hợp giữa đường (line) và cột (bar) hữu ích trong trường hợp người biểu diễn cần thể hiện cả xu hướng (trend) lẫn giá trị cụ thể.
2. Biểu đồ cột chồng (Stacked Bar chart)
Loại biểu đồ này giúp thể hiện tổng giá trị của một danh mục trong khi vẫn giữ được tỷ lệ đóng góp của các thành phần bên trong danh mục đó, thường dùng trong trường hợp có 2 biến định tính.
Biểu đồ cột chồng thể hiện tổng giá trị của một danh mục trong khi vẫn giữ được tỷ lệ đóng góp của các thành phần bên trong danh mục đó.
Nguồn dữ liệu: EXCELJET
Chẳng hạn biểu đồ này cho thấy xu hướng chung là doanh số tăng trưởng qua từng quý trong năm 2016, trong đó khu vực phía Tây thường chiếm tỷ trọng lớn nhất trong cả 4 quý, đặc biệt tăng mạnh ở Quý IV (74K).
Bên cạnh dạng cột chồng như trên, còn một dạng cột chồng thường gặp là 100% Stacked Bar chart, giúp so sánh tỷ lệ đóng góp giữa các biến.
Thị phần của các thiết bị tính toán (chia theo hệ điều hành) qua các năm.
Nguồn dữ liệu: Sol Messing
Với loại biểu đồ này, ta có thể theo dõi sự thay đổi thị phần của các thương hiệu theo thời gian, trong khi giá trị tổng của ba cột luôn là 100% (toàn thị trường). Dữ liệu cho thấy Apple, Google và Android đang dần chiếm thị phần từ Microsoft. Đến năm 2016, thị phần của Google đã vượt Microsoft, trong đó Apple cũng gần bắt kịp.
3. Biểu đồ cột chùm (grouped bar chart)
Tương tự, biểu đồ cột chùm cũng được dùng trong trường hợp có 2 biến định tính. Với biểu đồ này, các nhóm dữ liệu khác nhau được đặt cạnh nhau thay vì xếp chồng lên nhau. Mỗi nhóm chứa nhiều cột đại diện cho các danh mục con, giúp dễ dàng so sánh các giá trị của từng danh mục con trong cùng một nhóm. Bài tập vẽ biểu đồ doanh thu ở trên là một ví dụ điển hình của loại biểu đồ cột chùm.
Hoặc như biểu đồ dưới đây biểu diễn hai biến định tính chính là: Mối quan tâm của các hộ gia đình và biến thời gian (các quý trong năm 2023).
Biểu đồ cột chùm biểu diễn hai biến định tính chính: Mối quan tâm của các hộ gia đình và biến thời gian.
Nguồn dữ liệu: Kantar FMCG Monitor FY 2023
4. Kết hợp biểu đồ cột chồng và cột chùm (Stacked x Grouped)
Loại biểu đồ này hữu ích khi cần hiển thị dữ liệu với ba biến định tính, giúp thể hiện mối quan hệ giữa các nhóm dữ liệu một cách trực quan hơn.
Một trường hợp sử dụng biểu đồ này là khi cần thể hiện thị phần của nhiều kênh mua sắm theo từng ngành hàng qua thời gian. Dữ liệu có ba biến định tính gồm ngành hàng, kênh mua sắm, và thời gian.
Biểu đồ kết hợp biểu diễn dữ liệu có ba biến định tính gồm ngành hàng, kênh mua sắm, và thời gian.
Nguồn dữ liệu: Kantar Insight Handbook 2022
Ở ví dụ trên, ta có thể thấy người biểu diễn dùng kết hợp biểu đồ cột chùm và cột chồng để diễn tả thị phần của các kênh mua sắm theo từng ngành hàng qua thời gian, với ba biến định tính:
- Ngành hàng: FMCG/Nutrition Liquid Format/Non-Liquid Format
- Kênh mua sắm: Online/MT mom & baby shop/Minimarket…
- Thời gian (Moving Annual Total): MAT 19/MAT 20/MAT 21
Từ đó, người đọc có thể dễ dàng so sánh thị phần ở các kênh với nhau trong một ngành hàng và giữa các ngành hàng với nhau qua thời gian.
5. Biểu đồ phân phối (Histogram)
Đây là một dạng đặc biệt của biểu đồ cột dùng trong biểu diễn phân bố tần suất của một tập dữ liệu liên tục. Nó chia dữ liệu thành các khoảng (bins) và thể hiện số lần xuất hiện của các giá trị trong mỗi khoảng bằng chiều cao của cột. Vì vậy, Histogram có một số điểm khác biệt so với biểu đồ cột thông thường:
- Các cột liền kề nhau (không có khoảng trống) để thể hiện tính liên tục của dữ liệu.
- Trục hoành (X) biểu diễn các khoảng giá trị liên tục thay vì danh mục riêng lẻ như biểu đồ cột.
- Trục tung (Y) biểu diễn tần suất xuất hiện của dữ liệu trong từng khoảng.
Sự khác biệt giữa biểu đồ cột thông thường (bên trái) và biểu đồ phân phối (phải).
Nguồn dữ liệu: BYJU’S
Chẳng hạn, ta có một biểu đồ phân phối thời gian phản hồi khách hàng như sau:
Biểu đồ phân phối thời gian phản hồi khách hàng
Nguồn dữ liệu: Atlassian
Trong đó, trục tung luôn là biến tần suất của một mốc thời gian phản hồi cụ thể ở trục hoành. Từ biểu đồ trên, có thể thấy phần lớn thời gian phản hồi dưới 5 giờ và đây là biểu đồ phân bố lệch phải (right-skewed). Những nhận định này có ý nghĩa gì, chúng ta sẽ tìm hiểu ở bài viết đi sâu vào Histogram trong những số tiếp theo.
Tóm lại, biểu đồ cột là một trong những công cụ trực quan hóa dữ liệu phổ biến, giúp người dùng so sánh giá trị giữa các nhóm hoặc danh mục khác nhau một cách rõ ràng. Tuy nhiên, để đạt hiệu quả cao nhất, việc lựa chọn biểu đồ cột cần được cân nhắc dựa trên loại dữ liệu và mục tiêu phân tích.
Nếu cần so sánh giá trị giữa các danh mục riêng lẻ, biểu đồ cột tiêu chuẩn là phù hợp nhất. Nếu muốn so sánh sự đóng góp của các thành phần giữa các nhóm, biểu đồ cột chồng sẽ là lựa chọn tối ưu. Và khi cần kết hợp cả so sánh giữa nhóm và thành phần, biểu đồ cột kết hợp sẽ mang lại cái nhìn trực quan và toàn diện hơn.
Đây là series đào sâu cách sử dụng biểu đồ trong những bối cảnh khác nhau. Nếu bạn đọc có bất kỳ ví dụ minh họa hay biểu đồ cụ thể nào cần chuyên gia phân tích, hãy để lại bình luận cho Brands Vietnam nhé!
Bạn có thể xem lại các bài viết khác cùng chuyên mục tại đây.
Phương Quyên / Brands Vietnam
* Nguồn: Brands Vietnam