Marketer Phương Quyên
Phương Quyên

Content Executive @ Brands Vietnam

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

 Nội dung chính

Định nghĩa
Cách biểu diễn
Những lưu ý khi sử dụng biểu đồ đường
- 1. Chọn những khoảng đo lường và mốc đo lường phù hợp
- 2. Đừng để quá nhiều đường chồng chéo lên nhau
- 3. Những trường hợp sử dụng đặc biệt

Biểu đồ đường là một trong những công cụ trực quan hóa dữ liệu phổ biến, sử dụng các điểm kết nối bằng đoạn thẳng từ trái sang phải để thể hiện sự thay đổi của giá trị. Để khai thác hiệu quả loại biểu đồ này, bạn cần hiểu rõ từ khái niệm, cách dựng, đến các lưu ý khi sử dụng và những ứng dụng nâng cao trong thực tế.

Trong thời đại dữ liệu lên ngôi, việc hiểu và “đọc” được dữ liệu không chỉ là lợi thế mà còn là kỹ năng thiết yếu trong nhiều lĩnh vực – từ kinh doanh, marketing cho đến vận hành hay phân tích người dùng. Tuy nhiên, dữ liệu thô sẽ mãi chỉ là những con số rời rạc nếu không được trình bày một cách trực quan, dễ hiểu và truyền tải đúng thông điệp. Đây chính là lúc các công cụ trực quan hóa dữ liệu (data visualization) phát huy sức mạnh.

Data Visualization là series được phát triển nhằm cung cấp các bối cảnh sử dụng những loại biểu đồ phổ biến và những biểu đồ phức tạp để phục vụ việc đọc - hiểu thông tin quan trọng từ dữ liệu. Bằng cách kết hợp giữa chia sẻ góc nhìn chuyên gia và các ví dụ/bài tập cụ thể, series hy vọng các bạn có thể thành thạo việc “tạo hình” data hơn.

Định nghĩa

Biểu đồ đường (hay còn gọi là line plot, line chart) sử dụng các điểm kết nối bằng đoạn thẳng từ trái sang phải để thể hiện sự thay đổi của giá trị. Về mặt cấu trúc, trục tung của biểu đồ thường thể hiện giá trị của biến định lượng, trong khi trục hoành thể hiện các biến phân loại hoặc danh mục (biến định tính liên tục, chẳng hạn như thời gian như phút, giờ, ngày, tuần, hoặc tháng, hoặc biến rời rạc, như các nhóm phân loại khác nhau).

Biểu đồ dưới đây mô tả giá trị của tổng doanh thu kiếm được từ tất cả các giao dịch đã hoàn tất so với doanh thu bị mất mỗi tháng trong năm 2023. Người đọc có thể quan sát sự biến động của tổng doanh thu và doanh thu bị mất trong khoảng thời gian quan sát, xác định các tháng có mức doanh thu cao nhất và thấp nhất cùng với tỷ lệ giữa hai biến định lượng này.

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Biểu đồ mô tả giá trị của tổng doanh thu kiếm được từ tất cả các giao dịch đã hoàn tất so với doanh thu bị mất mỗi tháng trong năm 2023.
Nguồn dữ liệu: Bold BI

Trong lĩnh vực kinh doanh và marketing, biểu đồ đường tương đối phổ biến. Doanh nghiệp có thể dùng biểu đồ này để theo dõi doanh số qua thời gian, theo quý hoặc tháng. Hoặc doanh nghiệp có thể dùng biểu đồ đường để so sánh nhiều chủ thể của cùng 1 biến qua thời gian gian như theo dõi doanh thu giữa các khu vực khác nhau.

Đơn cử như biểu đồ dưới đây, người đọc có thể nhận diện xu hướng tăng trưởng hoặc suy giảm doanh thu của từng khu vực theo từng quý. Điều này giúp đánh giá hiệu suất kinh doanh dài hạn.

Ngoài ra, biểu đồ cũng cung cấp bức tranh tổng quan về tình hình kinh doanh từng khu vực, từ tốc độ tăng trưởng, xu hướng (biến động theo mùa vụ hay ổn định qua thời gian). Nếu một khu vực liên tục có doanh thu vượt trội, đó có thể là thị trường trọng điểm. Ngược lại, khu vực có doanh thu thấp có thể cần chiến lược cải thiện.

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Biểu đồ doanh thu theo quý của từng khu vực trong 5 năm.
Nguồn dữ liệu: Brands Vietnam

Bên cạnh đó, biểu đồ đường còn được ứng dụng trong việc theo dõi các chỉ số trên website/ứng dụng của doanh nghiệp như lượng truy cập website thông qua Google Analytics 4 (GA4) hoặc biểu diễn tỷ lệ giữ chân khách hàng (Retention Rate), bắt đầu từ cột mốc ngày đầu tiên.

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Theo dõi traffic website bằng biểu đồ đường trên Google Analytics 4.
Nguồn dữ liệu: Victorious

Cách biểu diễn

Biểu đồ đường thường được sử dụng khi cần nhấn mạnh sự thay đổi giá trị của một biến (trục tung) theo giá trị liên tục của một biến khác (trục hoành), qua đó giúp người đọc nắm bắt được những xu hướng chính của biến đang được biểu diễn.

Để vẽ biểu đồ đường, dữ liệu cần được tổng hợp thành một bảng có hai hoặc nhiều cột. Các giá trị trong cột đầu tiên biểu thị vị trí của các điểm trên trục hoành cho mỗi đường được vẽ. Mỗi cột tiếp theo biểu thị vị trí trên trục tung cho các điểm của một đường duy nhất.

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Bảng dữ liệu thô thống kê doanh thu theo quý của một công ty từ quý I/2018 đến quý IV/2022.
Nguồn dữ liệu: Brands Vietnam

Giả sử với bảng dữ liệu thô thống kê doanh thu theo quý của một công ty từ quý I/2018 đến quý IV/2022 như trên, để xây dựng biểu đồ trực quan, dễ đọc, ta có thể thực hiện theo ba bước:

  • Bước 1: Trước khi dựng biểu đồ, cần làm rõ mục đích thể hiện, cần nhấn mạnh xu hướng dài hạn, sự biến động theo thời gian hay so sánh giữa các nhóm dữ liệu? Trong trường hợp này, giả sử ta cần thể hiện xu hướng biến động của tổng doanh thu qua từng quý. Vì vậy, ta sẽ sử dụng cột “Quý” làm cột giá trị của trục hoành, và cột “Doanh thu từng quý (Triệu VND)” làm cột giá trị cho trục tung.
  • Bước 2: Tạo trước biểu đồ mặc định của phần mềm đang được sử dụng để vẽ. Việc bắt đầu với biểu đồ có sẵn sẽ giúp người biểu diễn có cái nhìn tổng quan trước khi điều chỉnh chi tiết.
  • Bước 3: Điều chỉnh khoảng giá trị và mốc trục sao cho phù hợp với thông điệp muốn thể hiện. Việc chia khoảng trên trục tung (trục Y) hợp lý giúp biểu đồ dễ đọc, trực quan và phản ánh đúng xu hướng dữ liệu. Với các giá trị ở trục tung, ta sẽ dựa vào độ chênh lệch trung bình giữa các giá trị qua thời gian và thường lấy giá trị làm tròn để dễ đọc.

Trường hợp giá trị lớn nhất của tập dữ liệu lớn hơn hoặc bằng 3 lần giá trị nhỏ nhất, ta có thể chọn khoảng chia gần với giá trị nhỏ nhất. Điều này giúp giữ khoảng cách giữa các mức giá trị trên trục tung hợp lý. Chẳng hạn trong ví dụ trên, bảng dữ liệu có giá trị nhỏ nhất khoảng 24,000 và giá trị lớn nhất khoảng 122,000.

Vì 122,000 lớn gần gấp 5 lần 24,000, ta có thể chọn khoảng chia trên trục tung cách nhau 20,000 – giá trị làm tròn xuống và gần với 24,000 nhất. Từ đó, được biểu đồ như sau:

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Biểu đồ tổng doanh thu theo quý giai đoạn 2018-2022.
Nguồn dữ liệu: Brands Vietnam

Nếu khoảng cách giữa giá trị nhỏ nhất và giá trị lớn nhất không quá lớn, chênh lệch ít hơn 3 lần, việc chia khoảng theo cách trên có thể khiến người đọc khó trích xuất thông tin chính của biểu đồ. Khi đó, ta có thể dựa trên giá trị lớn nhất của dữ liệu, sau đó chia thành 5-7 khoảng để đảm bảo tính trực quan.

Tuy nhiên, việc chia khoảng cần linh hoạt để đảm bảo biểu đồ truyền tải đúng thông điệp quan trọng nhất, thay vì cứng nhắc theo một công thức cố định. Những nguyên tắc trên chỉ mang tính tham khảo, giúp bạn lựa chọn cách thể hiện phù hợp với từng trường hợp cụ thể.

Những lưu ý khi sử dụng biểu đồ đường

1. Chọn những khoảng đo lường và mốc đo lường phù hợp

Như đã đề cập ở bước 3 trong quá trình dựng biểu đồ, một yếu tố quan trọng cần lưu ý là kích thước khoảng (bin size) trên trục tung, bởi trục hoành đã được xác định là các biến phân loại/thời gian theo từng mốc (quý/tháng/năm). Ngoài ra, việc lựa chọn gốc tọa độ trên trục tung cũng quan trọng không kém và phụ thuộc vào mục đích phân tích dữ liệu. Chẳng hạn:

  • Nếu muốn quan sát xu hướng dài hạn, việc chọn gốc 0 (như biểu đồ bên trái) giúp thể hiện tổng thể xu hướng biến động của dữ liệu. Trong trường hợp này, có thể nhận thấy mức tăng trưởng tổng quan trong giai đoạn quan sát, với mức dao động dần ổn định hơn khi tiến gần đến tháng 9/2020.
  • Ngược lại, nếu chọn một gốc tọa độ khác 0 (ví dụ, bắt đầu từ 0.75 như biểu đồ bên phải), biểu đồ sẽ nhấn mạnh hơn vào những biến động nhỏ trong từng giai đoạn. Điều này giúp người xem dễ dàng nhận diện các thay đổi ngắn hạn, chẳng hạn như sự chênh lệch rõ rệt giữa tháng 3/2019 và tháng 5/2019.

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Việc lựa chọn khoảng đo lường và mốc đo lường trên trục tung phụ thuộc vào mục đích phân tích dữ liệu.
Nguồn dữ liệu: Atlassian

Do đó, tùy vào mục đích trực quan hóa dữ liệu, người thực hiện cần cân nhắc lựa chọn mốc đo lường phù hợp để truyền tải thông tin một cách hiệu quả nhất. Khi chọn giá trị làm mốc cho trục tung (hoặc trục y) cần chú ý một số yếu tố để đảm bảo tính trực quan và cân đối cho biểu đồ.

Trước tiên, cần xác định giá trị thấp nhất và cao nhất của biến số trên trục tung. Việc này giúp nắm rõ phạm vi dao động của dữ liệu để chọn mốc phù hợp.

Sau đó, người biểu diễn cần tính toán khoảng cách từ giá trị thấp nhất đến mốc và khoảng cách từ giá trị cao nhất đến đỉnh trục tung. Đây là bước quan trọng để đảm bảo rằng các đường trong biểu đồ không nằm quá thấp hay “đụng trần” biểu đồ.

Cuối cùng, tiến hành điều chỉnh mốc để cân bằng bố cục giữa các điểm dữ liệu và các biên giới trên trục tung. Các đường biểu diễn sẽ không bị quá dày hay quá thưa trên trục y, giúp người đọc dễ dàng theo dõi xu hướng của dữ liệu.

Chẳng hạn với bảng dữ liệu mẫu ở phần vẽ biểu đồ, khi thêm dữ liệu doanh thu từng miền vào, người biểu diễn cần điều chỉnh lại khoảng trên trục tung để phản ánh chính xác sự phân bố dữ liệu vì doanh thu từng miền có thể chênh lệch đáng kể so với tổng 3 miền.

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Biểu đồ tổng doanh thu theo quý của từng khu vực.
Nguồn dữ liệu: Brands Vietnam

2. Đừng để quá nhiều đường chồng chéo lên nhau

Mặc dù biểu đồ đường có thể dùng để biểu diễn nhiều đường (nhiều biến), người biểu diễn nên hạn chế số lượng ở mức mà người đọc không gặp khó khăn trong việc nắm bắt xu hướng của một biến cụ thể. Nếu cần hiển thị nhiều đường hơn, hãy chia nhỏ thành các biểu đồ riêng biệt hoặc sử dụng công cụ tương tác để làm nổi bật từng đường.

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Doanh số xe hơi ở 15 khu vực được thể hiện trên cùng một biểu đồ.
Nguồn dữ liệu: Storytelling with Data

Với những biểu đồ có nhiều đường chồng chéo như trên, hầu như rất khó để người đọc quan sát xu hướng hay giá trị của bất kỳ biến nào. Vì vậy, người biểu diễn hãy mạnh dạn loại bỏ các đường kém quan trọng và làm nổi bật dữ liệu chính để biểu đồ rõ ràng, dễ đọc hơn.

3. Những trường hợp sử dụng đặc biệt

3.1. Sử dụng biểu đồ đường có 2 trục tung

Trong một số trường hợp, việc sử dụng biểu đồ đường 2 trục tung có thể giúp biểu diễn giá trị của hai biến có liên quan đến nhau trên cùng một biểu đồ. Từ đó, người đọc có thể dễ dàng quan sát, so sánh các giá trị này với nhau:

  • Trường hợp 1: Hai biến cần biểu diễn có đơn vị tính khác nhau. Ví dụ, tần suất giao dịch (đơn vị: số giao dịch) và chi tiêu trung bình mỗi giao dịch (đơn vị: tiền tệ). Việc sử dụng hai trục tung riêng biệt sẽ giúp người xem thấy rõ mối liên kết giữa hai biến này (tỷ lệ thuận – tỷ lệ nghịch). Hoặc như ví dụ của biểu đồ dưới đây đang minh họa cho hai biến là số lượng hàng bán ra ở mỗi dòng sản phẩmlợi nhuận ở mỗi dòng sản phẩm.

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Sử dụng biểu đồ đường có 2 trục tung khi hai biến cần biểu diễn có đơn vị tính khác nhau.
Nguồn dữ liệu: Inforiver

  • Trường hợp 2: Hai biến có cùng đơn vị tính nhưng giá trị dao động khác nhau đáng kể. Ví dụ, nếu so sánh số lượng người dùng dùng thử dịch vụ hàng tuần (Trials) so với số lượng người dùng trả phí (Subscription) hàng tuần, người biểu diễn có thể sử dụng hai trục tung để cùng lúc quan sát thay đổi và xu hướng của từng biến.

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Sử dụng biểu đồ đường có 2 trục tung khi hai biến có cùng đơn vị tính nhưng giá trị dao động khác nhau đáng kể.
Nguồn dữ liệu: Atlassian

3.2. Kết hợp với biểu đồ cột

Biểu đồ kết hợp giữa đường (line) và cột (bar) hữu ích trong trường hợp người biểu diễn cần thể hiện cả xu hướng (trend) lẫn giá trị cụ thể.

3.3. Thay thế Histogram

Trong nhiều trường hợp, đồ thị đường (Line Chart) có thể được sử dụng thay cho biểu đồ cột (Histogram) để minh họa phân phối tần suất của dữ liệu. Đồ thị này được gọi là đồ thị đa giác tần suất (Frequency Polygon). Thay vì sử dụng các cột, đồ thị được vẽ bằng cách nối các điểm, mỗi điểm đại diện cho giá trị tần số trên trục tung.

Đơn cử như việc dùng biểu đồ đường để thống kê phân phối tần suất của thời gian xử lý đơn hàng (phút) và số lượng đơn hàng hoàn thành, phân theo hai nhóm: Khách hàng thường xuyên và Khách hàng mới.

Data Visualization #1: Line Chart – Hướng dẫn toàn diện về biểu đồ đường

Sử dụng biểu đồ đường để thống kê phân phối tần suất của thời gian xử lý đơn hàng (phút) và số lượng đơn hàng hoàn thành.
Nguồn dữ liệu: Brands Vietnam

Biểu đồ này sẽ giúp doanh nghiệp thống kê được tốc độ xử lý đơn với số lượng hoàn thiện đơn hàng giữa hai tệp khách hàng mới. Từ đó, doanh nghiệp có thể tối ưu hóa quá trình vận hành để cải thiện hiệu suất. Nếu sử dụng biểu đồ phân phối, ta sẽ cần vẽ 2 biểu đồ nếu muốn so sánh giữa hai tệp khách hàng. Vì vậy, biểu đồ đường lúc này là một lựa chọn phù hợp đúc kết các thông tin quan trọng.

Nhìn chung, biểu đồ đường là công cụ lý tưởng để thể hiện biến động theo thời gian hoặc các chuỗi liên tục, giúp người dùng dễ dàng nhận diện xu hướng và so sánh sự thay đổi giữa các nhóm dữ liệu. Tuy nhiên, để tối ưu hóa khả năng truyền tải thông tin, người biểu diễn cần hiểu cách thiết lập mốc đo lường, cân đối số lượng đường biểu diễn phù hợp và nắm bắt các trường hợp sử dụng đặc biệt.

★★★

Đây là series đào sâu cách sử dụng biểu đồ trong những bối cảnh khác nhau. Nếu bạn đọc có bất kỳ ví dụ minh họa hay biểu đồ cụ thể nào cần chuyên gia phân tích, hãy để lại bình luận cho Brands Vietnam nhé!

Phương Quyên / Brands Vietnam
* Nguồn: Brands Vietnam