Các loại biểu đồ thống kê

Trong quy trình phân tích, một trong những trường hòa hợp ta cần suy nghĩ sự khác biệt về độ béo giữa những nhóm, chẳng hạn như sự khác biệt về dân sinh ở những thành phố không giống nhau hoặc chênh lệch doanh thu của những nhãn hiệu xe hơi khác nhau. Lúc đó, trực quan bởi loại biểu đồ phù hợp sẽ giúp diễn giải công dụng một cách cụ thể hơn. Theo tài liệu “Các phép tắc cơ bạn dạng về trực quan liêu hóa dữ liệu”, bố dạng biểu thiết bị thường được thực hiện để trình diễn độ mập của tài liệu là: biểu đồ vật thanh, biểu đồ điểm và phiên bản đồ nhiệt.

Bạn đang xem: Các loại biểu đồ thống kê

 

1. Biểu thiết bị thanh

Biểu vật thanh trình diễn một bí quyết trực quan tài liệu phân một số loại <1> với những thanh hình chữ nhật có chiều cao hoặc chiều dài tỷ lệ với những giá trị mà chúng đại diện. Các thanh có thể được vẽ theo theo hướng dọc hoặc chiều ngang. Để minh bạch 2 bề ngoài này, phần lớn tài liệu/phần mượt trực quan quy ước biểu đồ thanh dọc là Column Chart, biểu vật dụng thanh ngang là Bar Chart. Gồm 3 dạng hình biểu trang bị thanh thường xuyên gặp: biểu thứ thanh đơn áp dụng cho một trở thành phân loại, biểu thiết bị thanh đội (clustered) cùng biểu đồ dùng thanh xếp ông xã (stacked) vận dụng cho hai biến đổi phân loại.

Biểu vật dụng thanh đơn

Biểu đồ vật thanh đơn được thực hiện khi chỉ có một biến phân loại, từng thanh sẽ đại diện cho một đội nhóm cụ thể, chiều cao hoặc độ nhiều năm của mỗi thanh phần trăm với tổng các giá trị vào nhóm mà lại nó đại diện. Hình 1 màn trình diễn 10 quận/huyện có số dân cao nhất trên địa bàn tp.hồ chí minh năm 2019 theo 2 mẫu thiết kế biểu trang bị thanh dọc (a) với thanh ngang (b).

*

Hình 1. 10 quận/huyện gồm dân số cao nhất trên địa bàn tp.hcm năm 2019, được trực quan bởi 2 dạng biểu đồ gia dụng thanh(Nguồn dữ liệu: cục thống kê TP.HCM, 2020)

Bất nhắc biểu thứ dọc tuyệt ngang, ta mọi cần chú ý đến lắp thêm tự sắp đến xếp những thanh. Một số phần mượt vẽ biểu đồ có thể sắp xếp mặc định các thanh theo máy tự bảng chữ cái, theo chiều cao hoặc độ lâu năm thanh. Mà lại để biểu đồ trực quan cho tất cả những người xem, những thanh buộc phải được sắp xếp khớp ứng theo đặc điểm của trở nên phân một số loại mà nó thể hiện:

– biến đổi phân loại mang tính rời rộc rạc (ví dụ như quốc gia, thành phố, quận/huyện, …): biểu thứ thanh yêu cầu được thu xếp theo độ phệ thanh từ cao cho thấp (đối cùng với Column Chart) xuất xắc từ dài đến ngắn (đối cùng với Bar Chart) (Hình 1).

– biến phân loại mang tính tiếp tục hay tất cả thứ từ (ví dụ như theo chuỗi thời gian, theo độ tuổi, theo kích thước, …): biểu đồ dùng thanh phải được thu xếp theo vật dụng tự tăng hoặc giảm dần của đổi mới phân nhiều loại (Hình 2a). Lấy ví dụ trong Hình 2 về “Dân số thành phố hồ chí minh năm 2019 chia theo đội tuổi” mang lại thấy, việc thu xếp theo độ cao thanh trong những khi xáo trộn những nhóm tuổi không mang về nhiều ý nghĩa, khiến người xem khó định hình và rất dễ khiến nhầm lẫn (Hình 2b).

*

Hình 2. Dân số tp.hcm năm 2019 phân tách theo đội tuổi(Nguồn dữ liệu: viên thống kê TP.HCM, 2020)

Biểu trang bị thanh thường được các phần mềm trực quan phân chia tỷ lệ tự động để tất cả dữ liệu hiển thị một giải pháp hài hòa. Mặc dù nhiên, một trong những tình huống tương quan đến tính thẩm mỹ của biểu đồ vật như tên các nhóm phân nhiều loại quá dài trong khi bề ngang có giới hạn khiến cho phần mềm tự động hóa xoay tên team nằm nghiêng, gây cảm xúc khó đọc cho những người xem và chỉ chiếm nhiều diện tích hiển thị dưới biểu thiết bị (Hình 3). Phương án cho sự việc này là đưa dạng Column Chart về dạng Bar Chart như Hình 1b.

*

Hình 3. 10 quận/huyện tất cả dân số tối đa trên địa bàn thành phố hồ chí minh năm 2019 với thay đổi phân các loại quận/huyện ko đạt tính thẩm mỹ(Nguồn dữ liệu: cục thống kê TP.HCM, 2020)

Biểu thiết bị thanh nhóm (clustered)

Biểu vật thanh team được áp dụng để màn trình diễn cùng lúc 2 đổi mới phân loại trong một tập dữ liệu. Trong đó, các nhóm của một trở nên phân các loại được đặt giải pháp đều dọc từ trục x, toàn cục nhóm thuộc thay đổi phân loại sót lại được đặt ngay cạnh với nhau trong từng nhóm của vươn lên là phân các loại trước.

Chẳng hạn trong bộ dữ liệu tình trạng hôn nhân của không ít người trên 15 đến dưới 50 tuổi từ mối cung cấp Tổng điều tra dân số tại tp.hồ chí minh năm 2019, ta tất cả 2 đổi mới phân một số loại là “Tình trạng hôn nhân” (rời rạc) cùng “Nhóm tuổi” (liên tục):

• trong Hình 4a, team tuổi được hiển thị dọc theo trục x, đối với mỗi đội tuổi có 4 thanh tương ứng với chứng trạng hôn nhân. Thay đổi “Tình trạng hôn nhân” mang ý nghĩa rời rốc nên màu sắc được thực hiện theo thang color định tính.

• trong Hình 4b, tình trạng hôn nhân được hiển thị dọc từ trục x, so với mỗi tình trạng hôn nhân có 7 thanh khớp ứng với team tuổi. Vươn lên là “Nhóm tuổi” mang tính liên tục nên color được sử dụng theo thang color tuần tự.

Xem thêm: Tải Beach Head 2000 On Steam, Download Game Beach Head 2000

*

Hình 4. Dân số tp.hồ chí minh năm 2019 phân chia theo đội tuổi và phân chia theo triệu chứng hôn nhân, được trực quan bằng biểu đồ dùng thanh nhóm(Nguồn dữ liệu: viên thống kê TP.HCM, 2020)

Có thể thấy, Hình 4a sẽ cân xứng để khẳng định sự chênh lệch giữa các tình trạng hôn nhân gia đình trong một đội nhóm tuổi, dẫu vậy rất khó để so sánh con số giữa những nhóm tuổi cho một đội nhóm tình trạng hôn nhân nhất định. Ngược lại, Hình 4b có thể giải quyết được yếu điểm trên, mặc dù nhiên, do đến 7 đội tuổi yêu cầu rất cạnh tranh để khẳng định nhanh đội tuổi làm sao chiếm con số lớn nhất. Vì đó, trong trường hòa hợp có không ít nhãn trong vươn lên là phân loại, ta yêu cầu chuyển trường đoản cú biểu đồ nhóm thành những biểu trang bị thanh đối chọi để diễn giải kết quả một cách trực quan hơn (Hình 5).

*

Hình 5. Dân số thành phố hồ chí minh năm 2019 phân tách theo đội tuổi và chia theo chứng trạng hôn nhân, được trực quan bởi biểu đồ dùng thanh đơn(Nguồn dữ liệu: viên thống kê TP.HCM, 2020)

Biểu vật dụng thanh chồng (stacked)

Biểu vật dụng thanh ông chồng cũng được áp dụng để màn biểu diễn cùng dịp 2 đổi mới phân các loại trong một tập dữ liệu. Khác với biểu trang bị thanh đội có các thanh đặt cạnh bên nhau, biểu đồ vật thanh ông chồng đặt các thanh xếp ông chồng lên nhau (Hình 6).

*

Hình 6. Dân số thành phố hồ chí minh năm 2019 chia theo đội tuổi và phân tách theo tình trạng hôn nhân, được trực quan bởi biểu đồ thanh chồng(Nguồn dữ liệu: viên thống kê TP.HCM, 2020)

Ngoài ra, biểu vật dụng thanh ông chồng có thể được trực quan lại theo xác suất % của mỗi cực hiếm trên tổng số trong từng nhóm, được gọi là biểu thiết bị thanh ck 100% (100% stacked chart). Dạng biểu đồ này đã được giới thiệu trong bài viết Trực quan hóa dữ liệu – Phần 4: các dạng biểu vật dụng thể hiện xác suất của dữ liệu.

Biểu trang bị thanh chồng cân xứng với mục đích so sánh tổng quý hiếm giữa những nhóm (ví dụ Hình 6a, đối chiếu tổng số bạn theo từng nhóm tuổi), nhưng thỉnh thoảng khó đạt sự riêng biệt khi hy vọng so sánh những giá trị không giống nhau trong cùng một tổ (ví dụ Hình 6b, độ dài các thanh ở team “Có vợ/chồng” phân tách theo từng team tuổi gồm độ dài gần như là xấp xỉ bằng nhau).

 

2. Biểu thiết bị điểm

Biểu đồ gia dụng điểm sử dụng dấu chấm để màn biểu diễn vị trí của những giá trị dữ liệu. Biểu đồ vật điểm được sử dụng phổ cập để trình diễn phân phối của một biến thường xuyên hay sự phân cụm trong một tập dữ liệu. Trong màn biểu diễn độ khủng của dữ liệu, biểu đồ vật thanh phải ban đầu từ cực hiếm 0 nhằm chiều nhiều năm thanh xác suất với con số hiển thị. Mặc dù nhiên, với một vài bộ dữ liệu, những thanh đôi khi quá dài và tất cả chúng đều có chiều dài gần như nhau, khiến biểu đồ dùng không truyền tải được chân thành và ý nghĩa (Hình 7). Bởi vì đó, biểu thứ điểm được sử dụng để thay thế biểu thứ thanh trong trường hợp này.

*

Hình 7. Tuổi thọ vừa phải các giang sơn châu Mỹ năm 2007, được trực quan bằng biểu trang bị thanh (Wike, 2019)

Bằng cách áp dụng biểu đồ gia dụng điểm, ta rất có thể giới hạn phạm vi trục trong khoảng từ 60 mang lại 81 tuổi để biểu diễn cụ thể hơn ý nghĩa của tập tài liệu (Hình 8). Canada bao gồm tuổi lâu trung bình cao nhất trong số toàn bộ các giang sơn được liệt kê, còn Bolivia với Haiti gồm tuổi thọ trung bình thấp hơn các so với toàn bộ các tổ quốc khác. Ngoài ra, sự chênh lệch tuổi lâu trung bình thân các giang sơn như Jamaica, Brazil, Dominican Republic cũng hiển thị rõ ràng và dễ nhận ra hơn đối với biểu vật dụng thanh trong Hình 7.

*

Hình 8. Tuổi thọ trung bình các tổ quốc châu Mỹ năm 2007, được trực quan bởi biểu thứ điểm (Wike, 2019)

 

3. Phiên bản đồ sức nóng (Heatmap)

Bản đồ nhiệt là 1 kỹ thuật trực quan hóa diễn đạt độ mập của dữ liệu dưới dạng color trong nhì chiều. Trong biểu diễn độ khủng của dữ liệu, bản đồ nhiệt được áp dụng để thay thế sửa chữa biểu đồ thanh trong trường hợp bao gồm 2 vươn lên là phân loại, gồm một biến tách rạc với 1 biến liên tiếp (thường theo chuỗi thời gian). Vào đó, con số nhóm trong mỗi biến phân các loại quá nhiều, khiến việc trình diễn bằng biểu vật thanh nhóm hoặc biểu đồ dùng thanh ông xã trở phải không phù hợp. Mỗi giá bán trị dữ liệu trên bản đồ nhiệt độ được biểu diễn trong một ma trận với cùng 1 màu sệt trưng. Thông thường, quý hiếm thấp hiển thị ở tông màu lạnh với dần chuyển đổi qua tông màu nền nóng khi có mức giá trị cao hơn.

Hình 9 màn biểu diễn trực quan tiền tập dữ liệu về lượng khí thải CO2 trên 15 quốc gia trong vòng 15 năm. Tuy vậy cách trực quan tiền này gây trở ngại trong việc xác định đúng đắn giá trị dữ liệu, dẫu vậy nó cho biết một tầm nhìn tổng quan ngay mau chóng về xu hướng giảm lượng khí thải CO2 từ thời điểm năm 2000 mang đến năm 2014 tại 3 non sông (Mỹ, Úc, Canada).

*

Hình 9. Lượng khí thải CO2 tại 15 nước từ năm 2000 đến năm 2014, được trực quan liêu bằng bản đồ nhiệt tổng quát(Nguồn dữ liệu: Kaggle.com)

Hình 10 biểu diễn trực quan lại tập dữ liệu về lượng khí thải CO2 trên 15 non sông với số liệu chi tiết theo năm và theo quốc gia. Phương pháp hiển thị này tuy vậy phức tạp rộng so cùng với Hình 11, tuy nhiên nó có thể bổ sung cập nhật thêm cho các phân tích sâu, khi người xem mong mỏi biết đúng đắn các quý hiếm hiển thị tương ứng với từng màu sắc trên biểu đồ.

*

Hình 10. Lượng khí thải CO2 tại 15 nước từ năm 2000 mang đến năm 2014, được trực quan lại bằng phiên bản đồ nhiệt độ với số liệu chi tiết(Nguồn dữ liệu: Kaggle.com)

 

Duy quý phái tổng hợp

Chú thích:<1> dữ liệu phân loại (categorical data) là một trong những nhóm dữ liệu/danh mục (thường là dữ liệu định tính) được phân tạo thành các đội rời rạc, chẳng hạn như các tháng vào năm, đội tuổi, quốc gia, đụng vật, …

 

----------------------------------------

Tài liệu tham khảo:

– Aleksova. (2019). Who is responsible for global warming? Retrieved from Kaggle: https://www.kaggle.com/catamount11/who-is-responsible-for-global-warming/data– viên Thống kê TP.HCM. (2020). Hoàn cảnh dân số qua Tổng điều tra dân số cùng nhà ở thời gian 0 giờ đồng hồ ngày 01 tháng tư năm 2019. TP.HCM: cục Thống kê TP.HCM.– Wike. (2019). Fundamentals of Data Visualization. Sebastopol: O’Reilly Media.– Wikipedia. (2021, November 8). Bar chart. Retrieved from Wikipedia: https://en.wikipedia.org/wiki/Bar_chart

 

----------------------------------------

Trực quan tiền hóa tài liệu – Phần 1: Tổng quan tiền về biểu đồ

Trực quan hóa dữ liệu – Phần 2: Tổng quan liêu về hệ trục tọa độ

Trực quan tiền hóa tài liệu – Phần 4: một số dạng biểu thiết bị thể hiện phần trăm của dữ liệu

 

---------------------------------------------------------------------------------------------------

QUÝ ANH/CHỊ CẦN HỖ TRỢ XỬ LÝ, PHÂN TÍCH DỮ LIỆU VUI LÒNG GỬI THÔNG TIN QUA form DƯỚI ĐÂYCHÚNG TÔI SẼ LIÊN HỆ VÀ PHÚC ĐÁP vào THỜI GIAN SỚM NHẤT