Tổng Quan Về Tính Toán Các Chỉ Số Thống Kê đối Với Hàng Và Cột
Có thể bạn quan tâm
Hotline: 098 821 7749 [email protected] Facebook Google+ Twitter Youtube
Danh mục Phần mềm giám sát mạng Phần mềm logistics Phần mềm giáo dục Phần mềm marketing Phần mềm điều khiển PC từ xa Phần mềm thiết kế trang sức Phần mềm báo chí, xuất bản Phần mềm tối ưu cắt vật liệu Phần mềm tiện ích văn phòng Phần mềm xử lý file .PDF Phần mềm quản lý chất lượng Phần mềm vẽ bản đồ Phần mềm lập trình Phần mềm sao lưu dữ liệu Phần mềm mã vạch Phần mềm xử lý âm thanh Phần mềm phát video trực tiếp (live stream) Phần mềm chỉnh sửa video Phần mềm thêu, may mặc Phần mềm đồ họa Phần mềm kiến trúc, xây dựng Phần mềm vẽ kỹ thuật, CAD Phần mềm bảo mật Phần mềm diệt Virus Phần mềm cơ sở dữ liệu Phần mềm gia công cơ khí Hệ điều hành Phần mềm giám sát nhân viên Phần mềm quản lý email Phần mềm Hóa dược, Sinh học Phần mềm quản lý máy in Phần mềm trí tuệ nhân tạo (AI) Phần mềm thống kê Phần mềm thiết kế giao diện Phần mềm Microsoft Office Phần mềm điều tra số Phần mềm Adobe Phần mềm họp video trực tuyến Phần mềm ảo hóa Phần mềm thiết kế PCB/SMT Hardware SMS Gateway TCP/IP Data Terminal Tìm kiếm Hướng dẫn mua hàng Bản đồ
Row Statistics Sử dụng Thống kê hàng “Row Statistics” để tính toán và lưu trữ các chỉ số thống kê mô tả được chỉ định, chẳng hạn như giá trị trung bình, cho mỗi hàng dữ liệu trong các cột được chỉ định. Ví dụ, một kỹ sư chất lượng ghi lại số lượng các bộ phận bị loại bỏ được sản xuất bởi mỗi trong ba máy trong mỗi ca làm việc. Kỹ sư chất lượng tính toán tổng các bộ phận bị loại từ mỗi máy trong các ca làm việc và lưu trữ chúng trong cột Tổng “Sum”.
Tìm các lệnh này ở đâu Để tính toán các chỉ số thống kê theo cột, hãy chọn Calc > Column Statistics. Để tính toán các chỉ số thống kê theo hàng, hãy chọn Calc > Row Statistics. Khi nào sử dụng lệnh thay thế Để tính toán nhiều chỉ số thống kê mô tả cho một hoặc nhiều cột, hãy sử dụng tính năng Display Descriptive. 2. Chọn lựa chỉ số thống kê cần tính toán cho hàng hoặc cột Chọn Calc > Column Statistics hoặc Calc > Row Statistics, sau đó chọn một trong các chỉ số thống kê để tính toán bên dưới:
Như vây, trung bình một khách hàng chờ đợi 2,4 phút để được phục vụ tại ngân hàng. Diễn giải Sử dụng giá trị trung bình “Mean” để mô tả mẫu với một giá trị duy nhất đại diện cho trung tâm của dữ liệu. Nhiều phân tích thống kê sử dụng giá trị trung bình như một thước đo tiêu chuẩn cho trung tâm của sự phân phối dữ liệu. Giá trị trung vị “Median” và giá trị trung bình “Mean” đều đo lường xu hướng trung tâm. Nhưng các giá trị bất thường, được gọi là giá trị ngoại lai, có thể ảnh hưởng đến giá trị trung vị “Median” ít hơn so với chúng ảnh hưởng đến giá trị trung bình “Mean”. Nếu dữ liệu của bạn là đối xứng, giá trị trung bình và giá trị trung vị là tương tự.
Dữ liệu phân bố đối xứng (Symmetric)
Dữ liệu phân bố bất đối xứng (Not Symmetric) Đối với phân phối đối xứng, giá trị trung bình “Mean” (đường màu xanh) và trung vị “Median” (đường màu cam) giống nhau đến mức bạn không thể dễ dàng nhìn thấy cả hai đường. Nhưng nếu dữ liệu phân bố không đối xứng, bạn sẽ nhìn thấy hai đường này này tách biệt. StDev Độ lệch chuẩn “StDev” là thước đo phổ biến nhất của độ phân tán, hoặc mức độ trải rộng của dữ liệu so với giá trị trung bình “Mean”. Ký hiệu σ (sigma) thường được sử dụng để biểu thị độ lệch chuẩn của một tập hợp “standard deviation of a population”, trong khi s được dùng để biểu thị độ lệch chuẩn của một mẫu “standard deviation of a sample”. Sự thay đổi ngẫu nhiên hoặc tự nhiên của một quá trình thường được gọi là nhiễu “Noise”. Bởi vì độ lệch chuẩn có cùng đơn vị với dữ liệu, nó thường dễ hiểu hơn phương sai “variance”. Diễn giải Sử dụng độ lệch chuẩn để xác định mức độ trải rộng của dữ liệu so với giá trị trung bình. Giá trị độ lệch chuẩn cao hơn cho thấy mức độ lan truyền dữ liệu lớn hơn. Một nguyên tắc chung cho phân phối chuẩn “Normal distribution” là khoảng 68% giá trị nằm trong một độ lệch chuẩn của giá trị trung bình, 95% giá trị nằm trong hai độ lệch chuẩn và 99,7% giá trị nằm trong ba độ lệch chuẩn. Độ lệch chuẩn cũng có thể được sử dụng để thiết lập một điểm chuẩn để ước tính sự thay đổi tổng thể của một quá trình.
Bệnh viện 1
Bệnh viện 2 Thời gian xuất viện Quản trị viên theo dõi thời gian làm thủ tục xuất viện của các bệnh nhân đang điều trị tại khoa cấp cứu của hai bệnh viện. Mặc dù thời gian làm thủ tục xuất viện trung bình là như nhau (35 phút), nhưng độ lệch chuẩn là khác nhau đáng kể. Độ lệch chuẩn của bệnh viện 1 là khoảng 6 phút. Trung bình, thời gian xuất viện của một bệnh nhân lệch so với giá trị trung bình (đường nét đứt màu đỏ) khoảng 6 phút. Độ lệch chuẩn của bệnh viện 2 là khoảng 20 phút. Trung bình, thời gian xuất viện của một bệnh nhân lệch so với giá trị trung bình (đường nét đứt màu đỏ) khoảng 20 phút. Minimum Giá trị nhỏ nhất “Minimum” là giá trị dữ liệu nhỏ nhất. Trong những dữ liệu này, giá trị nhỏ nhất là 7.
Diễn giải Sử dụng giá trị nhỏ nhất “Minimum” để xác định lỗi ngoại lệ có thể xảy ra hoặc lỗi nhập dữ liệu. Một trong những cách đơn giản nhất để đánh giá mức độ lan truyền dữ liệu của bạn là so sánh giá trị nhỏ nhất “Minimum” và giá trị lớn nhất “Maximum”. Nếu giá trị nhỏ nhất rất thấp, ngay cả khi bạn xem xét trung tâm, độ lan truyền và hình dạng của dữ liệu, hãy điều tra nguyên nhân của giá trị cực trị “extreme value”. Range Phạm vi “Range” là sự khác biệt giữa giá trị dữ liệu lớn nhất “Maximum” và nhỏ nhất “Minimum” trong mẫu “Sample”. Phạm vi đại diện cho khoảng có chứa tất cả các giá trị dữ liệu. Diễn giải Sử dụng phạm vi “Range” để hiểu mức độ phân tán trong dữ liệu. Giá trị phạm vi lớn cho biết dữ liệu có độ phân tán lớn hơn. Giá trị phạm vi nhỏ chỉ ra rằng dữ liệu ít bị phân tán hơn. Bởi vì phạm vi được tính toán chỉ bằng cách sử dụng hai giá trị dữ liệu, nó hữu ích hơn khi xem xét với các tập dữ liệu nhỏ. Median Trung vị “Median” là điểm giữa của tập dữ liệu. Giá trị điểm giữa này là điểm mà tại đó một nửa số quan sát ở trên giá trị và một nửa số quan sát ở dưới giá trị. Trung vị được xác định bằng cách xếp hạng các quan sát và tìm quan sát ở số [N + 1] / 2 theo thứ tự được xếp hạng. Nếu số lượng quan sát là chẵn, thì trung vị là giá trị trung bình của các quan sát được xếp hạng ở các số N / 2 và [N / 2] + 1.
Đối với dữ liệu có thứ tự này, giá trị trung bình là 13. Nghĩa là, một nửa giá trị nhỏ hơn hoặc bằng 13 và một nửa giá trị lớn hơn hoặc bằng 13. Nếu bạn thêm một quan sát khác bằng 20, giá trị trung bình là 13,5, là giá trị trung bình giữa quan sát thứ 5 (13) và quan sát thứ 6 (14). Diễn giải Giá trị trung vị “Median” và giá trị trung bình “Mean” đều đo lường xu hướng trung tâm. Nhưng các giá trị bất thường, được gọi là giá trị ngoại lai, có thể ảnh hưởng đến Giá trị trung vị “Median” ít hơn chúng ảnh hưởng đến giá trị trung bình “Mean”. Nếu dữ liệu của bạn là đối xứng, giá trị trung bình và giá trị trung vị là tương tự.
Dữ liệu phân bố đối xứng
Dữ liệu phân bố không đối xứng Đối với phân phối đối xứng, giá trị trung bình (đường màu xanh) và trung vị (đường màu cam) giống nhau đến mức bạn không thể dễ dàng nhìn thấy cả hai đường. Nhưng phân bố không đối xứng bị thì nó lệch sang phải. Sum of Squares Tổng bình phương “Sum of Squares” chưa hiệu chỉnh được tính bằng cách bình phương từng giá trị trong cột và tính tổng của các giá trị bình phương đó. Ví dụ: nếu cột chứa x1, x2, ..., xn, thì tổng bình phương sẽ tính (x12 + x22 + ... + xn2). Không giống như tổng bình phương đã sửa “corrected sum of squares”, tổng bình phương chưa hiệu chỉnh bao gồm cả lỗi. Các giá trị dữ liệu được bình phương mà không trừ giá trị trung bình trước. Total Count Tổng số quan sát “Total count” trong cột. Dùng để biểu diễn tổng của Số quan sát bị thiếu “N missing” và Số quan sát hợp lệ “N nonmissing”. Trong ví dụ này, có 141 quan sát hợp lệ và 8 giá trị bị thiếu. Tổng số quan sát “T count” là 149.
N N là Số lượng giá trị quan sát hợp lệ trong mẫu. Trong ví dụ này, có 141 quan sát hợp lệ được ghi lại.
N * N * là Số lượng quan sát bị thiếu trong mẫu. Số lượng quan sát bị thiếu đề cập đến các ô chứa ký hiệu giá trị bị thiếu *. Trong ví dụ này, 8 lỗi đã xảy ra trong quá trình thu thập dữ liệu và được ghi lại là các giá trị bị thiếu.
Nguồn: https://support.minitab.com/ Về trang trước Gửi email In trang
Danh mục Phần mềm giám sát mạng Phần mềm logistics Phần mềm giáo dục Phần mềm marketing Phần mềm điều khiển PC từ xa Phần mềm thiết kế trang sức Phần mềm báo chí, xuất bản Phần mềm tối ưu cắt vật liệu Phần mềm tiện ích văn phòng Phần mềm xử lý file .PDF Phần mềm quản lý chất lượng Phần mềm vẽ bản đồ Phần mềm lập trình Phần mềm sao lưu dữ liệu Phần mềm mã vạch Phần mềm xử lý âm thanh Phần mềm phát video trực tiếp (live stream) Phần mềm chỉnh sửa video Phần mềm thêu, may mặc Phần mềm đồ họa Phần mềm kiến trúc, xây dựng Phần mềm vẽ kỹ thuật, CAD Phần mềm bảo mật Phần mềm diệt Virus Phần mềm cơ sở dữ liệu Phần mềm gia công cơ khí Hệ điều hành Phần mềm giám sát nhân viên Phần mềm quản lý email Phần mềm Hóa dược, Sinh học Phần mềm quản lý máy in Phần mềm trí tuệ nhân tạo (AI) Phần mềm thống kê Phần mềm thiết kế giao diện Phần mềm Microsoft Office Phần mềm điều tra số Phần mềm Adobe Phần mềm họp video trực tuyến Phần mềm ảo hóa Phần mềm thiết kế PCB/SMT Hardware SMS Gateway TCP/IP Data Terminal Tìm kiếm Hướng dẫn mua hàng Bản đồ - Trang chủ
- Sản phẩm
- Tin tức
- Giới thiệu
- Liên hệ
Chia sẻ kinh nghiệm
- Minitab
- Netop Vision Pro
- Zoom Cloud Meeting
- vMix
- Cube-IQ
- PRTG
- Microsoft
- SMSEagle
- ibik Aster
Tổng quan về tính toán các chỉ số thống kê đối với Hàng và Cột
9.970 lượt xem 11/11/2020 - 07:57 PM Cỡ chữ 1. Tổng quan Tính năng Column Statistics và Row Statistics dùng để tính toán các chỉ số thống kê mô tả “descriptive statistic” cho một cột hoặc cho mỗi hàng trong một tập hợp các cột trong trang tính Minitab. Column Statistics Sử dụng tính năng thống kê theo cột “column statistics” để tính toán các chỉ số thống kê mô tả cho một cột. Ngoài việc hiển thị biến, bạn có thể chọn lưu trữ các chỉ số thống kê trong một hằng số, chẳng hạn như K1. Ví dụ: một nhà thống kê tính toán giá trị trung bình của cột Cân năng “Weight” và lưu trữ giá trị trung bình trong một hằng số để sử dụng trong một phép tính khác.
Row Statistics Sử dụng Thống kê hàng “Row Statistics” để tính toán và lưu trữ các chỉ số thống kê mô tả được chỉ định, chẳng hạn như giá trị trung bình, cho mỗi hàng dữ liệu trong các cột được chỉ định. Ví dụ, một kỹ sư chất lượng ghi lại số lượng các bộ phận bị loại bỏ được sản xuất bởi mỗi trong ba máy trong mỗi ca làm việc. Kỹ sư chất lượng tính toán tổng các bộ phận bị loại từ mỗi máy trong các ca làm việc và lưu trữ chúng trong cột Tổng “Sum”. | C1 | C2 | C3 | C4 | C5 |
| Machine ID | 1st shift | 2nd shift | 3rd shift | Sum |
| 1 | 48 | 47 | 48 | 143 |
| 2 | 76 | 47 | 32 | 155 |
| 3 | 36 | 40 | 34 | 110 |
- Sum
- Mean
- Standard deviation
- Minimum
- Maximum
- Range
- Median
- Sum of squares
- N total
- N missing
Như vây, trung bình một khách hàng chờ đợi 2,4 phút để được phục vụ tại ngân hàng. Diễn giải Sử dụng giá trị trung bình “Mean” để mô tả mẫu với một giá trị duy nhất đại diện cho trung tâm của dữ liệu. Nhiều phân tích thống kê sử dụng giá trị trung bình như một thước đo tiêu chuẩn cho trung tâm của sự phân phối dữ liệu. Giá trị trung vị “Median” và giá trị trung bình “Mean” đều đo lường xu hướng trung tâm. Nhưng các giá trị bất thường, được gọi là giá trị ngoại lai, có thể ảnh hưởng đến giá trị trung vị “Median” ít hơn so với chúng ảnh hưởng đến giá trị trung bình “Mean”. Nếu dữ liệu của bạn là đối xứng, giá trị trung bình và giá trị trung vị là tương tự.
Dữ liệu phân bố đối xứng (Symmetric)
Dữ liệu phân bố bất đối xứng (Not Symmetric) Đối với phân phối đối xứng, giá trị trung bình “Mean” (đường màu xanh) và trung vị “Median” (đường màu cam) giống nhau đến mức bạn không thể dễ dàng nhìn thấy cả hai đường. Nhưng nếu dữ liệu phân bố không đối xứng, bạn sẽ nhìn thấy hai đường này này tách biệt. StDev Độ lệch chuẩn “StDev” là thước đo phổ biến nhất của độ phân tán, hoặc mức độ trải rộng của dữ liệu so với giá trị trung bình “Mean”. Ký hiệu σ (sigma) thường được sử dụng để biểu thị độ lệch chuẩn của một tập hợp “standard deviation of a population”, trong khi s được dùng để biểu thị độ lệch chuẩn của một mẫu “standard deviation of a sample”. Sự thay đổi ngẫu nhiên hoặc tự nhiên của một quá trình thường được gọi là nhiễu “Noise”. Bởi vì độ lệch chuẩn có cùng đơn vị với dữ liệu, nó thường dễ hiểu hơn phương sai “variance”. Diễn giải Sử dụng độ lệch chuẩn để xác định mức độ trải rộng của dữ liệu so với giá trị trung bình. Giá trị độ lệch chuẩn cao hơn cho thấy mức độ lan truyền dữ liệu lớn hơn. Một nguyên tắc chung cho phân phối chuẩn “Normal distribution” là khoảng 68% giá trị nằm trong một độ lệch chuẩn của giá trị trung bình, 95% giá trị nằm trong hai độ lệch chuẩn và 99,7% giá trị nằm trong ba độ lệch chuẩn. Độ lệch chuẩn cũng có thể được sử dụng để thiết lập một điểm chuẩn để ước tính sự thay đổi tổng thể của một quá trình.
Bệnh viện 1
Bệnh viện 2 Thời gian xuất viện Quản trị viên theo dõi thời gian làm thủ tục xuất viện của các bệnh nhân đang điều trị tại khoa cấp cứu của hai bệnh viện. Mặc dù thời gian làm thủ tục xuất viện trung bình là như nhau (35 phút), nhưng độ lệch chuẩn là khác nhau đáng kể. Độ lệch chuẩn của bệnh viện 1 là khoảng 6 phút. Trung bình, thời gian xuất viện của một bệnh nhân lệch so với giá trị trung bình (đường nét đứt màu đỏ) khoảng 6 phút. Độ lệch chuẩn của bệnh viện 2 là khoảng 20 phút. Trung bình, thời gian xuất viện của một bệnh nhân lệch so với giá trị trung bình (đường nét đứt màu đỏ) khoảng 20 phút. Minimum Giá trị nhỏ nhất “Minimum” là giá trị dữ liệu nhỏ nhất. Trong những dữ liệu này, giá trị nhỏ nhất là 7.
Diễn giải Sử dụng giá trị nhỏ nhất “Minimum” để xác định lỗi ngoại lệ có thể xảy ra hoặc lỗi nhập dữ liệu. Một trong những cách đơn giản nhất để đánh giá mức độ lan truyền dữ liệu của bạn là so sánh giá trị nhỏ nhất “Minimum” và giá trị lớn nhất “Maximum”. Nếu giá trị nhỏ nhất rất thấp, ngay cả khi bạn xem xét trung tâm, độ lan truyền và hình dạng của dữ liệu, hãy điều tra nguyên nhân của giá trị cực trị “extreme value”. Range Phạm vi “Range” là sự khác biệt giữa giá trị dữ liệu lớn nhất “Maximum” và nhỏ nhất “Minimum” trong mẫu “Sample”. Phạm vi đại diện cho khoảng có chứa tất cả các giá trị dữ liệu. Diễn giải Sử dụng phạm vi “Range” để hiểu mức độ phân tán trong dữ liệu. Giá trị phạm vi lớn cho biết dữ liệu có độ phân tán lớn hơn. Giá trị phạm vi nhỏ chỉ ra rằng dữ liệu ít bị phân tán hơn. Bởi vì phạm vi được tính toán chỉ bằng cách sử dụng hai giá trị dữ liệu, nó hữu ích hơn khi xem xét với các tập dữ liệu nhỏ. Median Trung vị “Median” là điểm giữa của tập dữ liệu. Giá trị điểm giữa này là điểm mà tại đó một nửa số quan sát ở trên giá trị và một nửa số quan sát ở dưới giá trị. Trung vị được xác định bằng cách xếp hạng các quan sát và tìm quan sát ở số [N + 1] / 2 theo thứ tự được xếp hạng. Nếu số lượng quan sát là chẵn, thì trung vị là giá trị trung bình của các quan sát được xếp hạng ở các số N / 2 và [N / 2] + 1.
Đối với dữ liệu có thứ tự này, giá trị trung bình là 13. Nghĩa là, một nửa giá trị nhỏ hơn hoặc bằng 13 và một nửa giá trị lớn hơn hoặc bằng 13. Nếu bạn thêm một quan sát khác bằng 20, giá trị trung bình là 13,5, là giá trị trung bình giữa quan sát thứ 5 (13) và quan sát thứ 6 (14). Diễn giải Giá trị trung vị “Median” và giá trị trung bình “Mean” đều đo lường xu hướng trung tâm. Nhưng các giá trị bất thường, được gọi là giá trị ngoại lai, có thể ảnh hưởng đến Giá trị trung vị “Median” ít hơn chúng ảnh hưởng đến giá trị trung bình “Mean”. Nếu dữ liệu của bạn là đối xứng, giá trị trung bình và giá trị trung vị là tương tự.
Dữ liệu phân bố đối xứng
Dữ liệu phân bố không đối xứng Đối với phân phối đối xứng, giá trị trung bình (đường màu xanh) và trung vị (đường màu cam) giống nhau đến mức bạn không thể dễ dàng nhìn thấy cả hai đường. Nhưng phân bố không đối xứng bị thì nó lệch sang phải. Sum of Squares Tổng bình phương “Sum of Squares” chưa hiệu chỉnh được tính bằng cách bình phương từng giá trị trong cột và tính tổng của các giá trị bình phương đó. Ví dụ: nếu cột chứa x1, x2, ..., xn, thì tổng bình phương sẽ tính (x12 + x22 + ... + xn2). Không giống như tổng bình phương đã sửa “corrected sum of squares”, tổng bình phương chưa hiệu chỉnh bao gồm cả lỗi. Các giá trị dữ liệu được bình phương mà không trừ giá trị trung bình trước. Total Count Tổng số quan sát “Total count” trong cột. Dùng để biểu diễn tổng của Số quan sát bị thiếu “N missing” và Số quan sát hợp lệ “N nonmissing”. Trong ví dụ này, có 141 quan sát hợp lệ và 8 giá trị bị thiếu. Tổng số quan sát “T count” là 149.
N N là Số lượng giá trị quan sát hợp lệ trong mẫu. Trong ví dụ này, có 141 quan sát hợp lệ được ghi lại.
N * N * là Số lượng quan sát bị thiếu trong mẫu. Số lượng quan sát bị thiếu đề cập đến các ô chứa ký hiệu giá trị bị thiếu *. Trong ví dụ này, 8 lỗi đã xảy ra trong quá trình thu thập dữ liệu và được ghi lại là các giá trị bị thiếu.
Nguồn: https://support.minitab.com/ Về trang trước Gửi email In trang Các bài viết liên quan
- Tổng quan về tính năng tạo các mẫu dữ liệu ngẫu nhiên Random Data
- Tạo và thao khống dữ liệu dạng Ma trận trong Minitab
- Sử dụng Make Mesh Data để tạo một lưới dữ liệu
Từ khóa » Chỉ Số Median
-
Số Trung Vị – Wikipedia Tiếng Việt
-
MEDIAN (Hàm MEDIAN) - Microsoft Support
-
Median Hay Số Trung Vị (median) Là Gì ? - Luật Minh Khuê
-
Kết Quả đo Mức độ Xơ Hóa Gan Nói Lên điều Gì? - Vinmec
-
Số Trung Bình Là Gì? Median Và Mode Là Gì? - VietnamFinance
-
Cách để Tìm Mean, Median, Và Mode - WikiHow
-
Trung Vị (Median) Là Gì? Ví Dụ Về Trung Vị - VietnamBiz
-
FibroScan - Kỹ Thuật Siêu âm đàn Hồi Gan An Toàn, Chính Xác, Hiệu Quả
-
[PDF] SO SÁNH KẾT QUẢ KHẢO SÁT ĐỘ XƠ HÓA GAN TRÊN CÁC MÁY ...
-
Median Là Gì Trong Thống Kê - Hàng Hiệu
-
Phân Biệt Trung Bình Trung Vị Phân Vị - Phân Tích Xử Lý Dữ Liệu
-
Khảo Sát Hình Dạng Phân Phối Của Tập Dữ Liệu
-
Siêu âm Fibroscan - Công Nghệ đột Phá Trong Chẩn đoán Bệnh Gan
-
Thống Kê Mô Tả Trong Nghiên Cứu – Các đại Lượng Về độ Phân Tán