Trung Bình Cộng đơn Giản – Wikipedia Tiếng Việt

Có thể bạn quan tâm

Thương của tổng họ các con số với số các con số trong họ đóBản mẫu:SHORTDESC:Thương của tổng họ các con số với số các con số trong họ đó Đối với nghĩa rộng hơn của chủ đề này, xem Trung bình.

Trong toán học và thống kê, trung bình cộng (và rất ít khi là trung bình số học), hay được gọi ngắn đi là trung bình (khi đã rõ ngữ cảnh), là thương số giữa tổng của một họ các số với số lượng các con số trong họ đó.[1] Họ các con số ở đây thường là tập kết quả từ một cuộc thí nghiệm, nghiên cứu quan sát hoặc phỏng vấn. Tên gọi "trung bình số học" đôi khi được dùng để đối chiếu với bản tiếng Anh (arithmetic mean), tương tự đối với trung bình hình học.

Bên ngoài toán học và thống kê, trung bình cộng cũng được dùng nhiều trong kinh tế học, nhân loại học và lịch sử và gần như có sử dụng trong mọi nhánh học. Ví dụ chẳng hạn, thu nhập bình quân đầu người là trung bình cộng của thu nhập của toàn bộ dân số của một quốc gia.

Mặc dù trung bình cộng thường được dùng để báo cáo xu hướng tập trung, nó không phải là thống kê chuẩn mạnh: nó bị ảnh hưởng rất nhiều từ các giá trị bất thường (các giá trị hoặc cực lớn hoặc cực nhỏ so với số còn lại). Đối với các phân phối bị xiên, ví dụ như trong phân phối thu nhập, trong đó sẽ có một số người có thu nhập hơn rất nhiều so với đa số những người còn lại, trung bình cộng sẽ khó xác định "giá trị đứng giữa" của phân phối đó. Trong trường hợp này, dùng trung vị có thể mô tả tốt hơn xu hướng tập trung.

Định nghĩa

[sửa | sửa mã nguồn]

Cho tập dữ liệu , trung bình cộng (hoặc được gọi ngắn đi là trung bình), và được ký hiệu là (đọc là gạch trên), là trung bình cộng của giá trị .[2]

Trong tập dữ liệu, trung bình cộng là trong những cách thường dùng để hiểu độ đo của xu hướng tập trung. Trung bình cộng của tập dữ liệu quan sát bằng với tổng các giá trị số của mỗi quan sát chia cho số lần quan sát. Viết dưới công thức cho tập dữ liệu bao gồm các giá trị, trung bình cộng được định nghĩa như sau:

[3]

(Dấu ký hiệu cho phép lấy tổng.)

Ví dụ chẳng hạn, nếu lương hàng tháng của nhân viên là như sau: , thì trung bình cộng của lương của bọn họ là:

Nếu tập dữ liệu là quần thể thống kê (tức là chứa mọi quan sát khả thi và không chỉ là tập con của chúng) thì trung bình cộng đó được gọi là trung bình quần thể và được ký hiệu bởi chữ Hy Lạp . Nếu tập dữ liệu là mẫu thống kê (là tập con của quần thể), thì trung bình cộng được gọi là trung bình mẫu (trung bình đối với tập dữ liệu được viết là ).

Trung bình cộng được định nghĩa tương tự cho vectơ trong nhiều chiều, chứ không nhất thiết phải giữa các giá trị scalar. Tổng quát hơn, bởi vì trung bình cộng là tổ hợp lồi (tức là tổng các hệ số của nó bằng ), nó có thể được định nghĩa trên không gian lồi chứ không chỉ không gian vectơ.

Các tính chất thúc đẩy

[sửa | sửa mã nguồn]

Trung bình cộng có một số tính chất đặc biệt, nhất là khi dùng để đo xu hướng tập trung. Chúng bao gồm:

Nếu có giá trị trung bình , thì . Bởi là khoảng cách từ số đó đến trung bình, ta có thể xem tính chất là đang nói rằng các phần tử ở bên trái đang được cân bằng bởi các phần tử ở bên phải. Giá tri trung bình là giá trị duy nhất sao cho các phần dư (độ lệch so với ước lượng) có tổng bằng không. Ta cũng có thể xem giá trị trung bình có tính bất biến tịnh tiến bởi cho bất kỳ số thực , .
Nếu buộc phải dùng một giá trị "tầm thường" cho một tập các số đã biết , thì trung bình cộng thường là tốt nhất bởi nó đã tối thiểu hoá tổng của các bình phương độ lệch chuẩn từ giá trị thường: tức tổng của . Trung bình mẫu cũng là ước lượng đơn tốt nhất bởi nó có sai số dùng căn trung bình bình phương nhỏ nhất.[2] Nếu cần phải dùng trung bình cộng cho cả một quần thể , thì ước lượng không chệch của nó là trung bình cộng của một mẫu lấy từ quần thể.

Trung bình cộng không phụ thuộc đơn vị đo, bởi Ví dụ chẳng hạn, tính trung bình theo đơn vị lít rồi đổi sang ga-lông thì cũng tương tự với đổi sang đơn vị ga-lông rồi mới tính trung bình. Tính chất này được gọi là tính thuần nhất bậc nhất.

Trái với trung vị

[sửa | sửa mã nguồn] Bài chi tiết: Trung vị

Trung bình cộng có thể trái với trung vị. Giá trị trung vị được định nghĩa sao cho không có hơn một nửa trong tập lớn hơn nó và cũng không có hơn một nửa trong tập nhỏ hơn nó. Khi sắp xếp các dữ liệu theo một thứ tự nào đó sao cho các dữ liệu tăng theo cấp số cộng, thì trong trường hợp này trung bình và trung vị là cùng một giá trị. Ví dụ chẳng hạn, xét tập . Giá trị trung bình là , và giá trị trung vị cũng bằng 2.5. Tuy nhiên, nếu như tập hợp không thể sắp xếp được sao cho dữ liệu tăng theo cấp số cộng, chẳng hạn như tập , thì giá trị trung bình sẽ sai khác đáng kể so với giá trị trung vị. Trong ví dụ này, trung bình bằng với , còn trung vị là . Giá trị trung bình có thể lớn hơn hoặc nhỏ hơn so với đa số dữ liệu trong tập.

Có nhiều ứng dụng cho hiện tượng này trong nhiều ngành. Ví dụ chẳng hạn, kể từ năm 1980, trung vị thu nhập của Hoa Kỳ chậm hơn nhiều so với trung bình thu nhập.[4]

Tổng quát

[sửa | sửa mã nguồn]

Trung bình có trọng số

[sửa | sửa mã nguồn] Bài chi tiết: Trung bình có trọng số

Trung bình có trọng số là trung bình trong đó có một số điểm dữ liệu có "trọng lượng" nhiều hơn một số khác khi tính toán.[5] Ví dụ chẳng hạn, trung bình của và là , hoặc tương đương . Ngược lại, trong trung bình có trọng số, ta có thể đổi sao cho số đầu tiên có trọng số gấp đôi số thứ hai (có thể là vì số đó có tần suất xuất hiện gấp đôi số còn lại). Khi đó trung bình sẽ được như sau: . Ở đây, các trọng số phải có tổng bằng một, là và , trong đó cái đầu gấp đôi cái thứ hai. Do đó, trung bình cộng có thể được coi là trường hợp đặc biệt của trung bình có trọng số trong đó các trọng số đều bằng nhau ( trong trường hợp trên và trong trường hợp tổng quát xét số).

Góc

[sửa | sửa mã nguồn]

Dấu và mã hoá

[sửa | sửa mã nguồn]

Trung bình cộng thường được ký hiệu bằng dấu gạch trên đầu, như trong .[2]

Một số phần mềm (chẳng hạn như các phần mềm xử lý văn bản, trình duyệt web) có thể không hiển thị đúng ký hiệu "x̄". Ví dụ chẳng hạn, dấu HTML "x̄" gộp hai mã — ký tự gốc "x" thêm một mã cho dấu gạch trên (̄ hoặc ¯).[6]

Xem thêm

[sửa | sửa mã nguồn]

Trung bình Fréchet
Trung bình tổng quát
Trung bình nhân
Trung bình điều hoà
Trung bình mẫu và covariance
Độ lệch chuẩn
Sai số chuẩn của trung bình
Thống kê tổng

Tham khảo

[sửa | sửa mã nguồn]

^ Jacobs, Harold R. (1994). Mathematics: A Human Endeavor . W. H. Freeman. tr. 547. ISBN 0-7167-2426-X.
^ a b c Medhi, Jyotiprasad (1992). Statistical Methods: An Introductory Text. New Age International. tr. 53–58. ISBN 9788122404197.
^ Weisstein, Eric W. "Arithmetic Mean". mathworld.wolfram.com (bằng tiếng Anh). Truy cập ngày 21 tháng 8 năm 2020.
^ Krugman, Paul (ngày 4 tháng 6 năm 2014) [Fall 1992]. "The Rich, the Right, and the Facts: Deconstructing the Income Distribution Debate". The American Prospect.
^ "Mean | mathematics". Encyclopedia Britannica (bằng tiếng Anh). Truy cập ngày 21 tháng 8 năm 2020.
^ "Notes on Unicode for Stat Symbols". www.personal.psu.edu. Bản gốc lưu trữ ngày 31 tháng 3 năm 2022. Truy cập ngày 14 tháng 10 năm 2018.

Đọc thêm

[sửa | sửa mã nguồn]

Huff, Darrell (1993). How to Lie with Statistics. W. W. Norton. ISBN 978-0-393-31072-6.

Liên kết ngoài

[sửa | sửa mã nguồn]

Calculations and comparisons between arithmetic mean and geometric mean of two numbers
Calculate the arithmetic mean of a series of numbers on fxSolver Lưu trữ ngày 24 tháng 9 năm 2015 tại Wayback Machine

Thống kê

Outline of statistics
List of statistics articles

Thống kê mô tả

Continuous probability distribution

Central tendency	Số bình quân Trung bình cộng Trung bình nhân Trung bình điều hòa Số trung vị Số yếu vị
Statistical dispersion	Phương sai Độ lệch chuẩn Hệ số biến thiên Percentile Khoảng biến thiên Độ trải giữa
Shape of a probability distribution	Định lý giới hạn trung tâm Mô men (toán học) Độ xiên (thống kê) Độ nhọn (thống kê) L-moments

Count data

Index of dispersion

Summary tables

Grouped data
Frequency distribution
Contingency table

Hệ số tương quan

Pearson correlation coefficient
Rank correlation
- Spearman's rank correlation coefficient
- Kendall rank correlation coefficient
Partial correlation
Scatter plot

Statistical graphics

Bar chart
Biplot
Box plot
Control chart
Correlogram
Fan chart (statistics)
Forest plot
Histogram
Pie chart
Q–Q plot
Run chart
Scatter plot
Stem-and-leaf display
Radar chart
Violin plot

Thu thập dữ liệu

Design of experiments	Quần thể thống kê Hoạt động thống kê Effect size Power of a test Optimal design Sample size determination Replication (statistics) Missing data
Survey methodology	Sampling (statistics) Stratified sampling Cluster sampling Standard error Opinion poll Questionnaire
Thí nghiệm	Scientific control Randomized experiment Randomized controlled trial Random assignment Blocking (statistics) Interaction (statistics) Factorial experiment
Adaptive Designs	Adaptive clinical trial Up-and-Down Designs Stochastic approximation
Observational study	Cross-sectional study Cohort study Natural experiment Quasi-experiment

Suy luận thống kê

Statistical theory

Quần thể thống kê
Hoạt động thống kê
Phân phối xác suất
Sampling distribution
- Order statistic
Empirical distribution function
- Density estimation
Mô hình thống kê
- Statistical model specification
- Lp space
Statistical parameter
- Location parameter
- Scale parameter
- Shape parameter
Parametric statistics
- Likelihood function Monotone likelihood ratio
- Location–scale family
- Exponential family
Completeness (statistics)
Thống kê đủ
Plug-in principle
- Bootstrapping (statistics)
- U-statistic
- V-statistic
Optimal decision
- Hàm mất mát
Efficiency (statistics)
Statistical distance
- Divergence (statistics)
Asymptotic theory (statistics)
Robust statistics

Frequentist inference

Point estimation	Estimating equations Hợp lý cực đại Method of moments (statistics) M-estimator Minimum-distance estimation Bias of an estimators Minimum-variance unbiased estimator Rao–Blackwell theorem Lehmann–Scheffé theorem Median-unbiased estimator Plug-in principle
Interval estimation	Khoảng tin cậy Pivotal quantity Likelihood interval Prediction interval Tolerance interval Resampling (statistics) Bootstrapping (statistics) Jackknife resampling
Kiểm định giả thuyết thống kê	One- and two-tailed tests Power of a test Uniformly most powerful test Permutation test Resampling (statistics) Multiple comparisons problem
Parametric statistics	Likelihood-ratio test Score test Wald test

Specific tests

Z-test Student's t-test F-test
Goodness of fit	Kiểm định chi bình phương G-test Kolmogorov–Smirnov test Anderson–Darling test Lilliefors test Phép kiểm định Jarque-Bera Shapiro–Wilk test Likelihood-ratio test Model selection Kiểm chứng chéo Akaike information criterion Bayesian information criterion
Rank statistics	Sign test Sample median Wilcoxon signed-rank test Hodges–Lehmann estimator Mann–Whitney U test Nonparametric statistics Analysis of variance Kruskal–Wallis one-way analysis of variance Friedman test Jonckheere's trend test

Suy luận Bayes

Bayesian probability
- Prior probability
- Xác suất hậu nghiệm
Credible interval
Bayes factor
Ước lượng Bayes
- Maximum a posteriori estimation

Hệ số tương quan
Phân tích hồi quy

Hệ số tương quan	Pearson correlation coefficient Partial correlation Confounding Coefficient of determination
Phân tích hồi quy	Errors and residuals Regression validation Mixed model Simultaneous equations models Multivariate adaptive regression spline
Hồi quy tuyến tính	Simple linear regression Ordinary least squares General linear model Bayesian linear regression
Non-standard predictors	Hồi quy phi tuyến tính Nonparametric regression Semiparametric regression Isotonic regression Robust regression Hiệp phương sai không đồng nhất Homoscedasticity
Generalized linear model	Exponential family Logistic regression / Binomial regression / Poisson regressions
Partition of sums of squares	Analysis of variance Analysis of covariance Multivariate analysis of variance Degrees of freedom (statistics)

Categorical variable / Multivariate statistics / Chuỗi thời gian / Survival analysis

Categorical variable

Cohen's kappa
Contingency table
Mô hình xác suất dạng đồ thị
Poisson regression
McNemar's test

Multivariate statistics

General linear model
Multivariate analysis of variance
Phép phân tích thành phần chính
Canonical correlation
Linear discriminant analysis
Phân nhóm dữ liệu
Phân loại bằng thống kê
Structural equation modeling
- Phân tích nhân tố
Joint probability distributions
- Elliptical distributions
  - Phân phối chuẩn nhiều chiều

Chuỗi thời gian

General	Decomposition of time series Linear trend estimation Stationary process Seasonal adjustment Exponential smoothing Cointegration Structural break Granger causality
Specific tests	Dickey–Fuller test Kiểm định Johansen Ljung–Box test Thống kê Durbin–Watson Breusch–Godfrey test
Time domain	Autocorrelation Partial autocorrelation function Cross-correlation Arma Box–Jenkins method ARCH Vector autoregression
Frequency domain	Spectral density estimation Giải tích Fourier Wavelet Whittle likelihood

Survival analysis

Survival function	Kaplan–Meier estimator Proportional hazards models Accelerated failure time model First-hitting-time model
Failure rate	Nelson–Aalen estimator
Test	Logrank test

List of fields of application of statistics

Biostatistics	Tin sinh học Thử nghiệm lâm sàngs / Clinical study design Dịch tễ học Medical statistics
Engineering statistics	Chemometrics Methods engineering Probabilistic design Statistical process control / Kiểm soát chất lượng Reliability engineering System identification
Social statistics	Actuarial science Điều tra dân số Crime statistics Demographic statistics Kinh tế lượng Jurimetrics National accounts Official statistics Demographic statistics Psychometrics
Spatial analysis	Bản đồ học Thống kê môi trường Hệ thống Thông tin Địa lý Địa thống kê Kriging

Thể loại:Thống kê
'
Commons:Category:Statistics
Wikipedia:WikiProject Statistics