Trung Bình Cộng đơn Giản – Wikipedia Tiếng Việt

Thương của tổng họ các con số với số các con số trong họ đóBản mẫu:SHORTDESC:Thương của tổng họ các con số với số các con số trong họ đó Đối với nghĩa rộng hơn của chủ đề này, xem Trung bình.

Trong toán học và thống kê, trung bình cộng (và rất ít khi là trung bình số học), hay được gọi ngắn đi là trung bình (khi đã rõ ngữ cảnh), là thương số giữa tổng của một họ các số với số lượng các con số trong họ đó.[1] Họ các con số ở đây thường là tập kết quả từ một cuộc thí nghiệm, nghiên cứu quan sát hoặc phỏng vấn. Tên gọi "trung bình số học" đôi khi được dùng để đối chiếu với bản tiếng Anh (arithmetic mean), tương tự đối với trung bình hình học.

Bên ngoài toán học và thống kê, trung bình cộng cũng được dùng nhiều trong kinh tế học, nhân loại học và lịch sử và gần như có sử dụng trong mọi nhánh học. Ví dụ chẳng hạn, thu nhập bình quân đầu người là trung bình cộng của thu nhập của toàn bộ dân số của một quốc gia.

Mặc dù trung bình cộng thường được dùng để báo cáo xu hướng tập trung, nó không phải là thống kê chuẩn mạnh: nó bị ảnh hưởng rất nhiều từ các giá trị bất thường (các giá trị hoặc cực lớn hoặc cực nhỏ so với số còn lại). Đối với các phân phối bị xiên, ví dụ như trong phân phối thu nhập, trong đó sẽ có một số người có thu nhập hơn rất nhiều so với đa số những người còn lại, trung bình cộng sẽ khó xác định "giá trị đứng giữa" của phân phối đó. Trong trường hợp này, dùng trung vị có thể mô tả tốt hơn xu hướng tập trung.

Định nghĩa

[sửa | sửa mã nguồn]

Cho tập dữ liệu X = { x 1 , … , x n } {\displaystyle X=\{x_{1},\ldots ,x_{n}\}} , trung bình cộng (hoặc được gọi ngắn đi là trung bình), và được ký hiệu là x ¯ {\displaystyle {\bar {x}}} (đọc là x {\displaystyle x} gạch trên), là trung bình cộng của n {\displaystyle n} giá trị x 1 , … , x n {\displaystyle x_{1},\ldots ,x_{n}} .[2]

Trong tập dữ liệu, trung bình cộng là trong những cách thường dùng để hiểu độ đo của xu hướng tập trung. Trung bình cộng của tập dữ liệu quan sát bằng với tổng các giá trị số của mỗi quan sát chia cho số lần quan sát. Viết dưới công thức cho tập dữ liệu bao gồm các giá trị, trung bình cộng được định nghĩa như sau:

x ¯ = 1 n ( ∑ i = 1 n x i ) = x 1 + x 2 + ⋯ + x n n {\displaystyle {\bar {x}}={\frac {1}{n}}\left(\sum _{i=1}^{n}{x_{i}}\right)={\frac {x_{1}+x_{2}+\dots +x_{n}}{n}}} [3]

(Dấu Σ {\displaystyle \Sigma } ký hiệu cho phép lấy tổng.)

Ví dụ chẳng hạn, nếu lương hàng tháng của 10 {\displaystyle 10} nhân viên là như sau: { 2500 , 2700 , 2400 , 2300 , 2550 , 2650 , 2750 , 2450 , 2600 , 2400 } {\displaystyle \{2500,2700,2400,2300,2550,2650,2750,2450,2600,2400\}} , thì trung bình cộng của lương của bọn họ là:

2500 + 2700 + 2400 + 2300 + 2550 + 2650 + 2750 + 2450 + 2600 + 2400 10 = 2530 {\displaystyle {\frac {2500+2700+2400+2300+2550+2650+2750+2450+2600+2400}{10}}=2530}

Nếu tập dữ liệu là quần thể thống kê (tức là chứa mọi quan sát khả thi và không chỉ là tập con của chúng) thì trung bình cộng đó được gọi là trung bình quần thể và được ký hiệu bởi chữ Hy Lạp μ {\displaystyle \mu } . Nếu tập dữ liệu là mẫu thống kê (là tập con của quần thể), thì trung bình cộng được gọi là trung bình mẫu (trung bình đối với tập dữ liệu X {\displaystyle X} được viết là X ¯ {\displaystyle {\overline {X}}} ).

Trung bình cộng được định nghĩa tương tự cho vectơ trong nhiều chiều, chứ không nhất thiết phải giữa các giá trị scalar. Tổng quát hơn, bởi vì trung bình cộng là tổ hợp lồi (tức là tổng các hệ số của nó bằng 1 {\displaystyle 1} ), nó có thể được định nghĩa trên không gian lồi chứ không chỉ không gian vectơ.

Các tính chất thúc đẩy

[sửa | sửa mã nguồn]

Trung bình cộng có một số tính chất đặc biệt, nhất là khi dùng để đo xu hướng tập trung. Chúng bao gồm:

  • Nếu x 1 , … , x n {\displaystyle x_{1},\dotsc ,x_{n}} có giá trị trung bình x ¯ {\displaystyle {\bar {x}}} , thì ( x 1 − x ¯ ) + ⋯ + ( x n − x ¯ ) = 0 {\displaystyle (x_{1}-{\bar {x}})+\dotsb +(x_{n}-{\bar {x}})=0} . Bởi x i − x ¯ {\displaystyle x_{i}-{\bar {x}}} là khoảng cách từ số đó đến trung bình, ta có thể xem tính chất là đang nói rằng các phần tử ở bên trái đang được cân bằng bởi các phần tử ở bên phải. Giá tri trung bình là giá trị duy nhất sao cho các phần dư (độ lệch so với ước lượng) có tổng bằng không. Ta cũng có thể xem giá trị trung bình có tính bất biến tịnh tiến bởi cho bất kỳ số thực a {\displaystyle a} , x + a ¯ = x ¯ + a {\displaystyle {\overline {x+a}}={\bar {x}}+a} .
  • Nếu buộc phải dùng một giá trị "tầm thường" cho một tập các số đã biết x 1 , … , x n {\displaystyle x_{1},\dotsc ,x_{n}} , thì trung bình cộng thường là tốt nhất bởi nó đã tối thiểu hoá tổng của các bình phương độ lệch chuẩn từ giá trị thường: tức tổng của ( x i − x ¯ ) 2 {\displaystyle (x_{i}-{\bar {x}})^{2}} . Trung bình mẫu cũng là ước lượng đơn tốt nhất bởi nó có sai số dùng căn trung bình bình phương nhỏ nhất.[2] Nếu cần phải dùng trung bình cộng cho cả một quần thể , thì ước lượng không chệch của nó là trung bình cộng của một mẫu lấy từ quần thể.
  • Trung bình cộng không phụ thuộc đơn vị đo, bởi avg ( c a 1 , ⋯ , c a n ) = c ⋅ avg ( a 1 , ⋯ , a n ) . {\displaystyle {\text{avg}}(ca_{1},\cdots ,ca_{n})=c\cdot {\text{avg}}(a_{1},\cdots ,a_{n}).} Ví dụ chẳng hạn, tính trung bình theo đơn vị lít rồi đổi sang ga-lông thì cũng tương tự với đổi sang đơn vị ga-lông rồi mới tính trung bình. Tính chất này được gọi là tính thuần nhất bậc nhất.

Trái với trung vị

[sửa | sửa mã nguồn] Bài chi tiết: Trung vị

Trung bình cộng có thể trái với trung vị. Giá trị trung vị được định nghĩa sao cho không có hơn một nửa trong tập lớn hơn nó và cũng không có hơn một nửa trong tập nhỏ hơn nó. Khi sắp xếp các dữ liệu theo một thứ tự nào đó sao cho các dữ liệu tăng theo cấp số cộng, thì trong trường hợp này trung bình và trung vị là cùng một giá trị. Ví dụ chẳng hạn, xét tập { 1 , 2 , 3 , 4 } {\displaystyle \{1,2,3,4\}} . Giá trị trung bình là 2.5 {\displaystyle 2.5} , và giá trị trung vị cũng bằng 2.5. Tuy nhiên, nếu như tập hợp không thể sắp xếp được sao cho dữ liệu tăng theo cấp số cộng, chẳng hạn như tập { 1 , 2 , 4 , 8 , 16 } {\displaystyle \{1,2,4,8,16\}} , thì giá trị trung bình sẽ sai khác đáng kể so với giá trị trung vị. Trong ví dụ này, trung bình bằng với 6.2 {\displaystyle 6.2} , còn trung vị là 4 {\displaystyle 4} . Giá trị trung bình có thể lớn hơn hoặc nhỏ hơn so với đa số dữ liệu trong tập.

Có nhiều ứng dụng cho hiện tượng này trong nhiều ngành. Ví dụ chẳng hạn, kể từ năm 1980, trung vị thu nhập của Hoa Kỳ chậm hơn nhiều so với trung bình thu nhập.[4]

Tổng quát

[sửa | sửa mã nguồn]

Trung bình có trọng số

[sửa | sửa mã nguồn] Bài chi tiết: Trung bình có trọng số

Trung bình có trọng số là trung bình trong đó có một số điểm dữ liệu có "trọng lượng" nhiều hơn một số khác khi tính toán.[5] Ví dụ chẳng hạn, trung bình của 3 {\displaystyle 3} 5 {\displaystyle 5} 3 + 5 2 = 4 {\displaystyle {\frac {3+5}{2}}=4} , hoặc tương đương 3 1 2 + 5 1 2 = 4 {\displaystyle 3{\frac {1}{2}}+5{\frac {1}{2}}=4} . Ngược lại, trong trung bình có trọng số, ta có thể đổi sao cho số đầu tiên có trọng số gấp đôi số thứ hai (có thể là vì số đó có tần suất xuất hiện gấp đôi số còn lại). Khi đó trung bình sẽ được như sau: 3 2 3 + 5 1 3 = 11 3 {\displaystyle 3{\frac {2}{3}}+5{\frac {1}{3}}={\frac {11}{3}}} . Ở đây, các trọng số phải có tổng bằng một, là 2 3 {\displaystyle {\frac {2}{3}}} 1 3 {\displaystyle {\frac {1}{3}}} , trong đó cái đầu gấp đôi cái thứ hai. Do đó, trung bình cộng có thể được coi là trường hợp đặc biệt của trung bình có trọng số trong đó các trọng số đều bằng nhau ( 1 2 {\displaystyle {\frac {1}{2}}} trong trường hợp trên và 1 n {\displaystyle {\frac {1}{n}}} trong trường hợp tổng quát xét n {\displaystyle n} số).

Góc

[sửa | sửa mã nguồn]

Dấu và mã hoá

[sửa | sửa mã nguồn]

Trung bình cộng thường được ký hiệu bằng dấu gạch trên đầu, như trong x ¯ {\displaystyle {\bar {x}}} .[2]

Một số phần mềm (chẳng hạn như các phần mềm xử lý văn bản, trình duyệt web) có thể không hiển thị đúng ký hiệu "x̄". Ví dụ chẳng hạn, dấu HTML "x̄" gộp hai mã — ký tự gốc "x" thêm một mã cho dấu gạch trên (̄ hoặc ¯).[6]

Xem thêm

[sửa | sửa mã nguồn]
  • Trung bình Fréchet
  • Trung bình tổng quát
  • Trung bình nhân
  • Trung bình điều hoà
  • Trung bình mẫu và covariance
  • Độ lệch chuẩn
  • Sai số chuẩn của trung bình
  • Thống kê tổng

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ Jacobs, Harold R. (1994). Mathematics: A Human Endeavor . W. H. Freeman. tr. 547. ISBN 0-7167-2426-X.
  2. ^ a b c Medhi, Jyotiprasad (1992). Statistical Methods: An Introductory Text. New Age International. tr. 53–58. ISBN 9788122404197.
  3. ^ Weisstein, Eric W. "Arithmetic Mean". mathworld.wolfram.com (bằng tiếng Anh). Truy cập ngày 21 tháng 8 năm 2020.
  4. ^ Krugman, Paul (ngày 4 tháng 6 năm 2014) [Fall 1992]. "The Rich, the Right, and the Facts: Deconstructing the Income Distribution Debate". The American Prospect.
  5. ^ "Mean | mathematics". Encyclopedia Britannica (bằng tiếng Anh). Truy cập ngày 21 tháng 8 năm 2020.
  6. ^ "Notes on Unicode for Stat Symbols". www.personal.psu.edu. Bản gốc lưu trữ ngày 31 tháng 3 năm 2022. Truy cập ngày 14 tháng 10 năm 2018.

Đọc thêm

[sửa | sửa mã nguồn]
  • Huff, Darrell (1993). How to Lie with Statistics. W. W. Norton. ISBN 978-0-393-31072-6.

Liên kết ngoài

[sửa | sửa mã nguồn]
  • Calculations and comparisons between arithmetic mean and geometric mean of two numbers
  • Calculate the arithmetic mean of a series of numbers on fxSolver Lưu trữ ngày 24 tháng 9 năm 2015 tại Wayback Machine
  • x
  • t
  • s
Thống kê
  • Outline of statistics
  • List of statistics articles
Thống kê mô tả
Continuous probability distribution
Central tendency
  • Số bình quân
    • Trung bình cộng
    • Trung bình nhân
    • Trung bình điều hòa
  • Số trung vị
  • Số yếu vị
Statistical dispersion
  • Phương sai
  • Độ lệch chuẩn
  • Hệ số biến thiên
  • Percentile
  • Khoảng biến thiên
  • Độ trải giữa
Shape of a probability distribution
  • Định lý giới hạn trung tâm
  • Mô men (toán học)
    • Độ xiên (thống kê)
    • Độ nhọn (thống kê)
    • L-moments
Count data
  • Index of dispersion
Summary tables
  • Grouped data
  • Frequency distribution
  • Contingency table
Hệ số tương quan
  • Pearson correlation coefficient
  • Rank correlation
    • Spearman's rank correlation coefficient
    • Kendall rank correlation coefficient
  • Partial correlation
  • Scatter plot
Statistical graphics
  • Bar chart
  • Biplot
  • Box plot
  • Control chart
  • Correlogram
  • Fan chart (statistics)
  • Forest plot
  • Histogram
  • Pie chart
  • Q–Q plot
  • Run chart
  • Scatter plot
  • Stem-and-leaf display
  • Radar chart
  • Violin plot
Thu thập dữ liệu
Design of experiments
  • Quần thể thống kê
  • Hoạt động thống kê
  • Effect size
  • Power of a test
  • Optimal design
  • Sample size determination
  • Replication (statistics)
  • Missing data
Survey methodology
  • Sampling (statistics)
    • Stratified sampling
    • Cluster sampling
  • Standard error
  • Opinion poll
  • Questionnaire
Thí nghiệm
  • Scientific control
  • Randomized experiment
  • Randomized controlled trial
  • Random assignment
  • Blocking (statistics)
  • Interaction (statistics)
  • Factorial experiment
Adaptive Designs
  • Adaptive clinical trial
  • Up-and-Down Designs
  • Stochastic approximation
Observational study
  • Cross-sectional study
  • Cohort study
  • Natural experiment
  • Quasi-experiment
Suy luận thống kê
Statistical theory
  • Quần thể thống kê
  • Hoạt động thống kê
  • Phân phối xác suất
  • Sampling distribution
    • Order statistic
  • Empirical distribution function
    • Density estimation
  • Mô hình thống kê
    • Statistical model specification
    • Lp space
  • Statistical parameter
    • Location parameter
    • Scale parameter
    • Shape parameter
  • Parametric statistics
    • Likelihood function Monotone likelihood ratio
    • Location–scale family
    • Exponential family
  • Completeness (statistics)
  • Thống kê đủ
  • Plug-in principle
    • Bootstrapping (statistics)
    • U-statistic
    • V-statistic
  • Optimal decision
    • Hàm mất mát
  • Efficiency (statistics)
  • Statistical distance
    • Divergence (statistics)
  • Asymptotic theory (statistics)
  • Robust statistics
Frequentist inference
Point estimation
  • Estimating equations
    • Hợp lý cực đại
    • Method of moments (statistics)
    • M-estimator
    • Minimum-distance estimation
  • Bias of an estimators
    • Minimum-variance unbiased estimator
      • Rao–Blackwell theorem
      • Lehmann–Scheffé theorem
    • Median-unbiased estimator
  • Plug-in principle
Interval estimation
  • Khoảng tin cậy
  • Pivotal quantity
  • Likelihood interval
  • Prediction interval
  • Tolerance interval
  • Resampling (statistics)
    • Bootstrapping (statistics)
    • Jackknife resampling
Kiểm định giả thuyết thống kê
  • One- and two-tailed tests
  • Power of a test
    • Uniformly most powerful test
  • Permutation test
    • Resampling (statistics)
  • Multiple comparisons problem
Parametric statistics
  • Likelihood-ratio test
  • Score test
  • Wald test
Specific tests
  • Z-test
  • Student's t-test
  • F-test
Goodness of fit
  • Kiểm định chi bình phương
  • G-test
  • Kolmogorov–Smirnov test
  • Anderson–Darling test
  • Lilliefors test
  • Phép kiểm định Jarque-Bera
  • Shapiro–Wilk test
  • Likelihood-ratio test
  • Model selection
    • Kiểm chứng chéo
    • Akaike information criterion
    • Bayesian information criterion
Rank statistics
  • Sign test
    • Sample median
  • Wilcoxon signed-rank test
    • Hodges–Lehmann estimator
  • Mann–Whitney U test
  • Nonparametric statistics Analysis of variance
    • Kruskal–Wallis one-way analysis of variance
    • Friedman test
    • Jonckheere's trend test
Suy luận Bayes
  • Bayesian probability
    • Prior probability
    • Xác suất hậu nghiệm
  • Credible interval
  • Bayes factor
  • Ước lượng Bayes
    • Maximum a posteriori estimation
  • Hệ số tương quan
  • Phân tích hồi quy
Hệ số tương quan
  • Pearson correlation coefficient
  • Partial correlation
  • Confounding
  • Coefficient of determination
Phân tích hồi quy
  • Errors and residuals
  • Regression validation
  • Mixed model
  • Simultaneous equations models
  • Multivariate adaptive regression spline
Hồi quy tuyến tính
  • Simple linear regression
  • Ordinary least squares
  • General linear model
  • Bayesian linear regression
Non-standard predictors
  • Hồi quy phi tuyến tính
  • Nonparametric regression
  • Semiparametric regression
  • Isotonic regression
  • Robust regression
  • Hiệp phương sai không đồng nhất
  • Homoscedasticity
Generalized linear model
  • Exponential family
  • Logistic regression / Binomial regression / Poisson regressions
Partition of sums of squares
  • Analysis of variance
  • Analysis of covariance
  • Multivariate analysis of variance
  • Degrees of freedom (statistics)
Categorical variable / Multivariate statistics / Chuỗi thời gian / Survival analysis
Categorical variable
  • Cohen's kappa
  • Contingency table
  • Mô hình xác suất dạng đồ thị
  • Poisson regression
  • McNemar's test
Multivariate statistics
  • General linear model
  • Multivariate analysis of variance
  • Phép phân tích thành phần chính
  • Canonical correlation
  • Linear discriminant analysis
  • Phân nhóm dữ liệu
  • Phân loại bằng thống kê
  • Structural equation modeling
    • Phân tích nhân tố
  • Joint probability distributions
    • Elliptical distributions
      • Phân phối chuẩn nhiều chiều
Chuỗi thời gian
General
  • Decomposition of time series
  • Linear trend estimation
  • Stationary process
  • Seasonal adjustment
  • Exponential smoothing
  • Cointegration
  • Structural break
  • Granger causality
Specific tests
  • Dickey–Fuller test
  • Kiểm định Johansen
  • Ljung–Box test
  • Thống kê Durbin–Watson
  • Breusch–Godfrey test
Time domain
  • Autocorrelation
    • Partial autocorrelation function
  • Cross-correlation
  • Arma
  • Box–Jenkins method
  • ARCH
  • Vector autoregression
Frequency domain
  • Spectral density estimation
  • Giải tích Fourier
  • Wavelet
  • Whittle likelihood
Survival analysis
Survival function
  • Kaplan–Meier estimator
  • Proportional hazards models
  • Accelerated failure time model
  • First-hitting-time model
Failure rate
  • Nelson–Aalen estimator
Test
  • Logrank test
List of fields of application of statistics
Biostatistics
  • Tin sinh học
  • Thử nghiệm lâm sàngs / Clinical study design
  • Dịch tễ học
  • Medical statistics
Engineering statistics
  • Chemometrics
  • Methods engineering
  • Probabilistic design
  • Statistical process control / Kiểm soát chất lượng
  • Reliability engineering
  • System identification
Social statistics
  • Actuarial science
  • Điều tra dân số
  • Crime statistics
  • Demographic statistics
  • Kinh tế lượng
  • Jurimetrics
  • National accounts
  • Official statistics
  • Demographic statistics
  • Psychometrics
Spatial analysis
  • Bản đồ học
  • Thống kê môi trường
  • Hệ thống Thông tin Địa lý
  • Địa thống kê
  • Kriging
  • Thể loạiThể loại:Thống kê
  • '
  • Trang CommonsCommons:Category:Statistics
  • Dự án Wiki Wikipedia:WikiProject Statistics
Cổng thông tin:
  • icon Toán học
Cơ sở dữ liệu tiêu đề chuẩn Sửa dữ liệu tại Wikidata
Quốc tế
  • GND
Quốc gia
  • Cộng hòa Séc

Từ khóa » Trung Bình Cộng 2 Số Là Gì