Trò Chơi Ra Tín Hiệu – Wikipedia Tiếng Việt

Biểu diễn "Trò chơi ra tín hiệu" theo dạng mở rộng

Trò chơi ra tín hiệu là trò chơi Bayes dạng động (người chơi có thể nói dối, thực hiện hành vi khác với bản chất thực), với 2 người chơi, một người ra tín hiệu (The Sender - S) và một người nhận tín hiệu (The receiver - R). Người ra tín hiệu là người có bản chất nhất định được quy định trước, gọi là kiểu người chơi, t (Type of player - t). Người ra tín hiệu có thể quan sát và biết chắc về kiểu người chơi của bản thân, trong khi người nhận tín hiệu không biết về kiểu người chơi của người ra tín hiệu. Dựa vào thông tin đã biết, người ra tín hiệu quyết định chọn một thông điệp trong tập hợp các thông điệp có thể sử dụng, gọi là M = {m1, m2, m3,..., mj}. Người nhận tín hiệu có thể quan sát thông điệp được đưa ra, nhưng không quan sát được kiểu người chơi của người ra tín hiệu. Sau đó, người nhận tín hiệu chọn một hành động trong tập hợp các hành động có thể thực hiện, gọi là tập hợp A = {a1, a2, a3,...., ak}. Hai người chơi nhận được khoản thu hoạch nhiều hay ít dựa vào kiểu người chơi (t) của người ra tín hiệu, thông điệp (mi) mà người ra tín hiệu đã chọn,và hành động (ai) mà người nhận tín hiệu thực hiện.[1][2] Trong lý thuyết trò chơi, có một trò chơi liên quan đến khái niệm này, gọi là trò chơi sàng lọc, tại đó, người nhận tín hiệu không lựa chọn hành động dựa theo tín hiệu nhận được, mà đưa ra đề nghị cho người ra tín hiệu, dựa trên kiểu người chơi của người ra tín hiệu (trong khi đó, người ra tín hiệu có quyền kiểm soát nhất định đối với kiểu người chơi của bản thân).

Ra tín hiệu có mất phí hoặc không mất phí

[sửa | sửa mã nguồn]

Trò chơi ra tín hiệu được ứng dụng phổ biển trong kinh tế và sinh học, một trong những trường hợp thường sử dụng là để xác định các điều kiện giúp trò chơi đạt được thế cân bằng khi người chơi ra tín hiệu thật, phản ánh đúng bản chất/kiểu người chơi của bản thân (người chơi không nói dối). Nói một cách khác, trong điều kiện nào ta có thể tin rằng một con người có lý trí, hoặc một con vật phải đối mặt với quá trình chọn lọc tự nhiên, sẽ tiết lộ thông tin thật về bản chất của mình?

Nếu cả hai bên có cùng mối quan tâm, và đều muốn đạt được cùng một kết quả trong mọi trường hợp, khi đó có thể đạt được thế cân bằng khi người chơi nói thật. (Mặc dù trong hầu hết các trường hợp, vẫn tồn tại các thế cân bằng không liên lạc - người chơi không được lợi hơn hay bị thiệt đi khi phá vỡ các thế cân bằng này). Tuy nhiên, nếu mối quan tâm của hai bên không hoàn toàn đồng nhất, khi đó sẽ xảy ra vấn đề duy trì hệ thống ra tín hiệu thông tin.

Xét một trường hợp được miêu tả bởi John Maynard Smith, liên quan đến việc trao đổi giữa các cá thể có liên quan. Giả sử bên ra tín hiệu (ví dụ, chuột trong phòng thí nghiệm) có thể đang cực kì đói, hoặc chỉ hơi đói bụng, và có thể ra tín hiệu thông báo thông tin đó cho người đang giữ đồ ăn. Giả sử bên ra tín hiệu lúc nào cũng muốn có thêm đồ ăn (dù chỉ hơi đói bụng), nhưng người giữ đồ ăn chỉ muốn đưa đồ ăn khi đối tượng đã cực kì đói. Mặc dù cả hai bên sẽ có chung một mục tiêu trong trường hợp bên ra tín hiệu đang cực kì đói, nhưng lại có mục đích khác nhau nếu bên ra tín hiệu chỉ mới hơi đói bụng. Do đó, bên ra tín hiệu, ngay cả khi chỉ hơi đói bụng, cũng sẽ muốn làm quá lên, nói dối về thực trạng để nhận được thức ăn. Và nếu bên ra tín hiệu nói dối thường xuyên, bên nhận tín hiệu nên bỏ qua các tín hiệu và làm những gì mình tin là hợp lý nhất.

Các nhà kinh tế và sinh vật học đều quan tâm đến việc xác định xem, trong những trường hợp như vậy, việc ra tín hiệu ổn định đến mức nào. Xét về mặt kinh tế cũng như sinh học, các nhà nghiên cứu làm việc độc lập với nhau, nhưng đều cùng đưa ra nhận định rằng chi phí phải trả khi ra tín hiệu có thể đóng vai trò đáng kể. Nếu bên ra tín hiệu phải trả phí để ra tín hiệu, đối tượng sẽ chỉ ra tín hiệu khi chi phí bỏ ra là xứng đáng, tức là đối tượng đã thực sự đói bụng và cần đồ ăn.

Cân bằng Bayes hoàn hảo

[sửa | sửa mã nguồn]

Khái niệm cân bằng được sử dụng để giải quyết trò chơi ra tín hiệu là Cân bằng Bayes hoàn hảo. Cân bằng Bayes hoàn hảo là một cách tinh giản Cân bằng Bayes-Nash, là trường hợp mở rộng cho khái niệm Cân bằng Nash trong trò chơi với thông tin không đầy đủ. Cân bằng Bayes hoàn hảo là khái niệm cân bằng có liên quan đến các trò chơi động với thông tin không đầy đủ.

Người ra tín hiệu có kiểu người chơi là  t j {\displaystyle t_{j}}  đưa ra thông điệp m ∗ ( t j ) {\displaystyle m^{*}(t_{j})}  trong tập hợp phân phối xác suất M. ( m ( t j ) {\displaystyle m(t_{j})}  đại diện cho xác suất tại đó kiểu người chơi  t j {\displaystyle t_{j}}  sẽ chọn bất kì thông điệp  nào trong tập hợp M.) Người nhận tín hiệu quan sát thông điệp m và quyết định chọn thực hiện hành động a ∗ ( m ) {\displaystyle a^{*}(m)}  trong không gian phân phối xác suất A.

Một trò chơi đạt được cân bằng Bayes hoàn hảo nếu thỏa mãn toàn bộ bốn yêu cầu sau:

  • Người nhận tín hiệu phải có niềm tin về kiểu người chơi nào đã gửi thông điệp m. Niềm tin này có thể biểu diễn bằng phân phối xác suất   μ ( t i | m ) {\displaystyle \mu (t_{i}|m)}  - xác suất mà người ra tín hiệu thuộc kiểu người chơi  t i {\displaystyle t_{i}}  nếu người đó chọn thông điệp m {\displaystyle m} . Tổng tất cả xác suất của các kiểu người chơi  t i {\displaystyle t_{i}}  phải bằng 1 xét trong điều kiện của từng thông điệp m.
  • Hành động mà người nhận tín hiệu đã chọn phải giúp người đó đạt được lợi ích dự tính ở mức tối đa, với điều kiện cho trước là niềm tin của người đó về kiểu người chơi nào sẽ có thể tung ra thông điệp  m {\displaystyle m} , μ ( t | m ) {\displaystyle \mu (t|m)} . Điều này cũng có nghĩa là, tổng  ∑ t i μ ( t i | m ) U R ( t i , m , a ) {\displaystyle \sum _{t_{i}}\mu (t_{i}|m)U_{R}(t_{i},m,a)}  đạt giá trị tối đa. Hành động  a {\displaystyle a}  giúp đạt được tổng lợi ích cao nhất được gọi là a ∗ ( m ) {\displaystyle a^{*}(m)} .
  • Đối với mỗi kiểu người chơi, t {\displaystyle t} , người ra tín hiệu chọn một thông điệp  m ∗ {\displaystyle m^{*}}  giúp người đó đạt được khoản lợi ích cao nhất có thể U S ( t , m , a ∗ ( m ) ) {\displaystyle U_{S}(t,m,a^{*}(m))}  với điều kiện cho trước là chiến lược a ∗ {\displaystyle a^{*}}  do người nhận tín hiệu lựa chọn.
  • Đối với mỗi thông điệp  m {\displaystyle m}  mà người ra tín hiệu có thể sử dụng, nếu tồn tại một kiểu người chơi t {\displaystyle t} sao cho m ∗ ( t ) {\displaystyle m^{*}(t)}  luôn ấn định xác suất m {\displaystyle m}  luôn dương (ví dụ, với mỗi thông điệp được sử dụng đều có xác suất dương), niềm tin của người nhận tín hiệu về kiểu người chơi của người ra tín hiệu nếu người đó nhận được thông điệp  m {\displaystyle m}  - gọi là  μ ( t | m ) {\displaystyle \mu (t|m)}  - phải thỏa mãn nguyên tắc Bayes: μ ( t | m ) = p ( t ) / ∑ t i p ( t i ) {\displaystyle \mu (t|m)=p(t)/\sum _{t_{i}}p(t_{i})}

Cân bằng Bayes hoàn hảo trong trò chơi như vậy có thể chia thành ba nhóm khác nhau: Cân bằng pha trộn (pooling equilibria), Cân bằng nửa pha trộn (semi-pooling), hay còn gọi là Cân bằng nửa tách (semi-separating), và cuối cùng là Cân bằng tách (separating equilibria). Cân bằng pha trộn là thế cân bằng mà tại đó người ra tín hiệu với các kiểu người chơi khác nhau nhưng đều chọn cùng một thông điệp. Cân bằng nửa pha trộn (hay Cân bằng nửa tách) là thế cân bằng mà tại đó ra tín hiệu, một số kiểu người chơi chọn cùng một thông điệp, và một số kiểu người chơi khác chọn những thông điệp khác nhau. Do đó, nếu có nhiều kiểu người chơi nhiều hơn là số thông điệp, thế cân bằng sẽ không thể là cân bằng tách (nhưng vẫn có thể là cân bằng nửa tách)

Ứng dụng Trò chơi ra tín hiệu

[sửa | sửa mã nguồn]

Trò chơi ra tín hiệu miêu tả các trường hợp tại đó một người chơi nắm được thông tin mà đối phương bên kia không biết. Những trường hợp thông tin bất đối xứng này rất phổ biến trong ngành kinh tế và sinh học hành vi.

Triết học

[sửa | sửa mã nguồn]

Người ta biết đến việc ứng dụng trò chơi ra tín hiệu lần đầu tiên trong luận án tiến sĩ của David K. Lewis và sau này được xuất bản thành sách có tên Quy ướcConvention.[3] Nhằm trả lời cho nhận định của W.V.O. Quine,[4][5] Lewis nỗ lực phát triển một hệ lý thuyết về các quy ước và ý nghĩa, bằng cách áp dụng trò chơi ra tín hiệu. Trong phản hồi cực đoan nhất, ông thậm chí còn cho rằng, chỉ cần hiểu được thế cân bằng của trò chơi ra tín hiệu là đã hiểu được toàn bộ những gì cần biết về ý nghĩa:

Cho đến giờ tôi đã miêu tả đặc điểm của một trường hợp ra tín hiệu mà không hề nhắc đến ý nghĩa của tín hiệu đó: hai ngọn đèn lồng có nghĩa là chiếc áo đỏ sẽ đến từ phía biển, hay bất kì ý nghĩa nào đi nữa. Nhưng dường như mọi điều cần nói đều đã được nói đến cả rồi, không có thiếu sót gì quan trọng; do đó, những điều đã nói, theo một cách nào đó, có thể ám chỉ rằng các tín hiệu cũng có ý nghĩa riêng.[6]

Việc sử dụng trò chơi ra tín hiệu vẫn tiếp diễn trong nhiều tác phẩm triết học sau đó. Nhiều tác giả khác đã sử dụng mô hình tiến hóa của trò chơi ra tín hiệu để miêu tả sự hình thành của ngôn ngữ. Các tác phẩm nói về sự hình thành của ngôn ngữ sử dụng trò chơi ra tín hiệu đơn giản, bao gồm các mô hình của Huttegger,[7] Grim, và cộng sự,[8] Skyrms,[9][10] và Zollman.[11] Harms,[12][13] và Huttegger,[14] đã nỗ lực mở rộng phạm vi nghiên cứu, để bao hàm sự khác biệt giữa ngôn ngữ quy phạm và ngôn ngữ diễn tả. 

Kinh tế

[sửa | sửa mã nguồn]

Ứng dụng đầu tiên của trò chơi ra tín hiệu vào các vấn đề kinh tế là mô hình của Michael Spence về việc ra tín hiệu trong thị trường lao động.[15] Spence miêu tả một trò chơi mà tại đó, người lao động có một khả năng nhất định (trình độ cao hoặc thấp) mà nhà tuyển dụng không nắm được. Người lao động đưa ra tín hiệu bằng việc lựa chọn học tập để lấy bằng cấp. Chi phí học tập đối với người lao động trình độ thấp là tốn kém hơn so với người lao động trình độ cao. Nhà tuyển dụng quan sát được bằng cấp học vấn của người lao động, nhưng không quan sát được khả năng thực của họ, và phải đưa ra quyết định trả lương cao hay thấp cho người lao động. Trong mô hình này, giả sử bằng cấp không giúp cải thiện khả năng làm việc của người lao động, nhưng chỉ có người lao động có khả năng mới có thể đạt được bằng cấp cao mà không tốn nhiều chi phí hơn khoản tiền lương được thêm do có bằng cấp cao. Nói theo cách khác, lợi ích của việc đạt bằng cấp cao chỉ lớn hơn chi phí của người lao động có trình độ cao, do đó chỉ có những người lao động có trình độ mới đi học để lấy bằng.

Sinh học

[sửa | sửa mã nguồn]

Ngành sinh học đã đạt được  nhiều tiến bộ đáng giá khi áp dụng trò chơi ra tín hiệu vào mọt số nghi vấn sinh học. Đáng kể nhất là mô hình chấp của Alan Grafen (1990) nhấn mạnh về việc khoe mẽ để thu hút bạn tình.[16] Gạc sừng của loài hươu nai, bộ lông sặc sỡ của chim công và chim thiên đường, và tiếng hót của họa mi đều là những tín hiệu. Grafen phân tích những tín hiệu sinh học một cách nghiêm túc, tương tự như biểu đồ đồng biến cổ điển khi ra tín hiệu trong thị trường kinh tế của Michael Spence.[17] Gần đây, một loạt bài viết của Getty[18][19][20][21] cho thấy, phân tích của Grafen, cũng tương tự như của  Spence, dựa vào những giả định cực kì đơn giản, cho rằng các bên ra tín hiệu đánh đổi chi phí để thu được lợi ích bằng cách đơn giản là cộng dồn lợi và hại, tương tự như cách người ta đầu tư tiền để thu về lợi nhuận với cùng một đơn vị tiền tệ. Giả định cho rằng chi phí và lợi ích được đánh đổi bằng cách cộng trừ có thể áp dụng được đối với một số hệ thống tín hiệu sinh học, nhưng không đúng đối với những đánh đổi theo cấp số nhân, ví dụ như phải đánh đổi giữa việc sống còn với lợi ích sinh sản được coi là sẽ làm dịu bớt quá trình tiến hóa của các dấu hiệu được lựa chọn do sinh sản.

Charles Godfray (1991) đã mô hình hóa hành vi xin ăn của chim non trong tổ dưới dạng trò chơi ra dấu hiệu.[22] Chim non trong tổ kêu gọi xin ăn không chỉ giúp chim bố mẹ biết rằng chim non đang đói, nhưng đồng thời lại cũng thu hút loài săn mồi tìm đến tổ. Chim bố mẹ và chim non do đó rơi vào mâu thuẫn. Chim non sẽ được lợi nếu chim bố mẹ cố gắng kiếm ăn nuôi chúng nhiều hơn mức chim bố mẹ nên đầu tư. Chim bố mẹ đang đánh đổi giữa việc đầu tư vào tổ chim non hiện tại với những lứa con sau này.

Các nhà sinh học cũng mô hình hóa việc thực hiện những dấu hiệu phòng vệ thành trò chơi ra tín hiệu.[23] Người ta đã biết linh dương Thompson thỉnh thoảng sẽ thực hiện một cú "stott" - nhảy lên cao vài feet khoe phần đuôi trắng khi chúng phát hiện ra kẻ săn mồi. Alcock và đồng sự đã gợi ý rằng hành động này là tín hiệu của linh dương cố tình thể hiện tốc độ của mình cho kẻ săn mồi biết. Hành động này sẽ thể hiện bản chất - kiểu người chơi rất rõ ràng, vì linh dương đang ốm không thể thực hiện được hành động như vậy, và do đó kẻ săn mồi sẽ trành không đuổi theo một con linh dương đang nhảy, vì rõ ràng là linh dương này rất nhanh nhẹn, và đã tự chứng minh là rất khó bắt được nó.

Khái niệm thông tin bất đối xứng trong ngành sinh học tế bào đã được biết rõ từ lâu.[24] Mặc dù các tế bào không phải đối tượng có lý trí, nhưng thực nghiệm đã chỉ ra rằng thông qua việc sao chép, lặp lại, chọn lựa và biến đổi gen, các tế bào có thể hành động theo nguyên tắc của trò chơi ra tín hiệu. Những mô hình như vậy đã được đề ra nhằm giải thích, ví dụ như sự xuất hiện của mã gen khi thế giới mới chỉ có toàn RNA và amino acid.[25]

Xem thêm

[sửa | sửa mã nguồn]
  • Cheap talk
  • Extensive form game
  • Game theory
  • Incomplete information
  • Screening game
  • Signalling (economics)
  • Signalling theory
  • Solution concept

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ Gibbons, Robert (1992). A Primer in Game Theory. New York: Harvester Wheatsheaf. ISBN 0-7450-1159-4.
  2. ^ Osborne, M. J. & Rubenstein, A. (1994). A Course in Game Theory. Cambridge: MIT Press. ISBN 0-262-65040-1.
  3. ^ Lewis, D. (1969). Convention. A Philosophical Study. Cambridge: Harvard University Press.
  4. ^ Quine, W. V. O. (1936). “Truth by Convention”. Philosophical Essays for Alfred North Whitehead. London: Longmans, Green & Co. tr. 90–124. ISBN 0-8462-0970-5. (Reprinting)
  5. ^ Quine, W. V. O. (1960). “Carnap and Logical Truth”. Synthese. 12 (4): 350–374. doi:10.1007/BF00485423.
  6. ^ Lewis (1969), p. 124.
  7. ^ Huttegger, S. M. (2007). “Evolution and the Explanation of Meaning”. Philosophy of Science. 74 (1): 1–24. doi:10.1086/519477.
  8. ^ Grim, P.; Kokalis, T.; Alai-Tafti, A.; Kilb, N.; St. Denis, Paul (2001). “Making Meaning Happen”. Technical Report #01-02. Stony Brook: Group for Logic and Formal Semantics SUNY, Stony Brook.
  9. ^ Skyrms, B. (1996). Evolution of the Social Contract. Cambridge: Cambridge University Press. ISBN 0-521-55471-3.
  10. ^ Skyrms, B. (2010). Signals Evolution, Learning & Information. New York: Oxford University Press. ISBN 978-0-19-958082-8.
  11. ^ Zollman, K. J. S. (2005). “Talking to Neighbors: The Evolution of Regional Meaning”. Philosophy of Science. 72 (1): 69–85. doi:10.1086/428390.
  12. ^ Harms, W. F. (2000). “Adaption and Moral Realism”. Biology and Philosophy. 15 (5): 699–712. doi:10.1023/A:1006661726993.
  13. ^ Harms, W. F. (2004). Information and Meaning in Evolutionary Processes. Cambridge: Cambridge University Press. ISBN 0-521-81514-2.
  14. ^ Huttegger, S. M. (2005). “Evolutionary Explanations of Indicatives and Imperatives”. Erkenntnis. 66 (3): 409–436. doi:10.1007/s10670-006-9022-1.
  15. ^ Spence, A. M. (1973). “Job Market Signaling”. Quarterly Journal of Economics. 87 (3): 355–374. doi:10.2307/1882010.
  16. ^ Grafen, A. (1990). “Biological signals as handicaps”. Journal of Theoretical Biology. 144 (4): 517–546. doi:10.1016/S0022-5193(05)80088-8. PMID 2402153.
  17. ^ Spence, A. M. (1974). Market Signaling: Information Transfer in Hiring and Related Processes. Cambridge: Harvard University Press.
  18. ^ Getty, T. (1998). “Handicap signalling: when fecundity and viability do not add up”. Animal Behaviour. 56 (1): 127–130. doi:10.1006/anbe.1998.0744. PMID 9710469.
  19. ^ Getty, T. (1998). “Reliable signalling need not be a handicap”. Animal Behaviour. 56 (1): 253–255. doi:10.1006/anbe.1998.0748. PMID 9710484.
  20. ^ Getty, T. (2002). “Signaling health versus parasites”. The American Naturalist. 159 (4): 363–371. doi:10.1086/338992. PMID 18707421.
  21. ^ Getty, T. (2006). “Sexually selected signals are not similar to sports handicaps”. Trends in Ecology & Evolution. 21 (2): 83–88. doi:10.1016/j.tree.2005.10.016.
  22. ^ Godfray, H. C. J. (1991). “Signalling of need by offspring to their parents”. Nature. 352 (6333): 328–330. doi:10.1038/352328a0.
  23. ^ Yachi, S. (1995). “How can honest signalling evolve? The role of the handicap principle”. Proceedings of the Royal Society of London B. 262 (1365): 283–288. doi:10.1098/rspb.1995.0207.
  24. ^ John Maynard Smith. (2000) The Concept of Information in Biology. Philosophy of Science. 67(2):177-194
  25. ^ Jee, J.; Sundstrom, A.; Massey, S.E.; Mishra, B. (2013). “What can information-asymmetric games tell us about the context of Crick's 'Frozen Accident'?”. Journal of the Royal Society Interface. 10 (88): 20130614. doi:10.1098/rsif.2013.0614. PMC 3785830. PMID 23985735.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)

Từ khóa » Trò Chơi Ra Là Gì