Thành viên:RHD-45/Bài toán Monty Hall

Bài toán Monty Hall

sửa
 
Đằng sau một trong ba cánh cửa là xe hơi. Người chơi chọn cánh cửa thứ 1. MC sau đó mở cánh cửa thứ 3 và đằng sau là dê. MC cho người chơi cơ hội để đổi lựa chọn từ cửa thứ 1 sang cửa thứ 2.

Bài toán Monty Hall là một câu đố tư duy liên quan đến xác suất, phỏng theo gameshow truyền hình Mỹ Let's Make a Deal và được đặt tên theo người dẫn chương trình Monty Hall. Bài toán được Steve Selvin lần đầu tiên đề ra và giải quyết trong một lá thư gửi đến tờ báo khoa học American Statisitican vào năm 1975.[1][2] Năm 1990, bài toán Monty Hall trở nên nổi tiếng sau khi độc giả Craig F. Whitaker gửi lá thư chứa bài toán cho mục báo "Ask Marilyn" do Marilyn vos Savant chủ biên trong tạp chí Parade.[3] Nội dung lá thư được trích dẫn như sau:

Giả sử bạn đang chơi một gameshow truyền hình, và bạn cần lựa chọn một trong ba cánh cửa. Đằng sau một cánh cửa là một chiếc xe hơi, và sau hai cánh còn lại là dê. Bạn chọn một cánh cửa, giả sử là cửa thứ 1. Người dẫn chương trình (MC), khi đó đã biết đằng sau ba cánh cửa có gì, mở cánh cửa thứ 3 và đằng sau là một con dê. Anh ta hỏi bạn: "Bạn có muốn thay đổi lựa chọn sang cửa thứ 2 hay không?" Vậy khả năng thắng xe hơi có cao hơn khi bạn đổi hay không?

Câu trả lời của Savant là nên đổi sang cánh cửa còn lại.[3] Theo giả thiết của bài toán, phương án đổi cửa có xác suất thắng xe hơi là 2/3, còn phương án giữ cửa ban đầu chỉ có xác suất là 1/3.

Khi người chơi lần đầu tiên lựa chọn một cánh cửa, xác suất để xe hơi đằng sau hai cánh cửa không chọn là 2/3. Xác suất này không thay đổi sau khi MC mở một cánh cửa có dê mà người chơi không chọn. Khi MC mở một trong hai cánh cửa không chọn và đằng sau không có xe hơi thì anh ta đã loại bỏ một phương án sai, khi đó xác suất 2/3 có xe hơi đằng sau một trong hai cánh cửa sẽ dồn vào cánh cửa còn lại chưa mở. Như vậy, cánh cửa không chọn và chưa mở sẽ có xác suất là 2/3, còn cánh cửa người chơi chọn ban đầu vẫn giữ nguyên xác suất 1/3.

Xác suất tính toán như trên phụ thuộc vào cách người chơi chọn cửa và phản ứng của MC. Điểm mấu chốt của bài toán này là sau khi MC mở một cánh cửa, anh ta đã trực tiếp cung cấp thêm thông tin về cửa thứ 2 và 3 khi đã biết người chơi đã chọn cửa thứ 1; tức là MC đã không cung cấp thêm thông tin gì cho cửa thứ 1, khiến cho nó giữ nguyên xác suất ban đầu. Điểm mấu chốt thứ hai là việc đổi cửa có sử dụng đến thông tin đã cung cấp, do đó khác hoàn toàn với việc chọn ngẫu nhiên một trong hai cửa. Trong trường hợp MC thực hiện hành động khác thì thông tin cung cấp sẽ thay đổi tương ứng và ảnh hưởng đến xác suất cuối cùng.

Nhiều độc giả của mục báo không chấp nhận lợi thế của việc đổi cửa và bác bỏ lời giải thích của Savant. Sau khi bài toán được đăng trong tạp chí Parade, khoảng 10.000 độc giả, trong đó có khoàng 1.000 tiến sĩ, đã đáp lại tạp chí và cho rằng Savant đã sai.[4] Mặc dù nhiều thí nghiệm, mô phỏng và chứng minh toán học đã được đề ra, nhiều người vẫn không tin rằng đổi cửa là chiến lược tối ưu nhất.[5] Paul Erdős, một trong những nhà toán học lỗi lạc nhất lịch sử, chỉ bắt đầu tin vào chiến lược này sau khi một mô phỏng máy tính do ông thực hiện đưa ra kết quả như Savant đã chứng minh.[6]

Bài toán Monty Hall là một dạng nghịch lý thuần túy, tức là một nghịch lý có đáp án phản trực giác đến khó tin nhưng vẫn chính xác. Về mặt toán học, bài toán này tương tự với bài toán "Ba kẻ tù nhân" và nghịch lý "Chiếc hộp của Bertrand".

Bài toán

sửa

Năm 1975, Steve Selvin đã viết một lá thư có chứa bài toán phỏng theo gameshow Let's Make a Deal và gửi cho tờ báo khoa học American Statiscians. Bài toán được đặt tên là "Bài toán Monty Hall" trong một lá thư phản hồi sau này. Về mặt toán học, bài toán có tính chất tương tự với bài toán "Ba kẻ tù nhân" trong mục báo "Mathematical Games" của Martin Gardner trong tạp chí Scientific American năm 1959, hay trò chơi "Ba chiếc vỏ" trong quyển sách Aha Gotcha của Gardner.

Giả thiết

sửa

Bài toán gốc trong mục báo Parade giải thích khá mơ hồ về hành vi của MC trong trò chơi. Tuy nhiên, dựa trên phần giải đáp của Marilyn vos Savant cho câu hỏi của Whitaker trong mục báo, kèm theo lời giải thích cụ thể của Selvin và Savant, hành vi của MC có thể được định nghĩa như sau:

  1. MC luôn mở cánh cửa mà người chơi không chọn.
  2. MC luôn mở cánh cửa có dê, không bao giờ mở cửa có xe hơi.
  3. MC luôn cho người chơi lựa chọn giữa cánh cửa đã chọn ban đầu và cánh cửa còn lại chưa mở.

Khi một trong các hành vi trên của MC thay đổi, xác suất thắng xe hơi của người chơi cũng bị thay đổi tương ứng. Bài toán thường được giả định rằng chiếc xe hơi sẽ được giấu ngẫu nhiên đằng sau ba cánh cửa, và trong trường hợp người chơi chọn trúng xe hơi ở lần chọn đầu tiên, MC sẽ ngẫu nhiên chọn và mở một trong hai cửa có dê còn lại. Một vài tác giả khác còn giả định rằng lựa chọn của người chơi cũng là ngẫu nhiên.

Lời giải đơn giản

sửa
 
Ba trường hợp có thể xảy ra trong bài toán. Trong hai trường hợp, người chơi trúng xe hơi nếu đổi cửa thay vì giữ cửa đã chọn.

Trong đáp án Savant đưa ra trong Parade, các trường hợp có thể xảy ra trong bài toán được trình bày dưới dạng bảng, bao gồm ba cách sắp xếp hai con dê và một chiếc xe hơi, và kết quả nếu người chơi chọn giữ lại hoặc đổi cửa (cho rằng người chơi lúc đầu chọn cửa thứ 1):

Cửa 1 Cửa 2 Cửa 3 Kết quả nếu giữ cửa 1 Kết quả nếu đổi cửa
Xe hơi Trúng xe hơi Trúng dê
Xe hơi Trúng dê Trúng xe hơi
Xe hơi Trúng dê Trúng xe hơi

Ba trường hợp trên đều xảy ra với xác suất 1/3 như nhau. Nếu người chơi giữ cửa đã chọn thì chỉ trúng xe hơi trong một trên ba trường hợp, trong khi đổi cửa sẽ trúng hai trên ba trường hợp.

Cách giải thích đơn giản nhất là, nếu người chơi chọn trúng dê trong lần chọn đầu tiên (2 trong 3 cửa) thì người chơi sẽ luôn luôn trúng xe hơi nếu đổi cửa, bởi vì vị trí của con dê (ngoài con mà người chơi đã chọn lúc đầu) đã bị tiết lộ khi MC mở cửa. Ngược lại, nếu người chơi chọn trúng xe hơi trong lần chọn đầu tiên (1 trong 3 cửa), người chơi sẽ không bao giờ thắng khi đổi cửa. Như vậy, khi ta sử dụng chiến thuật luôn đổi cửa thì xác suất thắng xe hơi sẽ phụ thuộc vào việc người chơi đã chọn trúng dê (xác suất 2/3) hay xe hơi (xác suất 1/3) trong lần chọn đầu tiên. Hành động mở cửa có dê của MC không thay đổi xác suất này.

Giải thích

sửa
 
Một kiểu chơi khác của bài toán. Lúc này người chơi chọn giữa hai cánh cửa sau khi MC đã mở một cánh cửa có dê, làm thay đổi xác suất thắng tương ứng.

Lí do xác suất không phải là 50/50

sửa

Đa số mọi người sẽ kết luận rằng đổi cửa không có lợi thế gì vì chỉ có một chiếc xe hơi đằng hai cánh cửa chưa mở nên tỉ lệ thắng là 50/50. Kết quả này chỉ đúng khi MC mở ngẫu nhiên cánh cửa mà không quan tâm đằng sau cửa có gì. Tuy nhiên, theo giả thiết của bài toán, MC mở cánh cửa nào là phụ thuộc vào lựa chọn lúc đầu của người chơi, do đó biến cố trước và sau khi MC mở cửa không phải là hai biến cố độc lập.

Bài toán thuận

sửa

Để minh họa, ta giả sử rằng người chơi luôn luôn chọn cửa 1 và MC sẽ luôn chọn cửa 3 bất cứ khi nào có thể. Trước khi MC mở cửa, cả ba cánh cửa đều có cùng xác suất có xe hơi đằng sau là 1/3. Khi đó, hai trường hợp có thể xảy ra. Nếu xe hơi nằm ở cửa 1, MC có quyền được chọn mở ngẫu nhiên giữa cửa 2 và cửa 3, vậy xác suất để xe hơi nằm ở cửa 1 MC chọn cửa 3 là 1/3 × 1/2 = 1/6. Nếu xe hơi nằm ở cửa 2, MC bắt buộc phải mở cửa 3 để tránh mâu thuẫn giả thiết bài toán, vậy xác suất để xe hơi nằm ở cửa 1 MC chọn cửa 3 lúc này là 1/3 × 1 = 1/3.

Người chơi chọn cửa 1
Xe hơi sau cửa 1 Xe hơi sau cửa 2 Xe hơi sau cửa 3
MC mở Cửa 2 Cửa 3 Cửa 3 (bắt buộc) Cửa 2 (bắt buộc)
Sau cánh cửa
Kết quả nếu đổi cửa Thua Thua Thắng Thắng
Xác suất chọn 1/6 1/6 1/3 1/3

Từ đó, ta có thể thấy xác suất để xe hơi nằm sau cửa 2 gấp đôi xác suất nằm ở cửa 1, chứng tỏ xác suất sau khi MC mở cửa không phải là 50/50. Điểm mấu chốt ở đây là nếu xe hơi nằm ở cửa 2 thì MC bắt buộc phải mở cửa 3, còn nếu ở cửa 1 thì MC có thể mở ngẫu nhiên một trong hai cánh cửa.

Bài toán nghịch

sửa

Một cách khác để làm rõ tác động của lựa chọn đầu tiên của người chơi là đảo ngược lại hành vi của MC trong đề bài. Biến thể này của bài toán Monty Hall xuất hiện trong mục báo của Savant vào tháng 11 năm 2006. Trong biến thể, MC quên mất vị trí của chiếc xe hơi, và sẽ mở hai cánh cửa còn lại một cách ngẫu nhiên. Trong trường hợp MC mở trúng cửa có dê và cho người chơi lựa chọn để đổi cửa, Savant trả lời: "Nếu MC không biết có gì đằng sau cánh cửa, việc giữ cửa hay đổi cửa là như nhau. Nếu anh ta biết, hãy đổi cửa".

Người chơi chọn cửa 1
Xe hơi sau cửa 1 Xe hơi sau cửa 2 Xe hơi sau cửa 3
MC mở Cửa 2 Cửa 3 Cửa 2 Cửa 3 Cửa 2 Cửa 3
Sau cánh cửa Xe hơi Xe hơi
Kết quả nếu đổi cửa Thua Thua ? Thắng Thắng ?
Xác suất chọn 1/6 1/6 1/6 1/6 1/6 1/6

Trong số sáu trường hợp xảy ra, có hai trường hợp MC mở luôn cửa có xe hơi. Kết quả trong các trường hợp đó là không rõ – có thể người chơi thắng hoặc thua ngay lập tức. Tuy nhiên, khi bám sát theo đề bài gốc, ta xét những trường hợp MC mở cửa có dê, gồm bốn trường hợp có cùng xác suất là 1/6. Có hai trường hợp khi đổi cửa sẽ thắng, và hai trường hợp còn lại khi đổi cửa sẽ thua. Như vậy, trong biến thể này, xác suất trúng xe hơi khi giữ cửa và đổi cửa là bằng nhau (1/6 + 1/6 = 1/3).

Xác suất để xe hơi nằm ở cửa người chơi đã chọn là 1/3 và ở hai cánh cửa còn lại là 2/3.
MC mở một cánh cửa. Xác suất của hai nhóm là không đổi, nhưng xác suất riêng của cửa đã mở là 0 và của cửa chưa mở là 2/3.

Nhóm cánh cửa

sửa

Thay vì hiểu rằng MC mở một cánh cửa duy nhất không trúng, ta có thể hình dung hai chiếc cửa không chọn được nhóm lại với nhau (do người chơi chỉ có thể chọn cánh cửa chưa mở trong nhóm đó). Người chơi lúc này lựa chọn giữa việc giữ xác suất ở cánh cửa đã chọn (1/3) hoặc đổi để giữ tổng xác suất ở hai cánh cửa còn lại (1/3 + 1/3 = 2/3). Xác suất 2/3 này không thay đổi sau khi MC mở cánh cửa có dê bởi vì anh ta biết đằng sau mỗi cánh cửa có gì và luôn luôn mở cửa có dê, hay nói cách khác, xác suất 2/3 đổ dồn vào cánh cửa còn lại chưa mở. Như vậy, việc người chơi đổi sang cánh cửa còn lại chưa mở và việc đổi sang nhóm hai cánh cửa không chọn là tương đương nhau, khi đó người chơi rõ ràng có lợi thế thắng xe hơi với xác suất là 2/3.

Theo lời của Keith Devlin, "Bằng cách mở cánh cửa, Monty lúc này như đang nói người chơi rằng: 'Có hai cánh cửa mà bạn đã không chọn, và xác suất để xe hơi ở đằng sau một trong hai cánh cửa đó là 2/3. Bởi vì tôi biết đằng sau cánh cửa nào là có xe hơi, tôi sẽ giúp bạn bằng cách sử dụng kiến thức đó và mở một trong hai cửa để cho bạn thấy rằng cửa đó không có chứa xe hơi. Lúc này bạn có thể tận dụng thông tin mà tôi mới cung cấp thêm cho bạn. Lựa chọn cửa A (cửa 1) của anh có xác suất thắng là 1 trên 3. Tôi đã không thay đổi điều đó. Nhưng bằng cách loại bỏ cửa C (cửa 3), tôi đã cho anh thấy rằng xác suất để xe hơi nằm sau cửa B (cửa 2) là 2 trên 3".

Tăng số lượng cửa

sửa

Savant nói rằng lời giải sẽ dễ hiểu hơn nếu đề bài có 1.000.000 cánh cửa. Trong trường hợp này, đằng sau 999.999 cánh cửa là dê và một cửa là giải thưởng. Sau khi người chơi chọn một cửa, MC sẽ mở 999.998 cửa và để lại một cửa. Xác suất thắng xe hơi lúc này là 999.999 trên 1.000.000. Theo trực giác, người chơi cần phải đặt câu hỏi rằng, trong số một triệu cánh cửa, xác suất để chọn đúng cửa có xe hơi ngay lần đầu là bao nhiêu. Stibel và cộng sự đặt ra giả thuyết rằng dung lượng bộ nhớ làm việc bị quá tải trong bài toán này, dẫn đến việc người giải quyết buộc phải "gộp" các lựa chọn thành hai khả năng có xác suất bằng nhau. Kết quả thí nghiệm cho thấy khi số lựa chọn tăng quá 7 cái (7 cửa), người tham gia có xu hướng đổi cửa nhiều hơn, dù vậy họ vẫn tính sai xác suất đổi cửa là 50/50.

Phản ứng

sửa

Làn sóng dư luận

sửa
Cô sai rồi, sai trầm trọng luôn! Có vẻ như cô không nắm được cách giải toán cơ bản nên tôi sẽ giải thích. Sau khi MC mở cửa có dê, bây giờ cô có khả năng trúng xe hơi là một trong hai. Cho dù cô có đổi lựa chọn đi chăng nữa thì xác suất vẫn giữ nguyên. Cái đất nước này dốt toán đủ rồi, và chúng tôi không cần những người IQ cao nhất thế giới làm dốt thêm đâu. Nhục nhã quá!

Scott Smith, Đại học Florida

Trong mục báo đầu tiên về bài toán Monty Hall, Savant giải thích rằng người chơi nên đổi cửa. Cô sau đó nhận được hàng ngàn thư hồi đáp từ độc giả; đa số mọi người, kể cả những người có bằng tiến sĩ, đều không đồng tình với lời giải của Savant. Từ năm 1990 đến 1991, Savant viết thêm ba mục báo trong tạp chí Parade để làm sáng tỏ bài toán. Cuộc tranh luận về bài toán được đề cập trong nhiều mục báo truyền thông như tờ The New York Times và mục "The Straight Dope" của Cecil Adams. Nhiều lá thư từ các độc giả được sử dụng để thảo luận và minh hoạ trong cuốn sách The Monty Hall Dilemma: A Cognitive Illusion Par Excellence của nhà xã hội học Donald Granberg.

Savant minh hoạ lời giải của mình bằng trò chơi vỏ sò. Cô giải thích: "Bạn nhìn ra chỗ khác, tôi để một hạt đậu dưới một trong ba vỏ sò. Rồi tôi nhờ bạn đặt ngón tay lên một vỏ sò. Xác suất để hạt đậu nằm dưới vỏ sò bạn chọn là 1/3, đúng chứ? Rồi tôi nhấc một vỏ sò trống từ hai vỏ còn lại lên. Cho dù bạn có chọn bất kì cái nào, vì tôi luôn luôn có thể (và sẽ) làm hành động này, chúng ta đã không làm gì để thay đổi xác suất dưới vỏ sò mà bạn đã chọn". Cô cũng mô phỏng lại bài toán bằng ba lá bài.

Savant phát biểu rằng, mặc dù một số độc giả phán đoán sai do quên nhận ra rằng MC luôn luôn mở cửa có dê, gần như tất cả những người gửi thư cho cô để hiểu rõ giả thiết của bài toán nhưng vẫn cho rằng đáp án của cô là sai.

Nguồn gốc của sự nhầm lẫn

sửa

Khi gặp bài toán Monty Hall lần đầu tiên, một lượng lớn người trả lời cho rằng hai cửa chưa mở có xác suất thắng bằng nhau và kết luận rằng việc đổi cửa không quan trọng. Trong số 228 người tham gia một bài nghiên cứu, chỉ có 13% lựa chọn đổi cửa. Nhà tâm lý học nhận thức Massimo Piatelli Palmarini phát biểu trong cuốn sách The Power of Logical Thinking rằng: "Chưa có một câu đố xác suất nào đánh lừa người ta liên tục như vậy [và] kể cả những người đoạt giải Nobel Vật lý cũng đưa ra đáp án không chính xác, và họ đinh ninh là nó đúng, và họ sẵn sàng viết báo đả kích những người đề ra đáp án thật sự". Khác với con người, chim bồ câu khi được liên tục tiếp xúc với bài toán sẽ nhanh chóng học theo lựa chọn đổi cửa.

Đa số các đề bài toán Monty Hall, nổi bật nhất là bài trong tạp chí Parade, không khớp với giả thiết của trò chơi trong gameshow thật. Chúng cũng không nói cụ thể hành vi của MC hay vị trí ngẫu nhiên của xe hơi. Tuy nhiên, Krauss và Wang phản biện rằng người trả lời vẫn tự đặt ra những giả thiết ngay cả khi nó không được nói rõ.

Ngay cả khi những yếu tố chủ quan trong quá trình miêu tả bài toán được kiểm soát, gần như tất cả những người trả lời đều cho rằng xác suất thắng xe hơi ở cả hai đều như nhau. Điều này là do trực giác cố hữu của con người có xu hướng coi xác suất của tất cả các biến đang xét là như nhau. Hành vi giữ cửa của đại đa số người tham gia có thể được giải thích qua những hiện tượng tâm lý sau:

  1. Hiệu ứng sở hữu – xu hướng đánh giá cao xác suất thắng của cánh cửa mà người chơi đã chọn hay "sở hữu".
  2. Thiên kiến hiện trạng – xu hướng giữ lại lựa chọn mà người chơi đã quyết định từ trước.
  3. Hiệu ứng lỗi thiếu và lỗi thừa – xu hướng mắc lỗi bằng cách không làm gì (giữ cửa) thay vì hành động (đổi cửa). Khi tất cả các lựa chọn đều như nhau, người ta thường dè chừng việc hành động do lo sợ sẽ thay đổi kết quả trong tương lai.

[add here]

Chỉ trích về lời giải đơn giản

sửa

Chú thích

sửa
  1. ^ Selvin 1975a.
  2. ^ Selvin 1975b.
  3. ^ a b vos Savant 1990a.
  4. ^ Tierney 1991.
  5. ^ vos Savant 1991a.
  6. ^ Vazsonyi 1999.