
Tại sao tâm lý cờ bạc cuối cùng luôn thua sạch? Quy luật sinh tồn trong hệ thống phi遍历性
Tuyển chọn TechFlowTuyển chọn TechFlow

Tại sao tâm lý cờ bạc cuối cùng luôn thua sạch? Quy luật sinh tồn trong hệ thống phi遍历性
Cứ cảm giác chỉ cần chơi thêm một ván nữa là có thể lật ngược tình thế, chính là vì chúng ta nhầm lẫn trung bình tập thể thành vận mệnh cá nhân.
Tác giả: Tuyết Ngạc, DataCafe

Hãy tưởng tượng bạn tham gia một trò chơi tung đồng xu với số vốn khởi điểm 1.000 nhân dân tệ, và bạn có thể chọn tiếp tục chơi mãi:
Mỗi vòng tung một lần đồng xu,
Nếu ra mặt ngửa, tài sản tăng 80%.
Nếu ra mặt sấp, tài sản giảm 50%.
Nghe thì có vẻ là một trò chơi chắc chắn thắng!
Nhưng thực tế lại là…
Nếu để 100.000 người chơi tham gia trò này, mỗi người chơi 100 vòng, bạn sẽ thấy: trung bình tài sản của họ thật sự tăng theo cấp số mũ, nhưng phần lớn mọi người cuối cùng lại có tài sản dưới 72 tệ, thậm chí phá sản!
Tại sao trung bình tài sản tăng lên mà đa số người chơi lại càng chơi càng nghèo?
Đây chính là cái bẫy điển hình của tính không hỗn độn (non-ergodicity). Cảm giác chỉ cần chơi thêm một ván nữa là gỡ được, bắt nguồn từ việc chúng ta nhầm lẫn trung bình nhóm với vận mệnh cá nhân.
Cái bẫy của tính không hỗn độn: Trung bình dài hạn ≠ Vận mệnh thực sự của bạn
Vậy tính hỗn độn (ergodicity) là gì?
Khái niệm "tính hỗn độn" ban đầu xuất hiện trong vật lý thống kê, sau đó ảnh hưởng sâu rộng đến xác suất học, tài chính, khoa học hành vi, học máy... Nó nhằm trả lời câu hỏi cốt lõi: Giá trị trung bình dài hạn có áp dụng được cho cá thể hay không? Khi ra quyết định, ta nên tin vào “trung bình dài hạn” hay hiện thực “trải nghiệm từng lần”?
Thế kỷ 19, nhà vật lý Ludwig Boltzmann nghiên cứu chuyển động phân tử khí đã đưa ra giả thuyết hỗn độn: Nếu quan sát một phân tử khí đủ lâu, nó sẽ đi qua tất cả các trạng thái khả dĩ.
Hãy tưởng tượng một bình kín chứa khí, bên trong có vô số phân tử khí, mỗi phân tử đều trải qua các quỹ đạo tốc độ khác nhau do va chạm. Quỹ đạo dài hạn của một phân tử đơn lẻ giống như phân bố thống kê toàn bộ khối khí, nghĩa là ta có thể dùng trạng thái của tất cả các phân tử tại một thời điểm để suy đoán quỹ đạo dài hạn của một phân tử đơn.
Đó chính là giả thuyết hỗn độn nổi tiếng của Boltzmann.

Toán học, tính hỗn độn có nghĩa là:

Vế trái là trung bình thời gian: mô tả kết quả trung bình thu được khi một cá thể trải qua cùng một quá trình nhiều lần trong thời gian đủ dài;
Vế phải là trung bình tập hợp: mô tả kỳ vọng thống kê thu được khi quan sát vô số cá thể tại một thời điểm. Nói cách khác: khi hệ thống thỏa mãn điều kiện hỗn độn, biểu hiện của cá thể đơn lẻ cuối cùng sẽ hội tụ về "trung bình dài hạn" của tập hợp.
Nếu thế giới là hỗn độn, tài sản của mọi người cuối cùng sẽ tiến gần đến mức trung bình xã hội. Trong thế giới hỗn độn, ai cũng trải nghiệm tất cả các trạng thái kinh tế khả dĩ (giàu có, nghèo khó, thành công, thất bại), vận mệnh cá nhân luôn hội tụ về "trung bình dài hạn" của tập hợp.
Nhưng thực tế thường là phi hỗn độn: nguồn lực cá nhân có hạn, thường bị loại khỏi cuộc chơi trước khi trải qua tất cả các con đường khả dĩ do một thất bại nào đó.
Chúng ta thường nghe những phát biểu mang tính dẫn dắt như:
"Thu nhập trung bình ngành X vượt trăm ngàn mỗi năm."
"Người Y 30 tuổi đã tự do tài chính, khởi nghiệp chỉ mất hai năm."
"Quỹ chỉ số Z có lợi suất dài hạn cao, cứ đầu tư kiên trì là sẽ giàu."
…
Những dữ liệu thống kê tưởng chừng hợp lý này dường như đang nói với ta một chân lý rõ ràng. Dường như chỉ cần hành động, lợi nhuận trung bình dài hạn sẽ thuộc về bản thân. Nhưng những trường hợp này thuộc về quá trình phi hỗn độn: phụ thuộc đường đi + không thể sao chép. Người bắt chước không thể trải nghiệm cùng bối cảnh lịch sử, mạng lưới quan hệ, cơ may, thậm chí còn không biết số lượng người thất bại ẩn giấu.
Dữ liệu nói cho bạn biết giá trị trung bình dài hạn của tập hợp, nhưng thực tế lại đầy rẫy những "sụp đổ đột ngột" ngắn hạn.
Đây chính là cái bẫy tinh vi nhất của tính phi hỗn độn —— trung bình thống kê từ dữ liệu lớn ≠ vận mệnh thực sự của cá nhân.
Một lần sụp đổ với cá nhân có thể không bao giờ bù đắp được, một lần thất bại có thể khiến người ta bị loại hoàn toàn, không thể trở lại "trạng thái trung bình". Mỗi người chúng ta chỉ sống một lần theo một con đường duy nhất, không thể như sòng bạc, dựa vào trung bình dài hạn của tập thể, chờ xác suất được san bằng qua vô số người cược.
Tại sao vận mệnh dài hạn của cá nhân thường tệ hơn "giá trị trung bình"?
Trong hệ thống phi hỗn độn, biểu hiện dài hạn của cá nhân thường thấp hơn trung bình tập hợp. Đây không phải trùng hợp, mà là đặc điểm cấu trúc hệ thống. Giá trị trung bình hào nhoáng thường bị kéo lên bởi một vài câu chuyện cực kỳ hiếm: khởi nghiệp thành công, đầu tư làm giàu, lật ngược tình thế. Phần lớn thất bại không bao giờ được đưa vào thống kê.
Hệ thống thực tế đa số là kiểu nhiều và có sự phụ thuộc vào đường đi —— ví dụ như lãi kép đầu tư, sự suy giảm sức khỏe, sự hủy hoại danh tiếng. Đặc điểm điển hình của các hệ thống này là: lên có giới hạn, xuống thì không đáy.
Một lần phá sản có thể hủy hoại cả đời;
Một quyết định sai lầm có thể thay đổi hoàn toàn vận mệnh;
Một lần失信 có thể phá hủy hoàn toàn niềm tin;
Trong khi của cải kiếm được, hiệu suất tăng lên, lợi thế xây dựng được luôn luôn hữu hạn.
Đây chính là lý do vì sao về mặt toán học, tốc độ tăng trưởng dài hạn của quá trình nhân không bằng "lợi nhuận trung bình", mà gần hơn với:

So với đó, trung bình tập hợp thường dùng trung bình cộng:

Vì hàm logarit là hàm lõm nghiêm ngặt, theo bất đẳng thức Jensen, ta có:

Do đó, tốc độ tăng trưởng dài hạn của hệ thống nhân (tức trung bình nhân) luôn nhỏ hơn trung bình cộng. Biến động càng lớn, khoảng cách này càng rõ rệt. Trung bình cộng nói với bạn 'nếu may mắn mãi thì sao', còn trung bình nhân nói với bạn 'sau khi trải qua mưa gió trên thế giới thực, bạn còn lại bao nhiêu'.
Điều này có nghĩa làvận mệnh dài hạn của cá nhân luôn thấp hơn nhiều so với "lợi nhuận trung bình tập hợp", không phải do xui xẻo mà do cấu trúc.
Làm sao để ra quyết định tối ưu? Đường ranh vàng của công thức Kelly
Vậy trong các quyết định cuộc đời, ta có thể làm gì để tránh vận mệnh về số không trong trò chơi dài hạn? Làm thế nào để không bị loại mà vẫn đạt tăng trưởng kép dài hạn?
Câu trả lời là: Đừng bao giờ All in, hãy học cách đặt cược Kelly!
Công thức Kelly (Kelly Criterion) là chiến lược đặt cược tối ưu trong các trò chơi lặp lại, mục tiêu là tối đa hóa lợi nhuận dài hạn đồng thời tránh bị thua sạch trong ngắn hạn. Công thức này ban đầu do John L. Kelly Jr. đề xuất năm 1956 tại phòng thí nghiệm Bell, ban đầu nhằm giải quyết bài toán "phân bổ công suất tín hiệu trong kênh nhiễu" để tối đa hóa hiệu quả truyền thông tin.
Sau đó, lý thuyết này nhanh chóng lan rộng sang các lĩnh vực khác.
Nhà toán học Mỹ, thiên tài đầu tư Edward Thorp phát hiện công thức Kelly có thể tối ưu hóa đường đi tăng trưởng tài sản. Ông mang nó vào sòng bạc, lần đầu tiên dùng nó đánh bại nhà cái blackjack trong cuốn sách Beat the Dealer, rồi mang nó tới Phố Wall, tiếp tục "thu hoạch" trong cuốn Beat the Market.
Nguyên tắc này về bản chất tương đương với tối đa hóa lợi nhuận kỳ vọng logarit (log-utility), từ đó cân bằng động giữa tăng trưởng và rủi ro. Nó giúp bạn tìm được điểm tối ưu giữa "sống dai" và "kiếm được nhiều".
Công thức Kelly:

Trong đó, xác suất thành công là p, xác suất thất bại là q = 1-p; tỷ lệ lợi nhuận khi thành công (không bao gồm vốn gốc) là b, tỷ lệ thua lỗ khi thất bại là a (thường là 1, nếu mất toàn bộ số tiền đặt cược).
Quay lại trò chơi tung đồng xu ở phần mở đầu, bạn có thể chọn đặt cược một tỷ lệ nhất định của vốn gốc và tiếp tục chơi mãi, nhưngmỗi lần đặt bao nhiêu là hợp lý nhất?

Nghĩa là, công thức Kelly khuyên bạn mỗi lần nên bỏ ra 37,5% tổng vốn. Đặt cược quá nhiều, dù có lợi thế, vẫn có thể bị cháy tài khoản do thua liên tiếp; đặt cược quá ít lại bỏ lỡ cơ hội tăng trưởng đáng có.
Ý nghĩa của công thức Kelly nằm ở chỗ: tìm ra điểm vừa có thể kiếm được nhiều nhất về lâu dài, vừa đảm bảo sống sót.
Bổ sung một điểm, công thức Kelly rất nhạy cảm với tỷ lệ thắng/thua, nhưng trong thực tế các tham số này thường không chắc chắn hoặc thay đổi theo thời gian, do đó nhiều người thực hành thận trọng chọn một nửa giá trị đề nghị của Kelly (gọi là chiến lược nửa Kelly) để có đường đi lợi nhuận mượt mà hơn.
Thí nghiệm mô phỏng: 100.000 người chơi tung đồng xu, bao nhiêu người có thể "sống sót"?
Để hiểu trực quan hơn ảnh hưởng của các chiến lược đặt cược khác nhau đối với vận mệnh cá nhân, tôi đã mô phỏng 100.000 người chơi tham gia trò chơi tung đồng xu ở phần mở đầu, tổng cộng 200 vòng, mỗi người chơi độc lập.
Luật chơi vẫn như cũ: vốn gốc 1.000, mặt ngửa tăng 80%, mặt sấp giảm 50%. Người chơi có thể chọn tỷ lệ đặt cược cố định: ví dụ đặt toàn bộ (100%), đặt 65%, 37,5%, …
Kết quả… Người chơi đặt 100% gần như tuyệt diệt!
Tài sản cuối cùng phân bố theo "luật lũy thừa", dù có một số rất ít người làm giàu, nhưng phần lớn đều phá sản.
Chúng ta so sánh phân bố tài sản của 4 chiến lược đặt cược khác nhau, phân bố tài sản càng dịch phải thì tài sản càng cao.
a. Đặt 100%: hầu hết mọi người phá sản

Phân bố tài sản cuối cùng khi đặt toàn bộ có đỉnh nghèo khổ khổng lồ bên trái + đuôi làm giàu cực mảnh bên phải: phần lớn phá sản, một số rất ít kiếm toàn bộ tiền, đây chính là minh chứng thực tế của bất đối xứng trò chơi + thiên kiến người sống sót.
b. Đặt 65%: vẫn phân cực, vẫn có rất nhiều người phá sản

c. Đặt 37,5% (công thức Kelly): tài sản tăng ổn định

Dưới chiến lược đặt cược Kelly, phân bố tài sản rõ ràng dịch phải, đa số người tăng tài sản và phân bố tập trung, là mô hình tích lũy tài sản tối ưu.
d. Đặt 10%: gần như không ai phá sản nhưng lợi nhuận quá thấp

Không còn đỉnh phân bố phá sản như đặt toàn bộ, nhưng toàn bộ tài sản tập trung ở vùng thấp. So sánh, chiến lược 37,5% sẽ kéo ra đuôi dài rõ rệt ở bên phải, đạt nhân đôi tài sản.
Đặt cược Kelly là chiến lược duy nhất kết hợp cả "đa số không phá sản" và "tăng giá đáng kể", là chiến lược sinh tồn dài hạn tối ưu về mặt toán học. Đây chính là tinh túy của công thức Kelly: Nó không giúp bạn thắng nhiều nhất, mà đảm bảo bạn sống đủ lâu.
Triết lý sống trong công thức Kelly
Công thức Kelly dạy ta rằng, bí quyết thành công dài hạn là học cách kiểm soát tỷ lệ "đặt cược". Cuộc sống không phải cuộc đua xem ai tung cú chí mạng một lần, mà là xem ai có thể tiếp tục chơi mãi.
Trong nghề nghiệp, không phải từ chức liều lĩnh hay bám trụ vùng an toàn, mà là liên tục bố trí, nâng cao năng lực, dám thay đổi hướng đi, giữ lại quyền lựa chọn;
Trong đầu tư, không phải liều tất để làm giàu, mà là kiểm soát tỷ trọng theo tỷ lệ cược, giữ lại vốn;
Trong các mối quan hệ, không đặt toàn bộ cảm xúc và giá trị vào một người, mà là đầu tư đồng thời giữ lấy bản ngã;
Trong trưởng thành và tự kỷ luật, không dựa vào một lần bùng nổ để thay đổi, mà là tối ưu cấu trúc cuộc sống theo cách ổn định, kép lợi.
Đời người giống như một trò chơi dài, mục tiêu của bạn không phải thắng một lần, mà là đảm bảo bản thân có thể tiếp tục chơi mãi. Chỉ cần chưa bị loại, nhất định sẽ có điều tốt xảy ra.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














