Backtest của bạn đang nói dối: Tại sao bạn phải sử dụng dữ liệu theo th ời điểm
Hãy cùng xây dựng một chiến lược giao dịch giả định đơn giản. Tiền đề rất rõ ràng và dựa trên một câu chuyện rất được bàn luận: khi coin rút khỏi sàn giao dịch, đó thường là dấu hiệu bullish. Lý do khá trực quan: coin chuyển khỏi sàn thường cho thấy holder đang rút về ví cá nhân, làm giảm lượng cung coin sẵn sàng bán ra. Ngược lại, coin chuyển lên sàn có thể cho thấy holder đang chuẩn bị bán.
Tuy nhiên, một ngày duy nhất coin rút khỏi sàn cũng chỉ là nhiễu. Để xác định một xu hướng thực sự, chúng ta sẽ sử dụng phương pháp giao cắt đường trung bình động trên số dư coin tại sàn. Khi trung bình động ngắn hạn giảm xuống dưới trung bình động dài hạn, điều này xác nhận rằng coin liên tục rút khỏi sàn trong một khoảng thời gian, chứ không phải chỉ là các sự kiện đơn lẻ.
Sử dụng số dư coin tại sàn Binance của Glassnode, chúng ta xác định các quy tắc sau:
- Vào lệnh mua khi trung bình động 5 ngày của số dư BTC tại Binance giảm xuống dưới trung bình động 14 ngày, báo hiệu xu hướng rút coin bền vững.
- Thoát lệnh bán khi trung bình động 5 ngày tăng trở lại vượt qua trung bình động 14 ngày, báo hiệu xu hướng rút coin đã đảo chiều và coin đang quay trở lại sàn.
Sau đó, chúng ta so sánh chiến lược này với chiến lược nắm giữ BTC đơn giản trong cùng giai đoạn, bắt đầu từ ngày 1/1/2024 đến ngày 9/3/2026, với số vốn ban đầu là $1,000 và phí giao dịch 0.1% cho mỗi lần giao dịch.
Cách đọc biểu đồ này:
🟫 Đường màu nâu phía dưới là tín hiệu giao dịch nhị phân, chuyển đổi giữa trạng thái trong thị trường (1) và ngoài thị trường (0).
🟦 Đường màu xanh dương thể hiện giá trị danh mục đầu tư của chiến lược theo thời gian.
🟩 Đường màu xanh lá là chuẩn so sánh danh mục đầu tư kiểu mua và giữ (buy-and-hold).
Chúng ta có thể nhận thấy chiến lược dựa trên số dư coin trên sàn hoạt động khá tốt, mặc dù đôi khi chiến lược mua và giữ lại vượt trội hơn. Tuy nhiên, trong những ngày cuối của giai đoạn nghiên cứu, chiến lược số dư coin trên sàn đã bắt kịp. Dù một số nhà đầu tư có thể thấy sự kết hợp giữa việc giảm biến động và hiệu suất cuối cùng gần bằng chiến lược mua và giữ là hấp dẫn, nhưng con số cuối cùng lại dễ gây hiểu nhầm – và dưới đây là lý do tại sao.
Vấn đề: Thay đổi dữ liệu và Độ thiên lệch do biết trước kết quả (Look-Ahead Bias)
Các số liệu không phải lúc nào cũng cố định. Nhiều số liệu được điều chỉnh hồi tố khi có thông tin mới. Điều này đặc biệt đúng với các chỉ số phụ thuộc vào việc gom nhóm địa chỉ hoặc gán nhãn thực thể, như số dư coin tại sàn on-chain. Tuy vậy, điều này cũng xảy ra với các chỉ số như khối lượng giao dịch hoặc giá cả khi các sàn giao dịch có thể có lúc gửi dữ liệu chậm vài phần nhỏ.
Điều này có nghĩa là giá trị bạn thấy hôm nay cho, ví dụ, ngày 15/1/2024 có thể không phải là giá trị đã được công bố vào ngày 15/1/2024. Dữ liệu đã được điều chỉnh sau này. Khi bạn backtest một chiến lược trên dữ liệu được chỉnh sửa như vậy, bạn đã vô tình sử dụng thông tin mà tại thời điểm ra quyết định giao dịch thì chưa sẵn có. Điều này gây ra thiên lệch do biết trước kết quả (look-ahead bias).
Backtest trung thực: Sử dụng dữ liệu tại thời điểm phát sinh (Point-in-Time Data)
Vậy hãy lặp lại chính xác phép backtest trước – cùng logic tín hiệu, tham số, ngày tháng, phí – nhưng lần này sử dụng phiên bản Point-in-Time (PiT) của chỉ số Exchange Balance, có sẵn trong Glassnode Studio.
Các chỉ số PiT chỉ cho phép ghi mới và không thay đổi lại. Mỗi điểm dữ liệu lịch sử phản ánh đúng thông tin biết được tại thời điểm nó được tính toán lần đầu. Không điều chỉnh hồi tố, không thiên lệch do biết trước.
Dù vẫn sử dụng cùng một chỉ số, chiến lược bây giờ lại cho ra kết quả khác biệt rõ rệt, minh họa bằng đường màu tím trong biểu đồ mới bên dưới. Hiệu suất tổng thể thấp hơn đáng kể.
Dù cả hai chiến lược hoạt động khá giống nhau trong phần lớn năm 2024, chúng ta nhận thấy phiên bản dựa trên PiT không thể nắm bắt tốt các đợt tăng mạnh trong tháng 11/2024 và tháng 3/2025. Kết quả là hiệu suất tích lũy bị chênh lệch rõ rệt và thua kém đáng kể.
Điểm mấu chốt
Trong ví dụ này, chiến lược màu tím, chỉ sử dụng thông tin khi nó thực sự có sẵn tại thời điểm đó, cho hiệu suất thấp hơn rõ rệt. ► Kết quả backtest sẽ sai lệch nếu bạn sử dụng dữ liệu sai hoặc đã được chỉnh sửa. Chỉ những chỉ số Point-in-Time bất biến mới đảm bảo bạn đang tái hiện lại lịch sử như nó đã thực sự xảy ra.
Các biến thể chỉ số PiT đều có cho tất cả chỉ số với gói Glassnode Professional qua Studio và API. Các ví dụ backtest bên trên được thực hiện bằng chức năng backtest trong Studio.
Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.
Bạn cũng có thể thích
IMU (Immunefi) biến động 104,4% trong 24 giờ: Thanh khoản thấp khiến giá dao động mạnh
Biên độ dao động trong 24 giờ của TURBO đạt 45,9%: Khối lượng giao dịch đầu cơ tăng vọt hơn 1300% dẫn dắt biến động
