Bot CEX 思考ログ 戦略ログ 書籍・論文・web記事 開発ログ

🛠️開発記録#506(2026/4/8)Binanceリードラグ研究DAY4「研究の再設計 ― 構造が見えても勝てない理由から、次に掘る時間軸を決めるまで」

こんにちは。ぼっちbotteよだかです。

今回の開発記録は、リードラグ研究そのものを一段掘り進めたというより、これまで見えてきた事実を踏まえて研究の土俵を組み直した回です。
短期歪み回帰や2市場間リードラグの観測を続ける中で、構造らしきものは見えるし、予測精度もそれなりに出る。けれど、執行コストや速度競争まで含めて考えると、どうしても「勝てる構造」にはならない――そんな判定が何度も積み上がってきました。

そこで今回は、「もっと精度を上げれば解決するのか」「そもそも見ている時間軸や戦う土俵が間違っているのではないか」を改めて整理し、公開情報や先行研究も使いながら、個人botterとして現実的に取りうるリードラグ構造の条件を見直しました。
その結果、今回の論点は単なる時間枠の拡張ではなく、何をエッジと呼ぶのか、どこから金を抜く構造を想定するのか、どの条件なら研究対象として残すのかを定義し直すことだったと感じています。

この記事では、いま何が起きているのかという現状整理から出発して、なぜ方針変更が必要だと考えたのか、公開研究で何を裏どりしたのか、そして今後どのような基準で候補を採用・棄却しながら研究を進めていくのかまで、思考の流れを省略せずにまとめます。

前回の話
🛠️開発記録#505(2026/4/7)Binance Japanリードラグ研究DAY3 ― 「取れそうに見える」を分解して、判定器の土俵を整えた話

続きを見る

まず、いま何が起きているのかを整理した

ここしばらく、私は短期の歪み回帰や2市場間のリードラグ構造を観測し、その構造を執行可能な形まで落とし込めるかどうかを見続けてきました。
観測の中では、何も見えていないわけではありません。むしろ逆で、一定の構造らしきものは見えており、方向性の予測自体も「まったく当たらない」という感じではありませんでした。実際、これまで作ってきた bot や観測機でも、「先に動く側」と「あとから追随する側」の関係や、短期的な歪みの拡大・収束それ自体は、ある程度捉えられていたと思います。

ただし、問題はそこではありませんでした。
構造が見えることと、それを使って実際に勝てることは別だったのです。

たとえば、短期歪み拾い系や歪み回帰系の bot を見ていても、観測上は「たしかにこう動きそうだ」と思える場面はあります。bitFlyer を主戦場として見てきた2市場間リードラグ構造の観測でも、「構造がある」という判定自体は完全には否定されていません。けれども、そこに執行コストやスプレッド、約定までの遅れ、インフラ差といった現実の条件を乗せた瞬間に、結論はかなり厳しくなります。要するに、見えている構造の多くが、そのままでは“個人が金にできる構造”にはなっていなかったということです。

この点は、今回急に思いついた話ではありません。
むしろ、これまでの研究や bot 開発の中で、何度も似たような形で突き当たってきた壁でした。
「構造はある」「予測もある程度できる」「でも執行ベースでは勝てない」。このパターンが繰り返し出てくるということは、単発の失敗というより、自分が見に行っている時間軸や、戦っている土俵そのものに問題がある可能性を考えた方が自然です。

今回、あらためて整理したかったのもまさにそこでした。
いま自分の前で起きていることを雑に言えば、「短期リードラグや短期歪みの観測では、構造の存在自体は見える。しかし、それを個人 botter が執行可能なエッジとして回収するのは難しい」ということになります。だとすれば、次に考えるべきなのは「もっと精度を上げれば取れるのではないか」ではなく、そもそもその構造は自分の戦うべき領域なのか、そして個人でも回収可能な遅れは別の時間軸にあるのではないか、という問いでした。

今回は、その問いを曖昧な感覚のままにせず、一度きちんと文章に落として整理することにしました。
現状を見誤ると、その先の方針もずれていきます。逆に言えば、いま起きていることを正しく言葉にできれば、次にどこを掘るべきかもかなり明確になるはずです。今回の再設計は、新しい夢を足すためのものではなく、ここまで積み上がった否定結果と観測結果を、次の研究方針に変換するための作業です。

問題は“予測できるか”ではなく“自分が回収できる遅れか”だった

今回あらためて整理していて、いちばん大きかった気づきはここでした。
これまで私は、「構造があるか」「予測できるか」をかなり真面目に見てきましたし、その方向自体が間違っていたとは思っていません。相場の中に何らかの規則性や遅れがあるかを観測し、それを判定し、執行へつなぐという流れは、今でも研究の基本線だと考えています。

ただ、今回見直す中でよりはっきりしたのは、問題の中心は予測精度そのものではなかったということです。
もう少し正確に言えば、「その構造をある程度の精度で予測できるか」よりも先に、その遅れが自分にとって回収可能な大きさと時間幅を持っているかを見なければならなかったのだと思います。

短期歪み回帰系や2市場間リードラグの観測では、実際にそれらしい構造が出ることがあります。先に動く側とあとから追随する側が見える場面もありますし、将来方向の判定精度だけを見れば、まったく話にならないというわけでもありません。
けれども、現実に執行するとなると、そこにはスプレッド、手数料、板の薄さ、約定までの遅れ、自分のインフラ速度、注文を出した時点での価格変化といったものが入ってきます。すると、観測上は有意に見えていた構造が、そのまま利益にはつながらないということが起こります。

これは言い換えると、「見えている遅れ」と「自分が取れる遅れ」は別物だったということです。

ここを曖昧にしたまま研究を進めると、どうしても「予測精度をもっと上げれば何とかなるのではないか」という発想に引っ張られやすくなります。もちろん、精度が高いに越したことはありません。ただし、仮に方向がかなり当たっていたとしても、そのエッジが数秒以内にほぼ食い尽くされるような性質のものであれば、個人 botter にとっては実質的に取れない構造です。
その場合、やるべきことは精度の微調整ではなく、そもそもその構造を自分の研究対象として残すべきかどうかを判断することになります。

今回の整理で重要だったのは、まさにその視点でした。
私はこれまで、短い時間軸の中で見える構造をかなり丁寧に観測してきましたし、実際そこから得たものも多かったです。ただ、その結果として見えてきたのは、「短期構造が存在すること」と「個人がそれを金にできること」の間には、依然として大きな隔たりがあるという事実でした。
つまり、今回の論点は「もっと当てられるようになるか」ではなく、いま見ている遅れが、自分の土俵で戦える種類の遅れなのかということだったのです。

この見方に立つと、研究の評価軸も自然に変わってきます。
これまでは、どうしても「先に動いているか」「あとから追随しているか」「どれくらい当たるか」といった観測が中心になりがちでした。しかし、今後より重視すべきなのは、執行コストを跨いだあとに、まだ利益として回収できる部分が残っているかです。
予測できること自体は条件の一つにすぎず、それだけでは十分ではありません。必要なのは、予測の先にある遅れが、実際の市場条件の中でもまだ消えずに残っていることです。

今回ここを言葉にしておきたかったのは、このズレを曖昧なままにすると、研究がどこまでも「当たる構造探し」に流れてしまうからです。
けれども、自分が本当に探したいのは、当たる構造ではありません。個人が執行まで含めて回収できる構造です。
この違いは小さいようでいて、研究の方向を大きく変えます。そして今回の見直しは、その違いをはっきり認識したことにいちばん大きな意味があったと思っています。

本当に時間軸を伸ばすべきなのか、公開情報と研究を使って裏どりした

今回いちばん慎重に確認したかったのは、「短期で勝てないから、ではもっと長い時間軸へ行こう」という判断が、単なる逃げや思いつきになっていないかどうかでした。
短い時間軸でうまくいかなかったとき、時間軸を伸ばすという発想自体は自然です。けれども、それが本当に妥当なのかは別問題です。短期で勝てなかった理由が単に自分の実装不足なら、時間軸を伸ばしても本質は変わりません。逆に、短期で見えていた構造の多くが、そもそも最速の執行競争に依存するものだったなら、そこに精度向上で食らいつこうとする方が不合理です。だから今回は、「自分が短期で勝てないのはなぜか」「その上で、数分〜数十分の帯に個人でも回収可能な遅れが残りうるのか」を、できるだけ公開情報と研究で裏どりすることにしました。

まず確認したかったのは、秒未満〜数秒の世界が本当に個人 botter にとって不利な土俵なのかという点です。ここについては、Bitcoin の spot/futures market microstructure を扱った研究がかなり示唆的でした。その研究では、Coinbase において取引の一部やキャンセルの相当数が 50 ミリ秒以内に発生しており、BTC 市場でもすでにかなり高速な注文更新と取り消し競争が起きていることが示されています。これは、「構造があるか」以前に、「最初の反応そのものを取りにいく競争」はすでにかなり高速で、個人がインフラ勝負で正面から戦うには厳しいことを意味しています。今回の自分の観測でも、構造が見えるのに執行ベースでは勝てないという判定が続いていましたが、その背景には、こうした市場マイクロ構造上の速度競争があると考える方が自然でした。

ただし、ここで重要なのは、「短い時間軸が厳しい」ことと「個人が取れるリードラグ構造が存在しない」ことは同じではないという点です。
実際、公開研究を見ていくと、Bitcoin 関連市場には、サブ秒の競争ではなく、より粗い時間枠でも説明力や予測可能性が残っているという結果が複数あります。たとえば、米国で現物 Bitcoin ETF が導入された後の price discovery を扱った 2025 年の研究では、5 分データを用いて ETF と underlying の Bitcoin spot の関係を分析しており、活発な ETF が一定期間において spot より price discovery を主導することが示されています。ここで重要なのは、少なくとも研究上は「意味のある先行性」が 5 分単位でも検討対象として成立していることです。つまり、先行情報の有無を考えるうえで、最初から秒単位だけに閉じる必要はありません。

さらに、暗号資産市場の intraday return predictability を扱った研究では、Bitcoin に intraday momentum と reversal の両方が存在し、そのパターンが 大きな価格ジャンプ、FOMC announcement、流動性水準、COVID のような市場状態によって変わることが報告されています。これは、暗号資産市場が完全に効率的で、数分以上の情報が一切残らない世界ではないことを示唆しています。同時に、予測可能性は常に一定ではなく、イベントや状態帯に依存して現れ方が変わることも意味しています。私が今後、単に「長い時間軸へ伸ばす」のではなく、「どの状態帯で何分〜何十分の遅れが残るのか」を見にいく必要があると考えたのは、このあたりの研究結果とも整合的でした。

もう少し時間幅を広げてみると、Bitcoin の intraday behavior を扱った研究では、1 時間・2 時間・4 時間といった中間的な intraday horizon においても、有意な負の自己相関、つまり平均回帰的な振る舞いが観測されることが示されています。この研究は、短すぎる世界だけを見ていると、「速い人に食われて終わり」でしか見えない構造が、より長い intraday 帯では別の形で exploitable に見えてくる可能性を示唆しています。少なくとも、「60 秒までで有意でなければダメ」「60 秒を超えたら遅すぎる」と機械的に決める根拠は薄いと考えるようになりました。むしろ、個人 botter の立場では、秒未満の最速競争よりも、数分〜数時間の条件付きの drift や reversionに焦点を当てる方が、実際には自然なのかもしれません。

また、Bitcoin の intraday dynamics と intraday price discovery を扱った研究も、今回の整理にかなり役立ちました。この研究では、Bitcoin の出来高やボラティリティには intraday の時間帯依存があり、アジア時間と London-New York overlap に山を持つ M 字型のパターンが見られること、そして intraday の price discovery は London-New York overlap でより強くなることが示されています。これは、私がこれまで観測してきた「全時間帯をひとまとめにして構造を見る」やり方に限界があることを裏づける材料でもありました。つまり、時間軸の見直しは単に上限秒数を伸ばす話ではなく、どの時間帯で、その source が効きやすいのかまで含めて設計し直す必要があるということです。

一方で、マクロ情報を先行 source として扱うことについては、公開研究の結果が一枚岩ではないことも確認できました。
New York Fed の staff report では、Bitcoin は他の米国資産クラスと異なり、monetary policy や macro news に対してかなり直交的である、という結果が示されています。これだけを見ると、「マクロを見ても意味がないのではないか」と考えたくなります。けれども、先ほどの intraday return predictability の研究では、FOMC announcement の有無が intraday の predictability パターンに影響することが示されています。つまり、マクロそのものが常に短期の方向シグナルになるとは言えないものの、イベント窓や状態変数としての意味は十分にありうる、というのが今のところの整理です。そのため、現時点では「マクロは効く」「マクロは効かない」と単純化するのではなく、単独の主シグナルではなく、状態帯を切るための補助層として扱うのが妥当だと考えています。

加えて、Kalshi のような macro prediction market についても確認しました。2026 年の Fed 系論文では、Kalshi が macro expectation をかなり高頻度に反映する市場として観測対象になりうることが示されていますし、2026 年の別の研究では、Kalshi の macro contract の probability change が暗号資産の将来 volatility に追加情報を持つ可能性も示されています。ただし、ここで示されているのは主に volatility forecasting であり、私が今探している「Binance Japan で執行可能な lead-lag 構造」とは少し距離があります。したがって、Kalshi のような source は面白い候補ではありますが、今の段階では主戦場ではなく、あとから追加できる補助レイヤーとして見るのが自然だと判断しました。

ここまでの裏どりを通して、今回いちばん大きかったのは、「短い時間軸で勝てないなら、もっと速くなるべきだ」という結論にはならなかったことです。
むしろ逆で、公開研究と市場構造を踏まえるほど、個人 botter が最速反応の競争に踏み込む合理性は薄く見えてきました。一方で、数分〜数十分、あるいは source によっては数時間の帯域には、まだ条件付きで exploitable な遅れや反応が残っている可能性があると考える方が自然でした。
つまり今回の結論は、「高頻度の情報取得が不要」ということではなく、生データは細かく残しつつも、戦うべき horizon はもっと遅くてよいという方向でした。これは、HFT を避けるという自分の方針とも整合的ですし、これまでの否定結果とも噛み合っています。

この章を通して私が得た整理は、かなりシンプルです。
時間軸を伸ばすこと自体は妥当です。
ただし、それは「無限に伸ばす」という意味ではありません。近い source は 30 秒〜15 分程度、遠い source は 5 分〜1 時間程度、といったように、source の性質ごとに上限を決めたうえで探索すべきです。そして、その探索は「どれだけ当たるか」ではなく、その遅れが執行コストを跨いだあとでもまだ回収可能かという基準で評価しなければなりません。今回のリサーチは、そこまで含めて、今後の研究の土俵を組み直すための裏どりでした。

参考情報一覧

種類出典の要点この章で使った意味参照
市場マイクロ構造Bitcoin の spot / futures 市場では、50ms 級の高速な注文更新・キャンセルがすでに起きている秒未満〜数秒の最速競争は個人に不利という確認Bitcoin spot and futures market microstructure
ETF 価格発見米国現物 Bitcoin ETF 導入後、5分データで ETF が spot より主導的な price discovery を示す時間帯がある「意味のある先行性」を秒単位に限定する必要はないという根拠Do Bitcoin ETFs Lead Price Discovery Following their Introduction in the Bitcoin Market?
暗号資産 intraday predictabilityBitcoin には intraday momentum / reversal があり、FOMC、公表、流動性、ジャンプでパターンが変わる状態帯やイベント窓を切る必要があるという根拠Intraday return predictability in the cryptocurrency markets: Momentum, reversal, or both
Bitcoin の intraday behavior1時間・2時間・4時間の帯域でも平均回帰的な振る舞いが観測される60秒超の帯域にも exploitable な構造候補がありうるという根拠On the Intraday Behavior of Bitcoin
Bitcoin の intraday dynamics / price discovery出来高・ボラティリティの M 字型パターンと、時間帯ごとの price discovery の偏り全時間帯を混ぜず、時間帯別に見るべきという根拠The intraday dynamics and intraday price discovery of bitcoin
Bitcoin と macro newsBitcoin は macro / monetary news にかなり直交的だとする結果マクロを単独主シグナルにしない慎重さの根拠The Bitcoin–Macro Disconnect
FOMC と intraday パターンFOMC announcement が crypto の intraday predictability に影響マクロを状態変数・イベント窓として使う根拠Intraday return predictability in the cryptocurrency markets: Momentum, reversal, or both
Kalshi / macro marketsKalshi が macro expectation を高頻度に反映する市場として観測対象になりうる将来の補助レイヤー候補としての位置づけKalshi and the Rise of Macro Markets

Do Prediction Markets Forecast Cryptocurrency Volatility? Evidence from Kalshi Macro Contracts
公式イベント日程FOMC、CPI、Employment Situation の日程は公式に公開されているevent/state layer を実装しやすいことの確認Meeting calendars, statements, and minutes (2021-2027)

Schedule of Releases for the Consumer Price Index

Schedule of Releases for the Employment Situation

現時点でいちばん確からしい仮説は何か

ここまで整理してきた内容を踏まえると、現時点でいちばん確からしい仮説はかなりはっきりしています。
それは、個人 botter が執行まで含めて回収可能なリードラグ構造は、秒未満〜数十秒の最速反応ではなく、数分〜数十分の時間帯に条件付きで残っている可能性が高い、というものです。

この仮説に至った理由は単純です。
これまで観測してきた短期歪み回帰や2市場間リードラグの中には、構造としては十分にそれらしく見えるものがありました。方向性の予測自体も、まったく意味がないという水準ではありませんでした。けれども、実際に執行コストやスプレッド、約定までの遅れ、自分の注文が市場に届くまでの時間差まで含めて考えると、その多くが利益としては残りませんでした。
つまり、短い時間軸では「見えている構造」そのものが弱いのではなく、見えてから取りにいくまでのあいだにエッジが食い尽くされやすいということです。

だとすれば、次に立てるべき仮説は、「もっと精度を上げれば数秒の構造も取れるかもしれない」ではありません。
そうではなく、個人でも執行可能な遅れは、もっと遅く、もっと鈍く、しかしそのぶん市場に残りやすい形で存在しているのではないか、という方向になります。
私が今回時間軸の見直しを本気で考えたのは、まさにこのためでした。

ただし、ここで言う「もっと長い時間軸」とは、何時間でも何日でも無制限に広げるという意味ではありません。
そのように探索範囲を拡張してしまうと、研究テーマ自体が曖昧になりますし、短期リードラグ研究からそのまま連続した問いとして扱えなくなります。
今回の見直しで置きたい仮説は、あくまで短期すぎる世界では勝てなかった個人 botter が、それでもなお intraday の中で回収可能な遅れを探すというものです。したがって、焦点は「もっと長く」ではなく、どの source に対して、どこまで時間幅を伸ばせば現実的かに置くべきだと考えています。

この前提で見ると、source の距離感によって仮説の置き方も変わってきます。
現時点でいちばん有力なのは、Bitcoin の価格形成に比較的近い非クリプト市場ほど、短めの intraday horizon でもまだ exploitable な遅れが残る可能性があるという考え方です。
逆に、Bitcoin の価格形成から遠い source になるほど、仮に影響があるとしても、それは単独の方向シグナルとしてではなく、より長い時間幅の状態変数やイベント条件として現れる可能性が高いと見ています。

この整理に立つと、候補は大きく三段階に分かれます。

第一に、Bitcoin の価格形成に近い非クリプト source です。
たとえば、CME の Bitcoin futures や米国の Bitcoin 現物 ETF の tape はここに入ります。これらは crypto exchange そのものではありませんが、Bitcoin 価格形成との距離はかなり近い市場です。したがって、もし個人 botter が非クリプト側の先行情報から執行可能なリードラグ構造を見つけられるとすれば、まずこのクラスからである可能性が高いと考えています。
現時点では、もっとも有力な主仮説はこのクラスに対して置くべきだと思っています。

第二に、FX や金利、マクロイベントのように、Bitcoin の価格形成に直接ではないが、伝達経路を通じて効きうる source です。
ここには USD/JPY や FOMC、CPI、雇用統計、金利期待などが入ります。ただし、このクラスについては、今の時点では単独の主シグナルとして期待するよりも、どの状態帯で近い source の効き方が変わるかを切るための補助層として捉える方が自然だと考えています。
たとえば、ある時間帯やあるイベント窓では追随が残りやすい、あるいは逆に spread が広がって執行不能になる、といった条件分岐を作る材料としては意味がありますが、最初からここを主戦場にするのは少し飛びすぎです。

第三に、より広いリスク資産や一般的な市場心理の proxy です。
たとえば株価指数、ボラティリティ指標、コモディティなどがこれに当たります。これらも Bitcoin との関係を持つ可能性はありますが、少なくとも現段階では、短期〜中短期の執行可能なリードラグ構造の主候補として採用するには距離が遠すぎると考えています。
ここをいきなり深掘りすると、「本当に先行しているのか」「その関係はなぜ生じるのか」「どこで利益に変換されるのか」が曖昧になりやすく、研究の解像度が下がります。

このように整理すると、現時点でいちばん確からしい仮説は、次のように言い換えられます。

個人 botter が狙うべきリードラグ構造は、Bitcoin 価格形成に比較的近い非クリプト市場に対して、数分〜数十分の時間帯で、条件付きに残る追随や遅れである可能性が高い。
そして、FX やマクロ、広義のリスク資産は、その構造を直接生む主 source というより、効きやすい状態帯やイベント窓を切るための補助情報として使う方が筋がよい、というのが今のところの暫定結論です。

この仮説の良いところは、これまでの否定結果と矛盾しないことです。
秒未満〜数十秒の最速反応で勝てなかったことを、「能力不足」として無理に再挑戦するのではなく、その世界では構造が見えても回収が難しいという事実を前提に置いたうえで、まだ個人が戦える帯域を探しに行く。
しかも、探索対象を無制限に広げるのではなく、Bitcoin に近い source から順に試していく。
この形なら、研究の流れも自然ですし、失敗したときの意味づけも明確です。

もちろん、これはまだ最終結論ではありません。
あくまで現時点で最も筋がよく、ここから先の検証に値すると考えている仮説です。
けれども少なくとも、ここまでの観測とリサーチを踏まえる限り、次に進むべき方向はかなり絞られてきました。
今後は、この仮説に対して「本当にその遅れは残るのか」「その遅れはどの時間帯・状態帯で現れるのか」「執行コストを跨いだあとでも利益として残るのか」を、順番に検証していくことになります。

現時点でいちばん確からしい仮説は何か

ここまで整理してきた内容を踏まえると、現時点でいちばん確からしい仮説はかなりはっきりしています。
それは、個人 botter が執行まで含めて回収可能なリードラグ構造は、秒未満〜数十秒の最速反応ではなく、数分〜数十分の時間帯に条件付きで残っている可能性が高い、というものです。

この仮説に至った理由は単純です。
これまで観測してきた短期歪み回帰や2市場間リードラグの中には、構造としては十分にそれらしく見えるものがありました。方向性の予測自体も、まったく意味がないという水準ではありませんでした。けれども、実際に執行コストやスプレッド、約定までの遅れ、自分の注文が市場に届くまでの時間差まで含めて考えると、その多くが利益としては残りませんでした。
つまり、短い時間軸では「見えている構造」そのものが弱いのではなく、見えてから取りにいくまでのあいだにエッジが食い尽くされやすいということです。

だとすれば、次に立てるべき仮説は、「もっと精度を上げれば数秒の構造も取れるかもしれない」ではありません。
そうではなく、個人でも執行可能な遅れは、もっと遅く、もっと鈍く、しかしそのぶん市場に残りやすい形で存在しているのではないか、という方向になります。
私が今回時間軸の見直しを本気で考えたのは、まさにこのためでした。

ただし、ここで言う「もっと長い時間軸」とは、何時間でも何日でも無制限に広げるという意味ではありません。
そのように探索範囲を拡張してしまうと、研究テーマ自体が曖昧になりますし、短期リードラグ研究からそのまま連続した問いとして扱えなくなります。
今回の見直しで置きたい仮説は、あくまで短期すぎる世界では勝てなかった個人 botter が、それでもなお intraday の中で回収可能な遅れを探すというものです。したがって、焦点は「もっと長く」ではなく、どの source に対して、どこまで時間幅を伸ばせば現実的かに置くべきだと考えています。

この前提で見ると、source の距離感によって仮説の置き方も変わってきます。
現時点でいちばん有力なのは、Bitcoin の価格形成に比較的近い非クリプト市場ほど、短めの intraday horizon でもまだ exploitable な遅れが残る可能性があるという考え方です。
逆に、Bitcoin の価格形成から遠い source になるほど、仮に影響があるとしても、それは単独の方向シグナルとしてではなく、より長い時間幅の状態変数やイベント条件として現れる可能性が高いと見ています。

この整理に立つと、候補は大きく三段階に分かれます。

第一に、Bitcoin の価格形成に近い非クリプト source です。
たとえば、CME の Bitcoin futures や米国の Bitcoin 現物 ETF の tape はここに入ります。これらは crypto exchange そのものではありませんが、Bitcoin 価格形成との距離はかなり近い市場です。したがって、もし個人 botter が非クリプト側の先行情報から執行可能なリードラグ構造を見つけられるとすれば、まずこのクラスからである可能性が高いと考えています。
現時点では、もっとも有力な主仮説はこのクラスに対して置くべきだと思っています。

第二に、FX や金利、マクロイベントのように、Bitcoin の価格形成に直接ではないが、伝達経路を通じて効きうる source です。
ここには USD/JPY や FOMC(米連邦公開市場委員会)、CPI(消費者物価指数)、雇用統計、金利期待などが入ります。ただし、このクラスについては、今の時点では単独の主シグナルとして期待するよりも、どの状態帯で近い source の効き方が変わるかを切るための補助層として捉える方が自然だと考えています。
たとえば、ある時間帯やあるイベント窓では追随が残りやすい、あるいは逆に spread が広がって執行不能になる、といった条件分岐を作る材料としては意味がありますが、最初からここを主戦場にするのは少し飛びすぎです。

第三に、より広いリスク資産や一般的な市場心理の proxy(代理となるもの) です。
たとえば株価指数、ボラティリティ指標、コモディティなどがこれに当たります。これらも Bitcoin との関係を持つ可能性はありますが、少なくとも現段階では、短期〜中短期の執行可能なリードラグ構造の主候補として採用するには距離が遠すぎると考えています。
ここをいきなり深掘りすると、「本当に先行しているのか」「その関係はなぜ生じるのか」「どこで利益に変換されるのか」が曖昧になりやすく、研究の解像度が下がります。

このように整理すると、現時点でいちばん確からしい仮説は、次のように言い換えられます。

個人 botter が狙うべきリードラグ構造は、Bitcoin 価格形成に比較的近い非クリプト市場に対して、数分〜数十分の時間帯で、条件付きに残る追随や遅れである可能性が高い。
そして、FX やマクロ、広義のリスク資産は、その構造を直接生む主 source というより、効きやすい状態帯やイベント窓を切るための補助情報として使う方が筋がよい、というのが今のところの暫定結論です。

この仮説の良いところは、これまでの否定結果と矛盾しないことです。
秒未満〜数十秒の最速反応で勝てなかったことを、「能力不足」として無理に再挑戦するのではなく、その世界では構造が見えても回収が難しいという事実を前提に置いたうえで、まだ個人が戦える帯域を探しに行く。
しかも、探索対象を無制限に広げるのではなく、Bitcoin に近い source から順に試していく。
この形なら、研究の流れも自然ですし、失敗したときの意味づけも明確です。

もちろん、これはまだ最終結論ではありません。
あくまで現時点で最も筋がよく、ここから先の検証に値すると考えている仮説です。
けれども少なくとも、ここまでの観測とリサーチを踏まえる限り、次に進むべき方向はかなり絞られてきました。
今後は、この仮説に対して「本当にその遅れは残るのか」「その遅れはどの時間帯・状態帯で現れるのか」「執行コストを跨いだあとでも利益として残るのか」を、順番に検証していくことになります。

CME は“Bitcoin にかなり近い、機関資金寄りの上流市場候補”であって、次に見る価値が高い source の一つ。

CME を有力視する理由は3つあります。

1つ目は、Bitcoin そのものに近いことです。
Nasdaq や DXY みたいな遠い proxy ではなく、CME の Bitcoin futures は BTC そのものの価格変動を扱っています。しかも CME は自社でも、Bitcoin futures の利点として transparent futures market における price discovery を前面に出しています。

2つ目は、規制市場で、機関投資家っぽい資金が集まりやすいことです。
だから「クリプト専業取引所のノイズ」とは少し違う、別系統の価格形成が見える可能性があります。先物導入が Bitcoin spot の価格効率を改善した、あるいは futures の変化が spot の変化を有意に先導したという研究もあります。

3つ目は、それでも crypto exchange そのものではないことです。
私は「仮想通貨取引所そのものを先行 source にしたくない」という設計思想を持っていますが、CME はそこにかなりうまくはまります。
つまり、“完全に非クリプトな情報源”ではないが、“クリプト取引所以外にある、Bitcoin にかなり近い情報源” です。

なので、言い方を少し整えるなら、

「CME は先物のボス級で、しかも Bitcoin に直接近い商品を扱っているから、個人がクリプト取引所以外の先行市場を探すとき、最上流候補の一つとしてかなり有力」

がいちばんしっくりきます。

逆に注意点もあります。
“CME が強いなら、そこを見れば必ず取れる” ではないです。
CME が price discovery に強くても、その反応が数秒〜数十秒で食われるなら、私が狙うべき個人向けエッジにはなりません。だから、CME は「有力な source」であって、「見れば勝てる source」ではありません。ここが今回の研究で大事な線引きです。

「CME は主役候補、FOMC・CPI・雇用統計は補助軸」であり、
主役 1つ + 補助軸 3つ です。

CME
Bitcoin にかなり近い先行市場候補。機関資金や規制市場側の価格形成を見る本命寄りの source です。CME Group は Bitcoin 先物を提供しており、暗号資産商品も公式に扱っています。
→本当に lead になっているかを見る

FOMC
金融政策そのものを出す政策イベント軸です。FRB の FOMC は米国の金融政策を決める組織で、年8回の定例会合があります。
→政策イベント日で構造が壊れるか / 強まるかを見る

CPI
インフレの強さを通じて政策期待を動かすインフレ軸です。BLS は CPI を、消費者が支払う財・サービス価格の平均的な変化を測る指標と説明しています。
→インフレショックの日に drift が残るかを見る

雇用統計(Employment Situation / NFP など)
労働市場の強さを通じて政策期待を動かす景気・雇用軸です。BLS は Employment Situation として、雇用・失業・賃金に関する主要統計を毎月公表しています。
雇用統計: 景気・金利期待ショックの日に反応が変わるかを見る


そのエッジは誰の遅れから生まれるのか

ここまで整理してきて、今後の研究で絶対に曖昧にしたくないと思ったことがあります。
それは、そのリードラグ構造が、結局は何から金を生み出しているのかを説明できるようにしておくことです。

相場で利益が出るということは、言い換えれば、どこかに遅れや摩擦や歪みがあり、そのぶんだけ価格反映が完全ではないということです。
つまり、こちらが利益を取れるということは、反対側には何らかの形で遅れて反応する参加者や、構造的にすぐには動けない市場、あるいは一時的に無理のある価格を受け入れている誰かがいるはずです。
この前提を置かないまま、「相関がありそう」「少し先に動いていそう」という理由だけで仮説を積み上げていくと、研究は簡単にぼやけます。見えている構造が、実際には誰のどの遅れを食っているのか説明できなければ、その仮説はかなり弱いままです。

今回の整理を通して、今後のリードラグ研究で考えるべき「金の出どころ」は、大きく三つの型に分けられると考えるようになりました。

1. 市場間の情報反映速度の差から生まれる遅れ

まずひとつ目は、市場ごとの情報反映速度の差です。
これは今回のリードラグ研究の中心に置いている考え方でもあります。

たとえば、Bitcoin に比較的近い非クリプト市場が先に動き、それに対して Binance Japan の BTC/JPY がやや遅れて追随するのであれば、そのあいだに残る遅れが利益源になります。
ここで金を落とすのは、ざっくり言えば、その情報をまだ十分に織り込めていない Binance Japan 側の価格形成です。
より具体的には、ローカルな注文フロー、JPY 建てへの変換、マーケットメイカーや参加者の在庫調整、国内市場特有の反応の鈍さなどが重なって、先行市場の変化が即座には反映されない。その遅れを取る、という構図です。

この型のよいところは、比較的素直に説明できることです。
「どの市場が先に情報を織り込み、どの市場があとから追随するのか」という問いとして定義できるので、研究の形もかなり明瞭になります。
一方で、この型は速度競争に寄りすぎると一気に個人には厳しくなります。秒未満〜数秒の世界では、結局のところインフラの強い側がほとんど取り切ってしまうからです。
だからこそ、今後はこの型を研究するときも、「最初の反応そのもの」ではなく、個人が執行してもなお残る数分帯の追随を探す必要があると考えています。

2. イベントやマクロ情報の消化の遅れから生まれる構造

二つ目は、イベントやマクロ情報が市場に消化されるまでの遅れです。
これは、FOMC や CPI、雇用統計のような公表情報、あるいは金利期待や macro expectation の変化などを考えると分かりやすいです。

この場合、金を落とす相手は、最速でヘッドラインを読むようなプレイヤーではありません。
そうではなく、マクロ情報を crypto の価格変化に十分速く翻訳できない参加者、あるいは情報を見てはいても、それを実際の売買判断に落とし込むまでに時間がかかる層です。
たとえば、金利見通しの変化や risk-on / risk-off の変化が他の市場には先に反映されているのに、BTC/JPY 側ではその影響が数分〜数十分かけてじわじわ出る、という形であれば、そこには回収可能な遅れが残りえます。

ただし、この型は一つ目の型よりも少し注意が必要です。
なぜなら、ここでは「本当にそのイベントが BTC/JPY の方向やボラティリティに効いているのか」「それは恒常的な効果なのか、特定条件でだけ出るのか」を切り分けないと、単なる後づけ解釈になりやすいからです。
そのため、今の時点ではこの型を主戦場にするというより、近い source に対する構造が効きやすい状態帯やイベント窓を切る補助レイヤーとして扱う方が自然だと思っています。

3. フローの偏りや在庫調整の後処理から生まれる戻り

三つ目は、一方向に偏ったフローや在庫調整のあとに起きる後処理的な動きです。
これは必ずしも「外部市場が先に動く」という形だけではなく、急な買い・売りが入ったあとで、その価格が無理のある位置まで押し出され、その後にじわじわ修正されるようなケースです。

このとき金を落とす相手は、急いで飛びついた注文や、価格を歪めた側のフロー、あるいはその歪みを一時的に受け止めた流動性供給側の調整です。
言い換えると、短期的な片寄りが生んだ無理な価格からの戻りを取る構造です。
これも、これまで私がやってきた歪み回帰研究とまったく無関係ではありません。ただし、ここで重要なのは、単に「歪みがあるから戻るはずだ」と言うのではなく、その歪みがどの市場参加者の都合によって生まれ、どの時間幅で修正されるのかまで説明できるようにすることです。

この型は、一見すると古典的な mean reversion に見えますが、今後の研究では「ただの回帰仮説」として扱うのではなく、外部 source の変化と結びつけたうえで、誰のフローや在庫調整が遅れているのかをセットで見るべきだと考えています。
そうしないと、また「構造は見えるが金にはならない」タイプの観測を積み増すだけになりかねません。

今後は、仮説ごとに“誰の何の遅れか”を先に書く

ここまでの整理を踏まえると、今後のリードラグ研究では、仮説を立てるたびに最低限次の問いに答えられる状態にしておく必要があります。

  • その source は何を先に反映しているのか
  • その変化はどうやって Binance Japan の BTC/JPY に伝わるのか
  • そのあいだに誰が遅れて反応するのか
  • 何分くらいその遅れが残ると考えているのか
  • 何を見たらその仮説を捨てるのか

この整理がないまま進めると、研究対象はいくらでも増やせてしまいます。
けれども実際には、「相関がある」ことと「そこから金が取れる」ことのあいだには大きな隔たりがあります。
その隔たりを埋めるのが、この「誰の何の遅れから金が出るのか」という問いです。

今回、時間軸の見直しを本格的に考えるようになって、私はようやくこの問いを研究の中心に置くべきだと思うようになりました。
これまでは、どうしても「構造があるか」「予測できるか」という観測そのものに意識が寄りがちでした。もちろん、それ自体は必要です。けれども、そこに留まっている限り、「よく見える構造」を量産することはできても、「実際に回収できる構造」を絞り込むことは難しいままです。

だから今後は、どの仮説に対しても、まず最初にこう問い直すことにします。
それは、結局誰のどんな遅れから金を抜く構造なのか。
この問いにまともに答えられない仮説は、たとえ見た目には面白く見えても、主戦場の候補にはしません。
逆に、この問いに素直に答えられる仮説だけを残していくことで、今後の研究はかなり引き締まるはずです。

今後の研究で設ける基準と、切るべきライン

ここまで整理してきて、今後のリードラグ研究で最も重要なのは、単に「面白そうな構造を探すこと」ではなく、どの条件を満たしたものだけを研究対象として残すのかを先に固定しておくことだと感じました。
なぜなら、相場の中には後から意味づけできそうな動きがいくらでもありますし、観測機を回していると、それらしく見える構造はいくらでも見つけられるからです。
けれども、そのすべてを追いかけていては、研究対象は無限に広がります。しかも、見えている構造の多くは、執行コストや速度差を考えた瞬間に金にならないまま終わります。だからこそ今後は、採用基準と棄却基準を先に置いたうえで、その条件を満たしたものだけを残すやり方に寄せていきます。

1. まず、source ごとに探索する時間枠の上限を固定する

今回の見直しで強く感じたのは、時間枠は広げるべきだが、無制限に広げてはいけないということでした。
短すぎる時間軸では、個人 botter が執行まで含めて回収するのが難しい。一方で、だからといって何時間でも何日でも探索対象に入れてしまうと、それはもう「短期〜中短期のリードラグ研究」とは別物になります。

そのため今後は、source の性質ごとに最初から上限 horizon を固定しておきます。
現時点では、暫定的に次のように置くのが自然だと考えています。

  • 近い source(CME、ETF tape など Bitcoin 価格形成に比較的近い非クリプト市場)
    30s / 60s / 180s / 300s / 900s
  • 補助層(USD/JPY のような変換・状態判定用の source)
    30s / 60s / 180s / 300s
  • 遠い source(FOMC、CPI、雇用統計、金利、Kalshi などマクロ・期待変化系)
    300s / 900s / 1800s / 3600s

ここで大事なのは、最初の discovery pass ではこのラダーの外に出ないことです。
たとえば、近い source を見るときに、いきなり数時間〜日跨ぎまで伸ばさない。逆に、遠い source に対して、秒単位の最速反応を取りにいこうとしない。
こうして source ごとに時間幅を制限しておくことで、研究の焦点を保ちやすくなります。Bitcoin や ETF の価格発見研究では 5 分単位でも先行性が検討され、Bitcoin の intraday behavior でも 1〜4 時間帯に自己相関や回帰のパターンが観測されていますが、だからといって探索範囲を無制限に広げてよいわけではありません。むしろ、どの source に対して、どの時間帯までを見るのかを先に決めることの方が重要です。 (link.springer.com)

2. 予測精度ではなく、執行後に回収可能かを評価の中心に置く

これまでの研究でも痛感してきたことですが、「ある程度当たる」ことと「金になる」ことの間にはかなり大きな隔たりがあります。
そのため、今後の研究では accuracy や勝率だけを主指標にしません。
主に見るべきなのは、執行コストを跨いだあとでも利益として残る部分があるかどうかです。

したがって、最低限見るべき指標も、今後は次のように揃えておくべきだと考えています。

  • event_total
  • entry_cost_pass_rate
  • median_net_move
  • median_time_to_hit
  • reversion_rate
  • out-of-sample での再現性

この中で特に重視したいのは、entry_cost_pass_rate と median_net_move です。
いくら event が多くても、コストを跨いだあとに利益がほとんど残らないのであれば、その仮説は主戦場の候補にはなりません。
逆に、発生頻度がそこまで高くなくても、特定条件下で安定して cost-pass が出るのであれば、それはかなり価値があります。
つまり、今後は「よく当たる構造」ではなく、**「執行したあとでも回収可能なドリフトや遅れが残る構造」**だけを残す方向に評価軸を寄せます。これは、これまでの短期歪み系や2市場間リードラグ観測で、構造は見えるのに執行ベースで負けるという判定が続いてきたことの、直接的な反省でもあります。 (ideas.repec.org)

3. 各仮説に「誰の何の遅れか」を説明できないものは残さない

前章でも書いた通り、今後の仮説はすべて、誰のどの遅れから利益が出るのかを説明できることを条件にします。
これは研究を引き締めるために、かなり大事な基準です。

最低でも、各仮説について次の項目を埋められる状態にしておきます。

  • その source は何を先に反映しているのか
  • その変化はどうやって Binance Japan の BTC/JPY に伝わるのか
  • そのあいだに誰が遅れて反応するのか
  • 何分くらい遅れが残ると考えているのか
  • 何を見たらこの仮説を捨てるのか

この説明が成り立たない仮説は、たとえチャート上でそれらしく見えても、研究対象としては残しません。
相関だけで採用しない、見た目の面白さだけで深掘りしない、ということです。
今後はここをかなり厳しく見たいと思っています。

4. 時間帯・状態帯で切っても残らないものは切る

Bitcoin 市場や BTC/JPY の振る舞いには時間帯依存があり、価格発見やボラティリティの出方も一様ではありません。したがって、全時間帯を一括で見て「効いていない」と決めるのも、「効いている」と決めるのも雑すぎます。BTC/JPY の intraday dynamics 研究でも、アジア時間と London-New York overlap に山を持つ M 字型の活動パターンと、時間帯ごとの price discovery の偏りが示されています。 (sciencedirect.com)

そのため、今後は最低でも

  • JST 日中
  • 欧州寄り
  • London-New York overlap
  • 米国後半〜朝方

くらいには切って観測するつもりです。
ただし、ここで重要なのは、「どこか一箇所で少しだけ良さそうに見える」程度では残さないということです。
時間帯や状態帯で切ったうえでなお、再現性を持って cost-pass が残るものだけを採用候補にします。
逆に言えば、ある時間帯に一瞬だけ見栄えの良い数字が出ても、それがサンプルの偏りや偶然の可能性を拭えないのであれば、主戦場の候補にはしません。

5. “保留”はあっても、“未定のまま放置”はしない

研究を広げすぎないためには、採用と棄却だけでなく、「保留」の扱いも大事です。
今後は仮説ごとに、一定の観測期間やサンプル数を超えたら、必ず次のどれかに分類します。

  • 採用
    条件付きでも cost-pass が確認でき、再現性もある
  • 保留
    可能性はあるが、サンプル不足や regime 依存が強く、追加観測が必要
  • 棄却
    再現性がない、コストを跨げない、あるいは説明仮説が弱い

ここで重要なのは、「未定のまま長く持ち続けない」ことです。
過去の研究でも、面白そうに見える仮説ほど、いつまでも捨てられずに残りやすいです。けれども、それをやると研究はすぐに散ります。
今後は、保留にする場合でも「何が揃えば次の判定をするのか」を明記し、放置状態にはしないようにします。

6. 今後の“切るべきライン”を先に決めておく

最後に、今後の研究で特に意識しておきたい「切るべきライン」を、あらかじめ置いておきます。

まず、秒未満〜数秒の速度競争そのものを主戦場にしないことです。
ここは、これまでの否定結果と市場マイクロ構造の研究を踏まえると、個人 botter にとって優先順位が低い領域だと考えています。最速のティック反応そのものを取るのではなく、そのあとに残る遅れや drift を見る方が合理的です。 (ideas.repec.org)

次に、horizon を無制限に延長しないことです。
長くすれば何かしら見える可能性はありますが、それはもう別テーマです。今回の研究は、あくまで短期〜中短期の intraday lead-lag を、個人が執行可能な形で見つけることを目的にしています。そこから外れるなら、研究テーマ自体を切り替えるべきです。

さらに、相関があるだけの source を採用しないことも明確にしておきます。
「たまたま連れて動いているように見える」「後から見ると説明できそう」というだけでは不十分です。
伝達経路、payer、遅れの時間幅まで含めて説明できないものは、いったん候補から外します。

そして最後に、accuracy の高さだけで前へ進まないことです。
これは今後の研究全体に対するかなり重要な戒めです。
よく当たる構造が、必ずしも金になるとは限らない。むしろ、これまで見てきた短期構造の多くは、そのズレによって落ちていきました。
だから今後は、「当たるか」ではなく、執行してもまだ取れるかを先に見る。
この順番を崩さないことが、今回の再設計でいちばん大事なルールだと思っています。

ここまでをまとめると、今後の研究で設ける基準はかなりシンプルです。
時間枠を source ごとに固定し、評価は cost-pass 中心に置き、説明できる仮説だけを残し、一定期間ごとに必ず採用・保留・棄却を決める。
そして、秒未満の速度競争、無制限の horizon 拡張、相関だけの source、accuracy 偏重は切る。
このルールを先に置いておくことで、今後の探索はかなり引き締まるはずですし、少なくとも「面白いが金にならない構造」を際限なく増やすことは減らせるのではないかと思っています。


次に実行するプランと、候補として残す研究対象

ここまで整理してきた内容を踏まえると、次にやるべきことはかなり明確です。
大事なのは、アイデアを増やすことではなく、研究対象を絞ったうえで、順番に検証していくことです。
今回の再設計でいちばん避けたいのは、短期で勝てなかった反動として、対象 source も時間軸も評価軸も一気に広げてしまうことでした。そうなると、方針転換をしたつもりが、単に探索範囲を拡散させただけになってしまいます。

したがって、今後の進め方は「広く薄く」ではなく、近い source から順に、同じ評価器で、一定期間ごとに白黒をつけていく形にします。
この章では、そのための実行プランを、候補 source の優先順位、各フェーズの目的、実装時の確認項目、そして途中で止めるべき条件まで含めて整理します。

1. まず何を主戦場の候補として残すのか

現時点で主戦場候補として残すのは、次の三系統です。

第一候補:Bitcoin 価格形成に近い非クリプト市場

ここには、CME の Bitcoin futures や、米国の Bitcoin 現物 ETF の tape が入ります。
このクラスは、crypto exchange そのものではない一方で、Bitcoin の価格形成にかなり近い位置にあるため、非クリプト source の中では最も本命に近いと考えています。

今後の研究では、まずこのクラスに対して
「本当に Binance Japan BTC/JPY より先に意味のある反応を持っているのか」
「その遅れは 30 秒〜15 分程度の帯域で残るのか」
「執行コストを跨いだあとでもなお利益が残るのか」
を検証します。

このクラスが最優先なのは、仮にここで有意な cost-pass が見つからないなら、もっと遠い source を主戦場にする根拠はかなり弱くなるからです。
逆に、ここで条件付きにでも回収可能な遅れが見つかるなら、その後に FX やマクロを補助レイヤーとして足していく意味が出てきます。

第二候補:変換・状態判定・イベント条件として使う補助層

ここには、USD/JPY、FOMC、CPI、雇用統計、金利期待、Kalshi のような macro expectation 系 source が入ります。
ただし、このクラスは最初から単独の主シグナル候補としては扱いません。

位置づけとしては、

  • BTC/JPY を fair value 的に見るための変換層
  • 近い source が効きやすい時間帯や状態帯を切るための状態層
  • イベント窓前後で構造の質がどう変わるかを見るための条件層
    です。

つまり、このクラスは「単独で金を生む source」ではなく、主仮説の効き方を改善・選別するための補助情報として使います。
ここをいきなり本丸にすると、説明も評価も曖昧になりやすいため、順番としては一段後ろに置きます。

第三候補:より遠いリスク資産・広義の proxy

株価指数、VIX、コモディティなどは、少なくとも現段階では主戦場候補としては残しません。
完全に捨てるわけではありませんが、今の時点では “参考にはなるが、いま優先して掘る対象ではない” という位置づけです。
ここを先に掘り始めると、「本当に lead と言えるのか」「誰の遅れから利益が出るのか」が一気に曖昧になるため、主線からは外します。

2. 実行順序は「無料で通せるもの」から始める

実装の順序も、なるべく自然にしておきたいです。
いきなり有料データを契約して大きく進めるのではなく、まずは無料で実装・再生・比較ができるものから通し、そこで有望な兆候が出た段階で有料化を検討する流れにします。

フェーズ1:無料データで ETF 系の replay / probe を作る

最初にやるのは、米国 Bitcoin 現物 ETF の tape を使った replay / probe です。
ここでの目的は、ETF 側の短期ショックや方向変化に対して、Binance Japan BTC/JPY に 数分〜十数分帯の追随や drift が残るかを確認することです。

この段階では、やるべきことはかなりシンプルです。

  • ETF 側でイベントの定義を作る
    例:一定秒数内の return shock、一定以上の連続変化、出来高急増など
  • そのイベント発生後の Binance Japan 側の forward move を測る
  • entry 時点のスプレッド・コストを考慮する
  • 30s / 60s / 180s / 300s / 900s の horizon ごとに net move を集計する
  • 時間帯別にも結果を切る

ここで重要なのは、ETF を無理に BTC/JPY の fair value に変換しようとしないことです。
最初は、ETF 側の変化が BJ 側の executable move にどれだけ残るかを見るだけで十分です。
実装を複雑にしすぎず、まずは source と lag 側の関係を素直に観測することを優先します。

フェーズ2:補助層を追加して状態帯を切る

ETF probe で何らかの反応が見えたら、次に補助層を足します。
ここで追加するのが、USD/JPY や macro event layer です。

目的は、

  • どの時間帯で効きやすいか
  • どのイベント窓で効きやすいか
  • spread が狭い局面と広い局面で結果がどう変わるか
  • FX の鮮度や volatility regime によって差があるか
    を切ることです。

この段階では、補助層が単独でシグナルになるかどうかは見ません。
あくまで、近い source の効き方を改善・選別できるかを見るのが目的です。

フェーズ3:有料データを使うなら CME を最優先で検討する

もし ETF 側で少しでも芽が見えた場合、あるいは「非クリプト source の中で一番近い市場」を decisive に検証したい場合は、CME の有料データを使うことを検討します。

このときの考え方はかなり明確です。
CME は、非クリプト市場の中では Bitcoin 価格形成に最も近い source 候補です。
したがって、ここを本気で見る価値は大きいです。
一方で、短期リードラグの検証を無料の遅延データだけでやろうとするのは、研究としてかなり不自然です。
なので、**CME は「無料で無理に通す対象」ではなく、「最初に有料化する価値がある本命候補」**として扱います。

3. 今後の bot / probe 実装は、役割ごとに分けて考える

今後の開発では、bot や probe を全部ひとつの巨大な観測機に押し込まず、役割ごとに分けて考えた方が良いと思っています。
現時点では、最低限次の三層に分けるのが自然です。

① Source adapter 層

各 source から必要なデータを取得し、時刻・鮮度・品質フラグつきで正規化する層です。

ここでのチェックポイントは次の通りです。

  • source ごとの timestamp を統一的に扱えるか
  • freshness を測定できるか
  • 欠損や遅延をフラグ化できるか
  • あとから replay できる形で保存できるか
  • source ごとに market regime の違いをメタ情報として残せるか

ここが弱いと、あとで観測結果を解釈できなくなります。
とくに「何秒遅れていたのか」「そのとき source 側が stale ではなかったか」は、今後の研究ではかなり重要です。

② Event / shock detector 層

source 側で「何が起きたらイベントと見なすか」を定義する層です。
今後の研究では、この層をかなり明示的に作る必要があります。

チェックポイントは次の通りです。

  • event 定義が単純で説明可能か
  • threshold を増やしすぎていないか
  • direction を持つイベントか、単なる volatility イベントか
  • source class ごとに event 定義が妥当か
  • event 発生頻度が少なすぎないか、多すぎないか

ここで event を複雑にしすぎると、また「見栄えは良いが再現しにくい条件」を量産しやすくなります。
最初は単純な return shock や連続変化から始める方がよいと思っています。

③ Evaluation / report 層

event が起きたあとに、BJ 側で何が残ったかを測る層です。
最終的に重要なのはここです。

最低限、各 event について次を出せるようにしておきたいです。

  • event 発生時刻
  • event 方向
  • entry 時点の BJ spread / cost
  • 30s / 60s / 180s / 300s / 900s の forward move
  • cost-pass の有無
  • time-to-hit
  • reversion の有無
  • 時間帯タグ
  • state / macro event タグ

この report 層が揃っていれば、あとから検証や比較がかなりしやすくなります。
逆にここが曖昧だと、「なんとなく効いていそうだった」で終わってしまいます。

4. 今後の進行チェックリスト

ここから先は、実際に開発を進めるときの確認用として、そのまま使えるように箇条書きで置いておきます。

A. 研究テーマの固定

  • 今回の主仮説は何か
  • source は近い source か、補助層か
  • その仮説は誰の何の遅れから利益が出る想定か
  • その仮説の horizon 上限は何秒〜何分か
  • 何を見たら棄却するかを先に決めたか

B. source 導入前

  • 無料で十分試せるか
  • timestamp / freshness が取得できるか
  • replay 可能な形で保存できるか
  • source quality に大きな不安はないか
  • その source を追加する理由が「面白そう」以上に説明できるか

C. event 定義時

  • event が複雑すぎないか
  • event 発生頻度は妥当か
  • direction と volatility の区別がついているか
  • source に対して event の定義が自然か
  • threshold 調整で見栄えを作っていないか

D. 評価時

  • entry cost をちゃんと引いているか
  • 30s / 60s / 180s / 300s / 900s など固定 horizon で見ているか
  • 時間帯別で切ったか
  • OOS で再現しているか
  • one-shot の良結果を過大評価していないか

E. 判定時

  • 採用 / 保留 / 棄却のどれかを必ず決めたか
  • 保留なら、何が揃えば再判定するのか明記したか
  • 棄却理由を明文化したか
  • 棄却結果を次の研究の制約条件として使えるか
  • 今回の結果は「なぜそうなったのか」を説明できるか

5. 現時点での実行プランまとめ

ここまでを踏まえると、当面の実行プランは次のようになります。

第一段階では、無料データで ETF 系の source adapter と replay probe を作ります。
ここで見るのは、ETF 側の変化に対して BJ 側の executable drift が数分〜十数分帯で残るかどうかです。

第二段階では、USD/JPY や macro event layer を補助層として追加し、どの時間帯・状態帯で構造が残りやすいかを切ります。

第三段階では、必要性が見えた場合にのみ、有料データで CME を本格的に見にいきます。
ここは「無料では無理だから後回し」ではなく、「有料化する価値がある本命かどうかを、前段の結果を踏まえて判断する」という位置づけです。

この順番で進めれば、短期世界で何度も見てきた「構造はあるが勝てない」という否定結果を踏まえつつ、次の研究をより現実的な土俵へ移していけるはずです。
しかも、どの段階で止めるべきか、何が見えたら次へ進むべきかも比較的はっきりします。
今回の再設計で得たものは、単なるアイデアではなく、次に何を作り、どこで止め、何を残すかの順番が見えたことだったのだと思います。

今回やらないこと

ここまで、時間軸の見直しや研究対象の再設計についてかなり長く整理してきました。
ただ、今回の議論で本当に大事だったのは、「次に何をやるか」だけではありません。
むしろ同じくらい重要なのは、今回の段階では何をやらないと決めるかを先に固定しておくことでした。

研究は、やろうと思えばいくらでも広げられます。
短期で勝てなかったなら、もっと精度を上げる方向にも行けますし、もっと長い時間軸へ飛ぶこともできます。source を増やすこともできますし、条件分岐や特徴量をどんどん追加することもできます。
けれども、それを全部やると、結局「何を検証していて、何を捨てたのか」が分からなくなります。
だから今回は、今後の研究を引き締めるために、あえてやらないことも明確にしておきます。

1. 秒未満〜数秒の速度競争そのものはやらない

まず、秒未満〜数秒の最速反応そのものを取りにいく研究は、今回の主線から外します。
これは「そこに構造がない」と言いたいわけではありません。むしろ、これまでの観測でも、短い時間軸の中にそれらしい構造は何度も見えていました。
ただ、その多くは執行コストやスプレッド、自分のインフラ差を含めた瞬間に、個人 botter が実際に回収するには厳しいという判定になっています。公開研究でも、Bitcoin 市場の一部ではかなり高速な注文更新やキャンセルが発生しており、この領域がすでに強いプレイヤー同士の競争になっていることが示されています。 (ideas.repec.org)

したがって、今後の研究では「もっと速くなれば取れるかもしれない」という方向には行きません。
主戦場にするのは、個人でも執行後に回収可能な遅れが残る時間帯です。
今回の再設計は、この線引きを明確にするためのものでもありました。

2. horizon を無制限に延長しない

次に、時間軸を見直すからといって、何時間でも何日でも探索対象を広げることはしません。
今回の結論は「60 秒では短すぎる可能性が高い」ということであって、「長ければ長いほどよい」ということではありません。

今後は、source の性質ごとに上限 horizon を固定します。
近い source は 30 秒〜15 分程度、遠い source は 5 分〜1 時間程度、といったラダーの中で探索します。
そこから外れる時間軸は、必要なら別テーマとして扱うべきであり、今回の短期〜中短期のリードラグ研究の中に無理に入れません。

これは、探索範囲を抑えるためだけでなく、研究の問いを守るためでもあります。
何時間も何日も先の動きまで含め始めると、それはもはや「個人 botter が intraday で取れる lead-lag 構造を探す」という話ではなくなってしまうからです。

3. 相関があるだけの source は採用しない

今後も、いろいろな source を候補として思いつくと思います。
ただし、相関がありそうに見えるだけの source は採用しません。

今後、主戦場候補として残す source には、最低でも次の説明が必要です。

  • その source は何を先に反映しているのか
  • その変化はどうやって Binance Japan の BTC/JPY に伝わるのか
  • そのあいだに誰が遅れて反応するのか
  • そこからなぜ利益が出るのか

この説明ができないものは、たとえ後から見ると「少し連れて動いている」ように見えても、主線にはしません。
今回はとくに、「何を金にするのか」「誰の遅れから利益が出るのか」を研究の中心に置き直したので、このルールはかなり重要です。
面白そうだから見る、見た目にそれらしいから掘る、という形には戻らないようにしたいと思います。

4. accuracy の高さだけで前に進まない

これは今回の再設計の核心でもあります。
今後は、予測精度や勝率の高さだけを理由に、研究を先へ進めません。

これまで何度も経験してきた通り、ある程度当たる構造が、そのまま金になるとは限りません。
短期歪み回帰や2市場間リードラグでも、「構造は見える」「方向もある程度当たる」「でも執行ベースでは負ける」という判定が繰り返し出てきました。
この経験を踏まえるなら、今後優先して見るべきなのは accuracy ではなく、執行コストを跨いだあとでもまだ回収可能な動きが残っているかどうかです。

したがって、今後は「かなり当たるから期待できる」という順番ではなく、
「執行しても残るから、そこで初めて当たり方を見る」
という順番で評価します。
この順番を崩すと、また「よく見えるが取れない構造」を増やすだけになりかねません。

5. 条件や特徴量を増やして見栄えを作ることはしない

観測機を回していると、「この条件も足した方がきれいに見える」「この閾値ならもう少し良く見える」という場面は必ず出てきます。
けれども、今の段階でそれをやり始めると、研究はすぐに過剰適合の方向へ流れます。

そのため、event 定義や条件分岐、特徴量追加については、最初はかなり素朴な形に留めます。
近い source であれば return shock や連続変化、遠い source であればイベント窓や state tag といった、説明しやすい形から始めます。
「いろいろ条件を足したらそれらしく見えた」という構造は、現時点では採用しません。
まずは単純な条件で見ても cost-pass が残るかどうか、それを先に確認します。

6. source を同時に増やしすぎない

今後の候補として、CME、ETF tape、USD/JPY、FOMC、CPI、雇用統計、Kalshi など、いくつも面白い source はあります。
ただし、それらを一気に同時並行で掘ることはしません。

今回の方針では、あくまで
近い source から順番に、同じ評価器で、一定期間ごとに白黒をつける
ことを重視します。

ですから、最初は ETF 系、必要なら次に補助層、そして有望なら CME の有料データ、というように、順番を固定します。
候補が多いこと自体は悪くありませんが、同時に走らせると、どの結果が何を意味しているのか分からなくなります。
今後は「次に試す 1 本」を常に明確にして進めるつもりです。

7. “未定のまま持ち続ける”ことはしない

最後に、これは研究の運用上かなり大事だと思っています。
今後は、仮説を「面白そうだから」といって未定のまま長く持ち続けることをしません。

各仮説には、一定期間または一定サンプル数ごとに、必ず

  • 採用
  • 保留
  • 棄却
    のどれかを与えます。

保留にすること自体は構いませんが、その場合でも
「何が揃えば再判定するのか」
を明文化しておきます。
そうしないと、結局は捨てきれない仮説がたまり続け、研究の焦点がぼやけていきます。

今回の再設計は、新しい可能性を増やすためのものではありますが、それ以上に、何を切るのかを先に決めるための整理でもありました。
だから今後は、面白さや期待感だけでテーマを引っ張らず、一定条件を満たさないものはきちんと切る運用にしていきます。

ここまでを一言でまとめると、今回やらないことはかなり明確です。
速度競争そのもの、無制限の horizon 拡張、相関だけの source 探索、accuracy 偏重、条件の積み増しによる見栄え作り、複数テーマの同時拡散、未定のままの抱え込み。
このあたりは、今回の段階ではやりません。
これらをやらないと決めておくこと自体が、今後の研究を前に進めるための大事な土台になると考えています。

-Bot, CEX, 思考ログ, 戦略ログ, 書籍・論文・web記事, 開発ログ