🛠️開発記録#242(2025/6/4)Cron ＆ Docker自動再起動・停止：取り組みと学びのまとめ

2025年6月4日

🎯 目的

Botが沈黙・フリーズ・ログ出力停止したときに自動的に検出し、Slack通知を出す
必要に応じて再起動 or 停止を自動で行う
それらの定期監視を Cron に組み込む

✅ 実施した取り組みと到達点

1️⃣ `watchdog.sh` の設計と実装

主な監視機能：
- logs/MMBot.log の更新が止まっていないか（タイムスタンプ差分を pnl_age として計算）
- pnl_report.csv の最終更新が古すぎないか
- Slack へのエラー通知機能（Webhook）
安全制御ラップを実装済み：
- docker compose restart mmbot を直接叩かず、DRY-RUNラッパーで包んで事故防止
- --dry-run モードでSlack通知だけを行う検証ルートも搭載済み
- .env.production や .env.testnet から環境変数を読み込む仕組みを内包
Slack通知の分離も設計済み（watchdog用とBot本体通知用を分離）

2️⃣ Cronへの登録と動作確認

crontab -e に以下を追加（1分おき監視の例）

* * * * * /path/to/MMBot/scripts/watchdog.sh >> /path/to/MMBot/logs/watchdog_cron.log 2>&1

動作確認済み：
- .log や .csv の最終更新時刻が古くなるとSlackにアラート通知
- 再起動モードでは docker compose restart mmbot が発火されることを確認済み

3️⃣ Docker側の自動再起動ポリシーとの重複問題も検討

docker-compose.yml に以下を設定済み

restart: "${MMBOT_RESTART:-unless-stopped}"

これにより Botがクラッシュやexitした場合に自動再起動される
→ watchdogと併用することで、Docker Restart（起動失敗時）＋watchdog（沈黙時）という二重の冗長化体制が形成される

⏸ 保留中の内容と理由

保留内容	理由	解決の方向性
✅ Cronジョブの運用レベルでの安定化	crontabの書き方や環境変数の読み込みなどに多少の混乱あり	`.env` の明示的読み込み (`source .env && watchdog.sh`) をスクリプト内で吸収するように改善予定
✅ `watchdog_cron.log` のログ肥大化	無限追記になってしまう可能性	`logrotate` や `max lines` 制御の導入を検討中
✅ Slack通知がややノイジーになる可能性	毎分Slackが鳴る設定だと本番運用では過剰通知に	初期フェーズは通知だけ、後でフィルタ条件追加予定（失敗3回連続で通知など）
✅ `docker stop` と `watchdog.sh` の役割整理	両方で「停止」を制御しようとすると意図しない挙動になる可能性	明確に役割分担：Docker Restart → 異常停止復旧、watchdog → ロジック停止やフリーズ検出
✅ Self-hosted Runner連携によるGithub Actions失敗時の自動停止	Actions失敗とBotの自動停止をどう結びつけるか設計中	`runner_healthcheck.yml` に `docker stop mmbot` を仕込む設計を検討中

💡 学びと設計上の気づき

学び	説明
Dockerと外部監視は補完関係であるべき	Dockerのrestartは「プロセスが死んだら起動」だが、watchdogは「生きてるが止まってる」を検出できる
`.env`の読み込みはスクリプト内で完結するべき	Cronではシェルが独立して起動されるため、グローバルに`source`しても反映されない
`--dry-run` での検証は爆発防止に必須	実環境でいきなり再起動させず、通知やログだけで挙動を確認できるのは大きな安心材料
Slack通知はフェイルセーフ設計に近い	通知が止まったら異常、通知が多すぎても異常。運用バランスを取る工夫が必要

🔜 今後の方向性

watchdog.sh の通知条件（失敗カウント・再起動判定）を微調整
runner_healthcheck.yml に docker stop mmbot を統合し、CIエラー時の自動停止を組み込み
.env.production.example に SLACK_WEBHOOK_WATCHDOG、LOG_FILE などを追記して汎用化
watchdog_cron.log のサイズ制御 or ログローテート導入
scripts/run_watchdog.sh などのCronラッパーを整備して、可搬性の高い監視体制をテンプレート化

🔖 まとめ

目的だった「Botがフリーズしても検出してSlack通知する」ためのwatchdog＋cron構成はほぼ完成し、あとは細部の安定化と運用設計を残すのみ。
構造面でも「Docker restart＝プロセス死の冗長性」「watchdog＝論理死の検出」という役割分担が定義され、今後はCI統合とSlack最適化を軸に仕上げフェーズへ進む。

-Bot, mmbot, 開発ログ

comment コメントをキャンセル

Bot 開発ログ

2025/5/4

開発記録#184(2025/4/19)「今週のまとめと振り返り4/12~18」

過去１週間で私が仮想通貨botterとして行動したログを整理して。 ChatGPT: 思考時間: 8 秒以下、2025年4月12日（日）〜4月18日（土）の１週間にわたる、仮想通貨botterとしての主な行動ログを日付順に整理しました。もし抜けや誤りがあれば教えてください。日付活動カテゴリ実施内容ステータス4/12 (金)Slack 通知機能統合- Slack API ボット開発：取引シグナルや取引履歴を Slack に流す仕組みを設定完了- send_slack.py スクリプト作成4/13 (土) ...

Bot mmbot Tips 環境構築・インフラ開発ログ

2025/5/4

🛠️開発記録#206(2025/5/3)MMbot開発ログ14「実弾テストで得た10の学び」

前回の記事に引き続き、今回も仮想通貨botの開発状況をまとめていきます。はじめに実弾テスト初日（Day-1）で「環境まわり」に集中して得られたノウハウを 10 個に凝縮しました。対象読者は―― Docker／Poetry／pyenv を使って Python × 仮想通貨 Bot を動かしたい人 “動くが壊れやすい” 開発環境を安全・再現可能にしたい人 1. Python バージョンは “ホストで固定 → コンテナで保証” 手順一行メモpyenv global 3.12.4ホストの minor を ...

Bot 思考ログ開発ログ

2025/8/8

🛠️週次報告(2025/8/1~8/8)

今週のbot開発に関する記録とセルフレビュー＆来週の計画をまとめました。「実装着地スピード」や「短期収益化案件への集中」は現時点での私の課題だな。生活リズムの固定化、継続力、勝ち筋のない案件を早期に見切れるのは強み。新戦略を構想だけでなく3日以内にバックテストまたは小規模本番投入とかをすると力が伸びそう。来週は「短期収益化スピード強化」に極振りしよ。— よだか(夜鷹/yodaka) (@yodakablog) August 8, 2025 📅 タイムライン 8月1日（金）特定の技術課題や構 ...

Bot

2025/4/10

開発記録#149(2025/3/25)「論文ベースのbot開発フローpart.11 本番環境の最適化」

前回の記事に引き続き、今回も仮想通貨botの開発状況をまとめていきます。本記事では「暗号通貨のパンプ＆ダンプスキームの検出」に関する論文をベースにbot開発の過程をまとめていきます。 Detecting Crypto Pump-and-Dump Schemes: A Thresholding-Based Approach to Handling Market Noisehttps://t.co/ctCJEV1MBs— よだか(夜鷹/yodaka) (@yodakablog) March 22 ...

Bot DeFi bot DEX 開発ログ

2026/2/24

🛠️開発記録#464(2026/2/24)「歪みを探す前に地図を作ろう — マルチチェーンDeFi経路モデリングの実装記録」

DeFiアービトラージという言葉を聞くと、多くの人は「価格差を見つけること」が出発点だと思うかもしれません。私も最初はそうでした。しかし実際にボットを組み、マルチチェーンで探索を始めてすぐに気づいたのは、価格差よりも前に確認すべきことがあるという事実です。それは、「その経路は本当に存在するのか」という問いでした。価格が歪んでいるように見えても、トークンの接続関係が閉じていなければ実行は不可能です。閉路があっても、サイズを流せばスリッページで崩壊します。さらに、静的に成立していても、それが時間的に持続しな ...

🛠️開発記録#241(2025/6/4)MMBot再稼働フロー ─ 再構築フェーズで乗り越えてきたこと

🛠️開発記録#243(2025/6/4)構造化と実装の両輪で前進した一日