Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

基本運用操作マニュアル:サービス再起動の順序、ログの場所、よくあるエラーコード対照表

パートナートレーニングにおいて、運用マニュアルの目的は全員がコードを修正できるようにすることではなく、最低限「どこで問題を確認するか、サービスをどう再起動するか、異常をどう分類するか」を把握できるようにすることです。

この内容の大部分はデリバリー経験に基づくものですが、公開資料が全くないわけではありません。公式 Compose およびセルフホストドキュメントではサービス名と基本的な実行方式を明示しており、「どのログを確認するか、どのサービスを再起動するか」は公開されたサービス構成に基づいて整理できます。また、コミュニティ記事では、アップグレード後の Weaviate エラー、Internal Server Error、500 エラーなどの現場トラブルシューティング事例が補足されています。

一、公開資料から確認できる運用の基本

1. まずサービスの役割を把握し、その上で再起動順序を考える

公式ドキュメントでは apiworkerworker_beatwebplugin_daemonsandboxdb_postgresredis などのサービスが公開されており、基本運用トレーニングではまず「障害現象がどのサービスに対応するか」というメンタルモデルを受講者に構築させる必要があります。

2. Compose と Kubernetes のログ確認パスは公開されている

Compose の場合は docker compose logs <service> を直接使用でき、Kubernetes の場合は kubectl logs、deployment および pod レベルでのトラブルシューティングとなります。これらはトレーニングで最も基本的かつ実用的なアクションです。

3. コミュニティの公開記事で典型的なエラーの一部がカバーされている

例えば、Weaviate のバージョン非互換、Azure VM 上の Internal Server Error、ナレッジパイプラインに起因する異常などが報告されており、Dify の運用問題は依存コンポーネント、バージョンアップグレード、ファイル処理パイプラインに分布する傾向があることを示しています。

二、再起動順序の推奨

フロントエンドの異常だけであれば、全体再起動は避けてください。影響範囲を最小限にする原則で対応することを推奨します:

  • 単一サービスの再起動
  • 依存サービスの確認
  • 最後に全体再起動

三、ログの場所

  • Docker Compose:docker compose logs <service>
  • Kubernetes:kubectl logs deployment/<name> または pod レベルのログ
  • 重点確認対象:api、worker、enterprise、sandbox

四、よくあるエラーの分類

  • 認証 / 権限エラー
  • データベース接続エラー
  • Redis / キューエラー
  • オブジェクトストレージエラー
  • ベクトルデータベース検索エラー
  • 外部モデル Provider エラー

五、補足の推奨

内部でよくあるエラーコード対照表をお持ちの場合は、本ファイルに直接追記することを推奨します。公開資料では通常、デリバリー現場のトラブルシューティング経験がここまで網羅的に記載されていません。

公開資料の参照元

note.com

  • 【保存版・初心者OK】月1万円→1,000円台に。Difyとn8nを1台のVPSで動かす完全ガイド|SSL対応&トラブル解決付き | https://note.com/ai_restart/n/nd882767068c6

zenn.dev / 公式ドキュメント / その他公開ページ

  • Docker ComposeでDifyをデプロイする | https://docs.dify.ai/ja/self-host/quick-start/docker-compose
  • 【Dify】アプデで「Weaviate 1.19 is not supported」が出た時の … | https://zenn.dev/kotap/articles/ea3b5995b8ba44
  • Azure VM上のDify「Internal Server Error」の原因と対処 | https://zenn.dev/ytksato/articles/6cb73e68a568e6

本稿で公開資料から確認できた有効情報

  • 基本運用ではまずサービスの役割と障害現象の対応関係を構築する
  • Compose と Kubernetes のログ確認パスは公開されており明確である
  • コミュニティではアップグレードエラー、500 エラー、依存コンポーネント異常などの現場事例がすでに蓄積されている