結論
さくらのVPSにDjangoとPostgreSQLを同居し、重い学習だけ高火力DOKへ逃がす案。継続費用は安いが、DB運用・バックアップ・監視は自前。
DBアプライアンス30GB、AppRun、Object Storage、高火力DOKを組み合わせる案。DB管理を軽くしつつ、Webと学習を分離する。
さくらのクラウドのサーバとディスクでVPS相当を作る案。柔軟だが、通常運用費はVPSより高い。
現時点の実データではローカルPostgreSQLが約15GBあります。10GB DBでは不足しやすいため、DBアプライアンスを使うなら30GBプランが現実的です。
構成案比較
| 案 | 構成 | 月額目安 | 向いているケース | 注意点 |
|---|---|---|---|---|
| A. VPS 8G + DOK | VPS 8GにDjango/PostgreSQL/docs。Object Storageにモデル・中間特徴量。DOKは学習時のみ。 | 約7,700〜9,000円 | 継続費用を抑えたい。DB/Webを1台で管理できる。 | OS、PostgreSQL、バックアップ、監視は自前。障害時の復旧手順を明確にする必要がある。 |
| B. DBアプライアンス + AppRun + DOK | DBアプライアンス30GB、AppRun 2vCPU/4GiBを低頻度起動、Object Storage、DOK V100。 | 約10,000〜13,000円 | DB管理を軽くしたい。WebとDBと重いバッチを分けたい。 | AppRunは長時間バッチには不向き。DB 30GBが固定費の大半。 |
| C. クラウドサーバ単体 + DOK | さくらのクラウドの4Core/8GB級サーバ + 100GB以上SSD。PostgreSQL/Djangoを同居。 | 約15,000〜20,000円 | さくらのクラウド内でVPSに近い管理感で動かしたい。 | サーバ代とディスク代が別で積み上がる。VPSより割高になりやすい。 |
| D. クラウドサーバ + DBアプライアンス | Web/バッチ用クラウドサーバ、DBアプライアンス30GB、Object Storage、DOK。 | 約20,000円以上 | DBとWebを分けて安全にしたい。運用の見通しをよくしたい。 | 今回の参照頻度だとやや過剰。安定性重視の上位案として扱う。 |
推奨案
運用負荷を軽くする構成
クライアント側でDB運用の負担を軽くしたい場合は、 DBアプライアンス30GB + AppRun + Object Storage + 高火力DOK が使いやすいです。 DBは常時稼働、Webは使うときだけ、重い学習はDOKに寄せる構成です。
| 項目 | 想定 | 月額目安 |
|---|---|---|
| DB | DBアプライアンス30GB | 8,580円 |
| Web | AppRun 2vCPU/4GiB、週4日 x 2時間程度 | 約660円 |
| GPUバッチ | DOK V100、週1回30分 | 約125円 |
| 保存 | Object Storage 60GB、モデル・中間特徴量・dump | 495円〜1,200円程度 |
| 合計 | 転送量・ログ量で変動 | 約10,000〜13,000円 |
長期・費用重視
継続費用を優先するなら、 VPS 8G + Object Storage + 高火力DOK が現実的です。 ただしPostgreSQLやOSの運用は自前になるため、バックアップ・復旧・監視の手順を納品資料に含める必要があります。
| 項目 | 想定 | 月額目安 |
|---|---|---|
| 常時サーバ | VPS 8G、Django + PostgreSQL + docs | 約7,040円 |
| GPUバッチ | DOK V100、週1回30分 | 約125円 |
| 保存 | Object Storage | 495円〜 |
| 合計 | 運用自前 | 約7,700〜9,000円 |
DOKへ切り出す処理
JBIS・オークション・セールのデータ取得はWebアクセスや差分管理が中心なので、DOKではなくVPSまたはローカルで実行します。 DOKは短時間だけGPU/高性能CPUを使いたい処理に限定します。
| 処理 | DOK適性 | 理由 | 成果物 |
|---|---|---|---|
| CLIP/DINO/ConvNeXt画像特徴量抽出 | 高い | GPU利用価値が大きく、VPS 4GB/8GBでは時間とメモリが厳しい。 | image_features.parquet |
| コメントembedding再生成 | 高い | 大量コメントのベクトル化はバッチ向き。DB肥大化を避けるため外部保存がよい。 | comment_embeddings.parquet |
| CatBoost/LightGBM本番学習 | 中 | 現状規模ではCPUでも可能。ただし複数ターゲット・複数試行をまとめるならDOKが楽。 | model.cbm, metrics.json |
| Optunaチューニング | 高い | 100試行以上を並べて回す場合、常時サーバを圧迫しない。 | trials.csv, best_params.json |
| 予測一覧HTML作成 | 低〜中 | 軽い処理ならVPS/AppRunでよい。学習直後のレポート生成としてDOKに含めてもよい。 | prediction_list.html |
VPS/ローカルで学習元データをParquet/CSV化
入力データ、画像zip、manifestを配置
Dockerイメージで特徴量抽出・学習・評価
モデル、特徴量、ログ、HTMLを保存
モデルバージョンと予測スコアのみ取り込み
DB容量の考え方
現行ローカルDBは約15GBです。dumpファイルは圧縮されて3GB台でも、クラウドDBでは展開後サイズで考える必要があります。 納品版ではDBに残すものとObject Storageへ逃がすものを分けます。
| DBに残す | Object Storageへ逃がす |
|---|---|
| 競走馬、レース、収支計算、血統snapshot、オークション/セール基本情報、画面表示用の予測スコア | 学習済みモデル、画像特徴量本体、コメントembedding本体、Optuna試行ログ、中間特徴量、古いレポート成果物 |
10GB DBは余裕が少なく、更新・migrate・再集計時に詰まりやすいです。30GBを基準にし、DB肥大化しやすいembeddingや中間JSONは外部保存に寄せるのが安全です。
参考料金
| サービス | 主な料金 | 今回の使い方 |
|---|---|---|
| DBアプライアンス | 30GBプラン 8,580円/月 | 30GBを基準。10GBは不足しやすい。 |
| AppRun共用型 | 2vCPU/4GiB 19円/時、月額上限目安14,136円 | Web/docs/APIを低頻度起動。長時間バッチは避ける。 |
| 高火力DOK V100 | 0.016円/秒、57.6円/時 | 画像特徴量、コメントembedding、チューニング。 |
| Object Storage | 100GiBまでの基本枠 495円/月、超過は従量 | モデル、dump、Parquet、中間成果物置き場。 |
| クラウドサーバ | 例: 2Core/4GB 4,620円/月、4Core/8GBは別途。ディスクはSSD 100GB 3,850円/月など | VPS相当をクラウド内で作る場合。ディスク料金が別途必要。 |
| VPS | 4G 3,520円/月、8G 7,040円/月程度 | 継続費用重視。ただしさくらのクラウドとは別サービス。 |