クラウド構成・費用感 参考資料

競馬分析・予測システムの納品版を、さくらインターネット系サービス上で動かす場合の構成案です。 参照頻度は高くなく、DBは常時稼働、重い学習や画像特徴量抽出は必要時のみ実行する前提で整理しています。

結論

費用重視
月4,000〜9,000円台

さくらのVPSにDjangoとPostgreSQLを同居し、重い学習だけ高火力DOKへ逃がす案。継続費用は安いが、DB運用・バックアップ・監視は自前。

運用負荷軽減
月10,000〜13,000円台

DBアプライアンス30GB、AppRun、Object Storage、高火力DOKを組み合わせる案。DB管理を軽くしつつ、Webと学習を分離する。

クラウドサーバ中心
月15,000〜25,000円台

さくらのクラウドのサーバとディスクでVPS相当を作る案。柔軟だが、通常運用費はVPSより高い。

現時点の実データではローカルPostgreSQLが約15GBあります。10GB DBでは不足しやすいため、DBアプライアンスを使うなら30GBプランが現実的です。

構成案比較

構成 月額目安 向いているケース 注意点
A. VPS 8G + DOK VPS 8GにDjango/PostgreSQL/docs。Object Storageにモデル・中間特徴量。DOKは学習時のみ。 約7,700〜9,000円 継続費用を抑えたい。DB/Webを1台で管理できる。 OS、PostgreSQL、バックアップ、監視は自前。障害時の復旧手順を明確にする必要がある。
B. DBアプライアンス + AppRun + DOK DBアプライアンス30GB、AppRun 2vCPU/4GiBを低頻度起動、Object Storage、DOK V100。 約10,000〜13,000円 DB管理を軽くしたい。WebとDBと重いバッチを分けたい。 AppRunは長時間バッチには不向き。DB 30GBが固定費の大半。
C. クラウドサーバ単体 + DOK さくらのクラウドの4Core/8GB級サーバ + 100GB以上SSD。PostgreSQL/Djangoを同居。 約15,000〜20,000円 さくらのクラウド内でVPSに近い管理感で動かしたい。 サーバ代とディスク代が別で積み上がる。VPSより割高になりやすい。
D. クラウドサーバ + DBアプライアンス Web/バッチ用クラウドサーバ、DBアプライアンス30GB、Object Storage、DOK。 約20,000円以上 DBとWebを分けて安全にしたい。運用の見通しをよくしたい。 今回の参照頻度だとやや過剰。安定性重視の上位案として扱う。

推奨案

運用負荷を軽くする構成

クライアント側でDB運用の負担を軽くしたい場合は、 DBアプライアンス30GB + AppRun + Object Storage + 高火力DOK が使いやすいです。 DBは常時稼働、Webは使うときだけ、重い学習はDOKに寄せる構成です。

項目想定月額目安
DBDBアプライアンス30GB8,580円
WebAppRun 2vCPU/4GiB、週4日 x 2時間程度約660円
GPUバッチDOK V100、週1回30分約125円
保存Object Storage 60GB、モデル・中間特徴量・dump495円〜1,200円程度
合計転送量・ログ量で変動約10,000〜13,000円

長期・費用重視

継続費用を優先するなら、 VPS 8G + Object Storage + 高火力DOK が現実的です。 ただしPostgreSQLやOSの運用は自前になるため、バックアップ・復旧・監視の手順を納品資料に含める必要があります。

項目想定月額目安
常時サーバVPS 8G、Django + PostgreSQL + docs約7,040円
GPUバッチDOK V100、週1回30分約125円
保存Object Storage495円〜
合計運用自前約7,700〜9,000円

DOKへ切り出す処理

JBIS・オークション・セールのデータ取得はWebアクセスや差分管理が中心なので、DOKではなくVPSまたはローカルで実行します。 DOKは短時間だけGPU/高性能CPUを使いたい処理に限定します。

処理 DOK適性 理由 成果物
CLIP/DINO/ConvNeXt画像特徴量抽出 高い GPU利用価値が大きく、VPS 4GB/8GBでは時間とメモリが厳しい。 image_features.parquet
コメントembedding再生成 高い 大量コメントのベクトル化はバッチ向き。DB肥大化を避けるため外部保存がよい。 comment_embeddings.parquet
CatBoost/LightGBM本番学習 現状規模ではCPUでも可能。ただし複数ターゲット・複数試行をまとめるならDOKが楽。 model.cbm, metrics.json
Optunaチューニング 高い 100試行以上を並べて回す場合、常時サーバを圧迫しない。 trials.csv, best_params.json
予測一覧HTML作成 低〜中 軽い処理ならVPS/AppRunでよい。学習直後のレポート生成としてDOKに含めてもよい。 prediction_list.html
1. DBから書き出し
VPS/ローカルで学習元データをParquet/CSV化
2. Object Storage
入力データ、画像zip、manifestを配置
3. DOK実行
Dockerイメージで特徴量抽出・学習・評価
4. 成果物保存
モデル、特徴量、ログ、HTMLを保存
5. DBへ反映
モデルバージョンと予測スコアのみ取り込み

DB容量の考え方

現行ローカルDBは約15GBです。dumpファイルは圧縮されて3GB台でも、クラウドDBでは展開後サイズで考える必要があります。 納品版ではDBに残すものとObject Storageへ逃がすものを分けます。

DBに残すObject Storageへ逃がす
競走馬、レース、収支計算、血統snapshot、オークション/セール基本情報、画面表示用の予測スコア 学習済みモデル、画像特徴量本体、コメントembedding本体、Optuna試行ログ、中間特徴量、古いレポート成果物

10GB DBは余裕が少なく、更新・migrate・再集計時に詰まりやすいです。30GBを基準にし、DB肥大化しやすいembeddingや中間JSONは外部保存に寄せるのが安全です。

参考料金

サービス主な料金今回の使い方
DBアプライアンス 30GBプラン 8,580円/月 30GBを基準。10GBは不足しやすい。
AppRun共用型 2vCPU/4GiB 19円/時、月額上限目安14,136円 Web/docs/APIを低頻度起動。長時間バッチは避ける。
高火力DOK V100 0.016円/秒、57.6円/時 画像特徴量、コメントembedding、チューニング。
Object Storage 100GiBまでの基本枠 495円/月、超過は従量 モデル、dump、Parquet、中間成果物置き場。
クラウドサーバ 例: 2Core/4GB 4,620円/月、4Core/8GBは別途。ディスクはSSD 100GB 3,850円/月など VPS相当をクラウド内で作る場合。ディスク料金が別途必要。
VPS 4G 3,520円/月、8G 7,040円/月程度 継続費用重視。ただしさくらのクラウドとは別サービス。