データベースの容量とWeb表示スピードの相関を考える。
昨日書こうと思って書かなかった話。
今夜はデータベースについてちょろっと。
---
当「The Sunday Breeze」のデータベース。
多少の重複やデータ異常はありながらも、データベースに登録されているのは
競走馬の数ではおよそ65万頭。
過去のレース結果は
1986年以降の平場の中央・地方全レースと1998年以降のばんえい競馬
合わせておよそ74万レース。
これだけのデータがあると
そりゃ蓄えているディスクも相当なものなんでしょう…
と思われがちではありますが。
現時点でのデータベースディスク容量は、およそ10ギガバイト。
管理人が3回競馬観戦に行って撮ってくる写真の容量と変わりません。
---
「どうだー、うちはデータいっぱいあるのに容量少ないんだぞー」
ってのが今日のブログで言いたいこと…
ではありません。
---
データの量が同じだった場合(管理人なりの某サイトとの比較)
おそらくデータベース容量とWebページの表示速度は反比例の関係にあります。
何のストレスもない某競馬データベースサイトは
データベースの容量だけでもテラ単位なんじゃないかと推測しています。
それはなぜか。
基本のデータベース。
競走馬の基本情報、レースの基本情報
ホントの基本情報のみ(いわゆる「生データ」)を登録してあるデータベース。
そして
その基本のデータベースを編集し
Webサイトでそのまま表示すればいいだけの編集済みデータベース。
「The Sunday Breeze」では
編集済みデータベースを現在はもっていません。
当然、編集済みデータベースを持つことによって
データベースの容量は格段に増えます。
ただ、データをそのまま表示すればいいだけなので
表示スピードは格段に上がります。
現在の「The Sunday Breeze」では
生データをWebページ側で編集し、皆さまのブラウザで表示しています。
(編集するのはサーバの処理ですが)
これつまり…
生データからバッチ処理かなんかで編集済みデータベースを作成することが
「The Sunday Breeze」の致命的な処理の遅さを改善する最善策なのではないかと。
---
現在進めていますのは、まずは生データの整理。
生データもある程度整理して、登録処理が簡単にできるような構造に変更。
そして、生データからWeb表示用の編集済みデータ用データベースの準備。
これは…今のところ構想だけで、まだ手を付けられていません。
逆に言うと
編集済みデータベースに合わせて、Webサイト自体を変えるべきだと思うんですが
卵が先か鶏が先かの話になりますので…。
(データベースに合わせてWebを直すか、Webに合わせてデータベースを直すか
普通ならデータベースが先だとは思いますが)
少しずつデータベースを直してはいますが
あまりにも影響が大きいデータ(競走馬データとかレースデータとか)は
大きく手を入れるタイミングを見計らっているところではあります。
少しサーバ自体を止めないとダメかな…。
---
っと
あんまりサーバを構っていないように見せかけつつ
実は内部的には少しずつ変化をしております。
今年の「The Sunday Breeze」の目標はそこにありますので。
出来れば今年中にはある程度の成果を上げたいと思います。
-----
さて。
明日はやっと金曜日。
明日は飲み会のため、千葉へ戻ります。
ただ土曜日に日帰り静岡のため、飲み会が終わったら自宅(南浦和)へ戻ってくる予定です。
明日のブログは…たぶん無理だな。
よっぽど何かあれば、酔った勢いで書いていこうと思います。
今夜はデータベースについてちょろっと。
---
当「The Sunday Breeze」のデータベース。
多少の重複やデータ異常はありながらも、データベースに登録されているのは
競走馬の数ではおよそ65万頭。
過去のレース結果は
1986年以降の平場の中央・地方全レースと1998年以降のばんえい競馬
合わせておよそ74万レース。
これだけのデータがあると
そりゃ蓄えているディスクも相当なものなんでしょう…
と思われがちではありますが。
現時点でのデータベースディスク容量は、およそ10ギガバイト。
管理人が3回競馬観戦に行って撮ってくる写真の容量と変わりません。
---
「どうだー、うちはデータいっぱいあるのに容量少ないんだぞー」
ってのが今日のブログで言いたいこと…
ではありません。
---
データの量が同じだった場合(管理人なりの某サイトとの比較)
おそらくデータベース容量とWebページの表示速度は反比例の関係にあります。
何のストレスもない某競馬データベースサイトは
データベースの容量だけでもテラ単位なんじゃないかと推測しています。
それはなぜか。
基本のデータベース。
競走馬の基本情報、レースの基本情報
ホントの基本情報のみ(いわゆる「生データ」)を登録してあるデータベース。
そして
その基本のデータベースを編集し
Webサイトでそのまま表示すればいいだけの編集済みデータベース。
「The Sunday Breeze」では
編集済みデータベースを現在はもっていません。
当然、編集済みデータベースを持つことによって
データベースの容量は格段に増えます。
ただ、データをそのまま表示すればいいだけなので
表示スピードは格段に上がります。
現在の「The Sunday Breeze」では
生データをWebページ側で編集し、皆さまのブラウザで表示しています。
(編集するのはサーバの処理ですが)
これつまり…
生データからバッチ処理かなんかで編集済みデータベースを作成することが
「The Sunday Breeze」の致命的な処理の遅さを改善する最善策なのではないかと。
---
現在進めていますのは、まずは生データの整理。
生データもある程度整理して、登録処理が簡単にできるような構造に変更。
そして、生データからWeb表示用の編集済みデータ用データベースの準備。
これは…今のところ構想だけで、まだ手を付けられていません。
逆に言うと
編集済みデータベースに合わせて、Webサイト自体を変えるべきだと思うんですが
卵が先か鶏が先かの話になりますので…。
(データベースに合わせてWebを直すか、Webに合わせてデータベースを直すか
普通ならデータベースが先だとは思いますが)
少しずつデータベースを直してはいますが
あまりにも影響が大きいデータ(競走馬データとかレースデータとか)は
大きく手を入れるタイミングを見計らっているところではあります。
少しサーバ自体を止めないとダメかな…。
---
っと
あんまりサーバを構っていないように見せかけつつ
実は内部的には少しずつ変化をしております。
今年の「The Sunday Breeze」の目標はそこにありますので。
出来れば今年中にはある程度の成果を上げたいと思います。
-----
さて。
明日はやっと金曜日。
明日は飲み会のため、千葉へ戻ります。
ただ土曜日に日帰り静岡のため、飲み会が終わったら自宅(南浦和)へ戻ってくる予定です。
明日のブログは…たぶん無理だな。
よっぽど何かあれば、酔った勢いで書いていこうと思います。
このネタへのコメント:
コメントはありません。