ここ数日のバグ対応について(まとめ)
ここ数日対応を行っていたバグ対応についてのまとめです。
-----
先週のことでしたでしょうか
データにバグがある旨のご連絡をいただきました。
すっごく簡単に書きますと
「データが重複しているため、POGの結果が正確に集計できていない」
というものでした。
具体的に名前まで挙げていただいたのは2頭。
先々週の小倉新馬戦を勝ったミラアイトーンと
各所POGでも人気になっているダブルバインド。
ミラアイトーンは父Lonhro、母タイタンクイーン(Titan Queen)
ダブルバインドは父ディープインパクト、母ラッシュラッシーズ(Lush Lashes)
この2頭が「The Sunday Breeze」のデータベースに2重に登録されていたことが原因で
正しく結果が反映されていませんでした。
---
なぜこの2頭が2重にデータベース登録されてしまったのかというと…
簡単に言うと、2頭とも
・母が外国馬である
・本仔が日本で種付けされて初めて馬名登録される馬である
という2点が理由です。
まず、馬名登録前の時点(競走馬としての血統登録された時点)で
「The Sunday Breeze」のデータベースには登録されます。
その際
名前未登録、父Lonhro(1998)、母Titan Queen(2005)、2014年3月22日生まれの牡馬
名前未登録、父ディープインパクト(2002)、母Lush Lashes(2005)、2014年2月5日生まれの牡馬
という具合で登録されています。
それぞれ母が日本産ではなく、また日本で種付けされた子供もいないため
英表記になっています。
(タイタンクイーンの2013(ミラアイトーンの兄)ストロングタイタンは
アメリカで種付け後に持ち込まれたため、母は英表記のままになっています)
んで
JRAで馬名登録された際に
すでにデータベースに登録されているデータの馬名を更新します。
ただし、JRAの馬名登録では父母の生年はわかりませんので
母馬名と生年が一致する馬のみ更新となり
母馬名が一致する馬が登録されていない場合は新たにデータを登録することにしています。
今回バグとなった2頭をJRAのサイトで確認すると
2016年5月12日付で
ミラアイトーン、父Lonhro(生年不明)、母タイタンクイーン(生年不明)、2014年3月22日生まれの牡馬
2016年7月28日付で
ダブルバインド、父ディープインパクト(生年不明)、母ラッシュラッシーズ(生年不明)、2014年2月5日生まれの牡馬
となっており
すでに登録されている
Titan Queenとタイタンクイーン、Lush Lashesとラッシュラッシーズは
それぞれ別の馬として認識されることになります。
これが原因です。
逆に言うと
2005年生まれのTitan Queenと、生年不明のタイタンクイーン
2005年生まれのLush Lashesと、生年不明のラッシュラッシーズ
これを同じ馬だと判定させるためにはどうすればいいのか?
というのが今回のバグの解決策になるわけです。
---
とりあえず
現時点での有効な解決策はありません。
同じような馬がいた場合
とりあえずは2件のデータとして登録されます。
1日おきにデータのチェックプログラムが動いていますので
その中でなんとか拾い上げる方法を考えています。
一応今のところの暫定方法としては…
幸いにもJRAの新規馬名登録では
母の父と母の母も(生年不明ではありますが)馬名が表示されています。
タイタンクイーンの父はTiznow、母はEnsnare
ラッシュラッシーズの父はGalileo、母はDance For Fun
もともとデータベースに登録されているTitan QueenもLush Lashesも
父母は同じ馬で登録されていましたので
・父が同じ
・母が同じ
・生年が正しく入っている馬と生年不明の馬
という条件でデータを検索してやると
少なくとも今回のケースではどちらも見つかることになります。
ただしこの検索ロジックだと
誤りのない馬データも検索に引っかかることがあります。
(かなり古い馬であることが多いですが)
また、母の父・母の母が同じ名前でも全く違う馬だった場合
(例えば同じ名前だけど全く違う国の馬だったり)
それでも誤りのある馬として検索に引っかかってしまいます。
とりあえず今回と同様のケースの場合は
誤りを発見して直すことができますが
ロジックの見直しは今後も必要になりそうな気がしています。
…それと
基本的にはチェックプログラムは誤りを探してくれるだけで
結局直すのは管理人の手ということになりますので
そのあたりも…実際のところはどうにかしないと。
おそらく今後も
馬データに限らず、レースデータなどにもバグがかなり潜んでいると思います。
お気づきの点があれば、管理人までご一報いただけると幸いです。
-----
さて。
今夜管理人は夜勤中。朝9時までの仕事です。
(とはいえ特にやることはありませんが:拘束されているだけ)
明日(というか正確には今日)は夜勤明け。
たぶん酒飲んで寝てると思います。
明日のブログも引き続き障害のご報告。
先週末異常にサーバが遅かったことについてまとめます。
-----
先週のことでしたでしょうか
データにバグがある旨のご連絡をいただきました。
すっごく簡単に書きますと
「データが重複しているため、POGの結果が正確に集計できていない」
というものでした。
具体的に名前まで挙げていただいたのは2頭。
先々週の小倉新馬戦を勝ったミラアイトーンと
各所POGでも人気になっているダブルバインド。
ミラアイトーンは父Lonhro、母タイタンクイーン(Titan Queen)
ダブルバインドは父ディープインパクト、母ラッシュラッシーズ(Lush Lashes)
この2頭が「The Sunday Breeze」のデータベースに2重に登録されていたことが原因で
正しく結果が反映されていませんでした。
---
なぜこの2頭が2重にデータベース登録されてしまったのかというと…
簡単に言うと、2頭とも
・母が外国馬である
・本仔が日本で種付けされて初めて馬名登録される馬である
という2点が理由です。
まず、馬名登録前の時点(競走馬としての血統登録された時点)で
「The Sunday Breeze」のデータベースには登録されます。
その際
名前未登録、父Lonhro(1998)、母Titan Queen(2005)、2014年3月22日生まれの牡馬
名前未登録、父ディープインパクト(2002)、母Lush Lashes(2005)、2014年2月5日生まれの牡馬
という具合で登録されています。
それぞれ母が日本産ではなく、また日本で種付けされた子供もいないため
英表記になっています。
(タイタンクイーンの2013(ミラアイトーンの兄)ストロングタイタンは
アメリカで種付け後に持ち込まれたため、母は英表記のままになっています)
んで
JRAで馬名登録された際に
すでにデータベースに登録されているデータの馬名を更新します。
ただし、JRAの馬名登録では父母の生年はわかりませんので
母馬名と生年が一致する馬のみ更新となり
母馬名が一致する馬が登録されていない場合は新たにデータを登録することにしています。
今回バグとなった2頭をJRAのサイトで確認すると
2016年5月12日付で
ミラアイトーン、父Lonhro(生年不明)、母タイタンクイーン(生年不明)、2014年3月22日生まれの牡馬
2016年7月28日付で
ダブルバインド、父ディープインパクト(生年不明)、母ラッシュラッシーズ(生年不明)、2014年2月5日生まれの牡馬
となっており
すでに登録されている
Titan Queenとタイタンクイーン、Lush Lashesとラッシュラッシーズは
それぞれ別の馬として認識されることになります。
これが原因です。
逆に言うと
2005年生まれのTitan Queenと、生年不明のタイタンクイーン
2005年生まれのLush Lashesと、生年不明のラッシュラッシーズ
これを同じ馬だと判定させるためにはどうすればいいのか?
というのが今回のバグの解決策になるわけです。
---
とりあえず
現時点での有効な解決策はありません。
同じような馬がいた場合
とりあえずは2件のデータとして登録されます。
1日おきにデータのチェックプログラムが動いていますので
その中でなんとか拾い上げる方法を考えています。
一応今のところの暫定方法としては…
幸いにもJRAの新規馬名登録では
母の父と母の母も(生年不明ではありますが)馬名が表示されています。
タイタンクイーンの父はTiznow、母はEnsnare
ラッシュラッシーズの父はGalileo、母はDance For Fun
もともとデータベースに登録されているTitan QueenもLush Lashesも
父母は同じ馬で登録されていましたので
・父が同じ
・母が同じ
・生年が正しく入っている馬と生年不明の馬
という条件でデータを検索してやると
少なくとも今回のケースではどちらも見つかることになります。
ただしこの検索ロジックだと
誤りのない馬データも検索に引っかかることがあります。
(かなり古い馬であることが多いですが)
また、母の父・母の母が同じ名前でも全く違う馬だった場合
(例えば同じ名前だけど全く違う国の馬だったり)
それでも誤りのある馬として検索に引っかかってしまいます。
とりあえず今回と同様のケースの場合は
誤りを発見して直すことができますが
ロジックの見直しは今後も必要になりそうな気がしています。
…それと
基本的にはチェックプログラムは誤りを探してくれるだけで
結局直すのは管理人の手ということになりますので
そのあたりも…実際のところはどうにかしないと。
おそらく今後も
馬データに限らず、レースデータなどにもバグがかなり潜んでいると思います。
お気づきの点があれば、管理人までご一報いただけると幸いです。
-----
さて。
今夜管理人は夜勤中。朝9時までの仕事です。
(とはいえ特にやることはありませんが:拘束されているだけ)
明日(というか正確には今日)は夜勤明け。
たぶん酒飲んで寝てると思います。
明日のブログも引き続き障害のご報告。
先週末異常にサーバが遅かったことについてまとめます。
このネタへのコメント:
コメントはありません。