EDGAR XBRLの読み込みで難しいところ

「四半期ごとの金額」と「通期の累計金額」を分けて読み込むところです。自分がやり方を知らないだけかもしれませんが、本当に簡単じゃないですね。

同じ日付の金額違いとか、累計のところに四半期の小さな金額が入ってしまっている状態をひとつひとつチェックしてPythonコードを調整しているのですが、これが困難を極めています。

XBRLのデータ自体にも不規則なものがけっこうありまして、できるだけ企業間で足並みの揃った、揺らぎの少ない項目を試行錯誤で探して、コードに組み込むような、そんな地道な作業を続けています。

まあ、難しいは難しいのですが、パズル的な楽しさを感じますね。時々、データの入力ミスなのか、それとも、なにか米国の慣習によるものなのか、よく分からないところもありまして、そういうところですね。

いかにうまくさばいていくか?という感じで、解けなくて分からないまま放っておいても、朝になったらひらめいている!というサイクルの繰り返しがけっこう楽しいです。

タイトルとURLをコピーしました