エックス・ビー・アール・エル(XBRL)の取得方法は、金融庁のエディネット(EDINET)から取得する方法と、有限会社プレシスの有報キャッチャーから取得する方法があります。
効率的に取得するためには、EDINETコードリストまたは証券コードリストを使って、順番に取得していくプログラムを用意する必要があります。Pythonで作ります。ですが、いきなり全ての上場企業を取得する必要はありません。
まずは日本基準の企業1社のXBRLを取得する
実際に試してみると分かるのですが、企業の数が多く、有報だけでもデータ取得に3か月以上かかってしまう勢いです。これでは開発が始められません。
まずは、会計基準で「日本基準(JA-GAAP)」を採用している企業を1社選び、その「開示情報リスト」、「PDF」、「XBRL」を取得するのが良いでしょう。これならすぐに取得できます。私もそのような感じで始めました。次に、赤字部分の説明です。
日本基準のXBRLは、サマリーと財務諸表の両方に対応している点と、上場企業の9割が採用している点で、まずはこちらから着手するのが良いでしょう。この対応だけで完成といってもいいくらいのシェアです。サマリー(summary)とは、有報や決算短信のはじめの方に載ってる表のことです。売上・利益・資産などが載ってるやつです。
「米国基準(US-GAAP)」と「国際基準(IFRS)」のXBRLは、2014年以降、サマリーのみの対応になりました。財務諸表のデータは取得が困難になっています。(金融庁の説明を見るに、2018年から再び対応する動きはあるようです。)
開示情報リストとは、「開示日時」、「EDINETコード」、「証券コード」、「社名」、「表題」などのリストのことです。これは、PDFとXBRLの管理に必須です。企業分析にも役立ちますので、CSVなどで控えておきます。
PDFは、XBRLデータ抽出プログラムの答え合わせに必須です。取得した開示情報、PDF、XBRLは、簡単に閲覧・研究できるように、エクセルで管理プログラムを作っていきます。ウェブベースで、ブラウザから使える管理システムも便利そうですね。いつか作ってみたいなと思います。