EDGAR

EDGAR XBRLを読み込むコード例【Python】

EDGAR XBRLから米国企業の決算データを抽出するコード例です。 エドガー(EDGAR)の書類は、フォーム・タイプ(Form Type)という文字列で分類されているのですが、「テン・ケイ(10-K)」と「テン・キュー(10-Q)」...
EDGAR

XBRLを一気に読み込み、データベースで時系列にする。

XBRLの読み込みかたですが、売上高を狙って読み込む方法と、一気に読み込んでから売上高を抽出する方法の2つがあります。両方試したのですが、一気に読み込んでしまうほうが良かったです。そのあたりの記録です。 最大のメリットは内容を一望でき...
EDGAR

Memory allocation failed を回避する【lxml.etree】

EDGAR XBRLを連続で読み込んだ時に、Memory allocation failed が発生するので、その原因を調べていました。 その結果、エラーの原因までは分からなかったのですが、XMLパーサーの引数に huge_t...
EDINET

セグメント情報から事業別の売上高などを取得する方法【EDINET XBRL】

有価証券報告書には、企業全体の売上高のほかに、事業別の売上高といった詳細な情報が載っています。 EDINET XBRLのコンテキストにある「シナリオタグ」を取り込むことで、そういった情報も取り出すことができます。その大まかな方...
決算分析システム

凡例の中に日本語タイトルを表示する【matplotlib】

凡例の中に日本語タイトルを表示するには、セットタイトル set_title() を使います。以下のようなグラフが出せます。枠の中に「事業別の売上高」と表示できています。このセットタイトルメソッドは、ax.legend()の戻り値に用意されて...
EDGAR

lxml.etree.XMLSyntaxError: Memory allocation failed

決算分析システムでは、EDGAR XBRLを読み込むのに lxml.etree を使用しているのですが、いろいろなXMLを読み込んでいくうちに、「メモリの割り当てに失敗しました」という旨のメッセージが出ていたことに気づきました。 ...
TDnet

TDnet XBRLの勘定科目タグ集約リスト【東証XBRL】

TDnet XBRL(東証 XBRL)の勘定科目タグの集約リストです。 東京証券取引所(東証)のティー・ディー・ネットでは、決算短信のPDFと一緒にXBRLも開示されているのですが、それを集計するために作成したリストです。 ...
決算分析システム

Pythonでログを出力するコード例【logging】

Pythonでログをファイルに出力する簡単な方法です。 Python標準の logging(ロギング) モジュールを使用して、『動作ログ』や『エラーログ』をファイルに記録します。 ログには、『時刻情報』や『実行中の関数名』も付け...
決算分析システム

実行中のPythonプログラムの優先度を下げる方法【psutil】

Pythonプログラムの優先度を変更するコード例です。決算分析システムでは、大量のXBRLを読み込んで数字を取り出したり、大量のグラフを描いたりします。 これらは大抵、マルチプロセス処理ですべてのCPUを動員して、全力で作業に...
EDINET

EDINET XBRLの勘定科目タグ集約リスト

業績グラフを作るにあたって作成した、勘定科目タグの集約リストを紹介します。 決算情報をXBRLから抽出するのは比較的容易なのですが、実際に分析しようとすると、売上高にも色々な種類があって、「これが売上高のグラフだ!」というのが...
タイトルとURLをコピーしました