2018-08

EDGAR

EDGAR XBRLを読み込むPythonライブラリ

米国企業の決算書を読み込む Python ライブラリを作りました。米国証券取引委員会のエドガーで公開されている XBRL を読み込むライブラリです。 企業の決算書を表すフォーム・タイプは 10-Q、10-K、10-Q/A、10-K/A...
EDGAR

EDGAR XBRLをリストやデータフレームに変換するコード例【Python】

EDGAR XBRLを読み込むコード例で読み込んだデータを、Python のリストや pandas のデータフレームに変換します。そのコード例です。 データフレームへの変換ですが、EDGAR XBRL では西暦3000年といった、pa...
EDGAR

EDGAR XBRLを読み込むコード例【Python】

EDGAR XBRLから米国企業の決算データを抽出するコード例です。 エドガー(EDGAR)の書類は、フォーム・タイプ(Form Type)という文字列で分類されているのですが、「テン・ケイ(10-K)」と「テン・キュー(10-Q)」...
EDGAR

XBRLを一気に読み込み、データベースで時系列にする。

XBRLの読み込みかたですが、売上高を狙って読み込む方法と、一気に読み込んでから売上高を抽出する方法の2つがあります。両方試したのですが、一気に読み込んでしまうほうが良かったです。そのあたりの記録です。 最大のメリットは内容を一望でき...
EDGAR

Memory allocation failed を回避する【lxml.etree】

EDGAR XBRLを連続で読み込んだ時に、Memory allocation failed が発生するので、その原因を調べていました。 その結果、エラーの原因までは分からなかったのですが、XMLパーサーの引数に huge_tree=Tr...
EDINET

セグメント情報から事業別の売上高などを取得する方法【EDINET XBRL】

有価証券報告書には、企業全体の売上高のほかに、事業別の売上高といった詳細な情報が載っています。 EDINET XBRLのコンテキストにある「シナリオタグ」を取り込むことで、そういった情報も取り出すことができます。その大まかな方法を紹介...
決算分析システム

凡例の中に日本語タイトルを表示する【matplotlib】

凡例の中に日本語タイトルを表示するには、セットタイトル set_title() を使います。以下のようなグラフが出せます。枠の中に「事業別の売上高」と表示できています。このセットタイトルメソッドは、ax.legend()の戻り値に用意されて...
EDGAR

lxml.etree.XMLSyntaxError: Memory allocation failed

決算分析システムでは、EDGAR XBRLを読み込むのに lxml.etree を使用しているのですが、いろいろなXMLを読み込んでいくうちに、「メモリの割り当てに失敗しました」という旨のメッセージが出ていたことに気づきました。 困っ...
TDnet

TDnet XBRLの勘定科目タグ集約リスト【東証XBRL】

TDnet XBRL(東証 XBRL)の勘定科目タグの集約リストです。 東京証券取引所(東証)のティー・ディー・ネットでは、決算短信のPDFと一緒にXBRLも開示されているのですが、それを集計するために作成したリストです。 ひと...
決算分析システム

Pythonでログを出力するコード例【logging】

Pythonでログをファイルに出力する簡単な方法です。 Python標準の logging(ロギング) モジュールを使用して、『動作ログ』や『エラーログ』をファイルに記録します。 ログには、『時刻情報』や『実行中の関数名』も付け...
タイトルとURLをコピーしました