決算分析システム

EDGAR

EDGAR XBRLを読み込むコード例【Python】

EDGAR XBRLから米国企業の決算データを抽出するコード例です。 エドガー(EDGAR)の書類は、フォーム・タイプ(Form Type)という文字列で分類されているのですが、「テン・ケイ(10-K)」と「テン・キュー(10-Q)」です...
決算分析システム

XBRLを一気に読み込み、データベースで時系列にする。

XBRLの読み込みかたですが、売上高を狙って読み込む方法と、一気に読み込んでから売上高を抽出する方法の2つがあります。両方試したのですが、『一気に』読み込んでしまうほうが良かったです。そのあたりの記録です。 最大のメリットは内容を一望でき...
EDGAR

Memory allocation failed を回避する【lxml.etree】

EDGAR XBRLを連続で読み込んだ時に、Memory allocation failed が発生するので、その原因を調べていました。 その結果、エラーの原因までは分からなかったのですが、XMLパーサーの引数に huge_tree=Tr...
EDINET

セグメント情報から事業別の売上高などを取得する方法【EDINET XBRL】

有価証券報告書には、企業全体の売上高のほかに、事業別の売上高といった詳細な情報が載っていました。 EDINET XBRL のコンテキストにある「シナリオタグ」を取り込むことで、そういった情報も取り出すことができました。 その大まかな方法...
EDGAR

lxml.etree.XMLSyntaxError: Memory allocation failed

決算分析システムでは、EDGAR XBRLを読み込むのに lxml.etree を使用しているのですが、いろいろなXMLを読み込んでいくうちに、「メモリの割り当てに失敗しました」という旨のメッセージが出ていたことに気づきました。 困ったこ...
TDnet

TDnet XBRLの勘定科目タグ集約リスト【東証XBRL】

TDnet XBRL(東証 XBRL)の勘定科目タグの集約リストです。 東京証券取引所(東証)のティー・ディー・ネットでは、決算短信のPDFと一緒にXBRLも開示されているのですが、それを集計するために作成したリストです。 ひとくちに売...
EDINET

EDINET XBRLの勘定科目タグ集約リスト

業績グラフを作るにあたって作成した、勘定科目タグの集約リストを紹介します。 決算情報をXBRLから抽出するのは比較的容易なのですが、実際に分析しようとすると、売上高にも色々な種類があって、「これが売上高のグラフだ!」というのがなかなか作れ...
EDGAR

EDGAR XBRLの名前空間とティッカーシンボル。スキーマファイルからティッカーを調べるに至った過程

米国株の決算分析のために、エドガーXBRLを読み込むプログラムを書いているのですが、その過程で色々なことが分かってきました。まだまだ作っている途中ですが、エドガーXBRLの読み込みで大変だったところをお話しします。ティッカーシンボル(ティッ...
決算分析システム

上場企業の業績グラフを描く【Python】

投資判断の参考にするために、売上・利益や資産の推移をグラフにする方法です。 自分は、「EDINET XBRLを読み込むPythonライブラリ」で読み取った決算データを使って、業績の時系列をグラフにしました。 そのPythonコードを...
EDINET

EDINET XBRLを読み込むPythonライブラリ

(2020年11月6日 追記)Python で XBRL のデータを取得するなら、まず『Arelle(アレル)』という Python ライブラリを使ってみるのが良いと思います。 ⇒ 【Python】Arelle のインストール方法【XBRL...