TOPフォーマットについてブログ解析フォーマット
最終更新日 : 2020/12/29

ブログ解析フォーマット

ブログ解析フォーマットの大きな特徴

ブログ解析フォーマットの大きな特徴としては長い文章を書いた際に、段落を一つのまとまりとしてグラフに表示できる点にあります。主として3000文字以上のブログや商用ブロガー、ライターなどが使う事を想定したフォーマットです。

空白行(=改行2つ)〜空白行をひとつのまとまりとして、グラフに表示されます。

txt、docx形式に対応しています。doc形式には対応していません。

ただし、文章は読点と改行単位で分割され、管理されます。現在、「だよね。。。」のような表現は分割されてしまうため、不具合として対応中です。

中見出しについて

  • 文の先頭に「●」「◯」「■」「□」のいずれかがあれば中見出しとして認識されます。中見出しはグラフ上にアノテーションとして表示されます。
  • 中見出しの文を感情解析の対象としたくない(ただの注釈として使いたい、など)場合は、「◆」「◇」を先頭につけることで、グラフ上のアノテーションのみの用途として使うことができます。

会話文について

  • 会話文については、「発言者:」のように、発言者の名前のあとにコロン(:)をつけると、その文は会話文として認識されます。

サンプルのダウンロード

以下のURLからダウンロードできます。

◆ブログ解析フォーマット
https://drive.google.com/file/d/1Ta_2Yy8C_m7LXKYnOXAYSzf8uymofWkg/view?usp=sharing