BlognPlus 用「キーワード+概要生成モジュール」

ブログの記事の内容を解析し、その記事のキーワードをページに埋め込む事ができるモジュールです。
META KEYWORDS を埋め込むと、検索エンジン最適化(SEO)の効果があるといわれています。

また記事の概要(META DESCRIPTION)も埋め込む事ができます。

META KEYWORDS
ページの内容に関連のあるキーワード(カンマ区切りで羅列)
META DESCRIPTION
ページの説明文

記事の解析には Yahoo! Japan デベロッパーネットワークが提供する「キーフレーズ抽出」を利用します。

Webサービス by Yahoo! JAPAN

キーフレーズ抽出の例

例えば「キーフレーズ抽出」を使って夏目漱石の「吾輩は猫である」を解析してみます。

吾輩は猫である。名前はまだ無い。

どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くとそれは書生という人間中で一番獰悪な種族であったそうだ。この書生というのは時々我々を捕えて煮て食うという話である。しかしその当時は何という考もなかったから別段恐しいとも思わなかった。ただ彼の掌に載せられてスーと持ち上げられた時何だかフワフワした感じがあったばかりである。掌の上で少し落ちついて書生の顔を見たのがいわゆる人間というものの見始であろう。この時妙なものだと思った感じが今でも残っている。第一毛をもって装飾されべきはずの顔がつるつるしてまるで薬缶だ。その後猫にもだいぶ逢ったがこんな片輪には一度も出会わした事がない。のみならず顔の真中があまりに突起している。そうしてその穴の中から時々ぷうぷうと煙を吹く。どうも咽せぽくて実に弱った。これが人間の飲む煙草というものである事はようやくこの頃知った。

解析結果

順位キーフレーズ重要度
1書生100
2吾輩は猫である80
3見始58
4時々ぷうぷう53
5薬缶52
6片輪52
7出会わした事48
8人間45
944
10突起39
11別段39
12真中39
13種族37
14見当36
15時々我々34
16装飾34
17煙草32
18スー32
1926
20当時22

先頭のキーフレーズの重要度は100となり、以下相対的な重要度に応じて 100以下の値が割り当てられます。
キーフレーズは最大20個抽出されます。文章が短い場合はそれよりも少なくなります。

動作環境

ダウンロード

利用規約

  1. このモジュールの所有権は 「nJOY」管理人 CJ にあります。
  2. モジュールを使用して損害が生じても、「nJOY」管理人 CJ は一切の責任を負いかねます。
  3. モジュールの再配布・販売等は一切禁じます。
  4. 利用者個人の責任において改造は自由に行えます。
  5. スクリプト内にあるプログラム名・バージョン名・著作権表示を削除・変更する事は認めません。
  6. 当規約に同意された方のみ、このモジュールを無料で使う事が出来ます。
  7. もしよければ、あなたのブログに「nJOY BLOG」へのリンクをはってやってください。管理人が大変喜び、モジュール作成の励みになります。

キーワード生成モジュール」(metagen.zip, 13kb)


インストール方法(主な手順)

  1. ダウンロードした圧縮ファイル(metagen.zip)を解凍する。
  2. 「metagen」フォルダを BlognPlus ディレクトリ下の /module/ にアップロードする。
  3. 「config.php」のパーミッションを変更する(「666」等)。
  4. /data/ ディレクトリのパーミッションを変更する(「777」等)
  5. モジュール管理画面で「インストール」ボタンを押す。
  6. モジュールの設定を変更する。
  7. スキンファイルの <head>〜</head> 内にモジュール用タグを記述する。
  8. 必要に応じて「PC」「携帯」動作スイッチを「ON」にする。

モジュール構成ファイル

赤文字のファイルのパーミッションは「666」「606」等にする必要があります。
/data/ ディレクトリのパーミッションは「777」「707」等にする必要があります。

インストール

「metagen」フォルダを /module/ ディレクトリ下にアップロード後、未登録一覧に入っている「キーワード生成モジュール」の [インストール] ボタンを押してください。

動作設定

PC
PC 用スキンに独自タグを記述した場合、「PC」欄を「ON」にしてください。
携帯
携帯 用スキンに独自タグを記述した場合、「携帯」欄 を「ON」にしてください。

優先順位

特に制限はありません。

Yahoo! Japan デベロッパーネットワーク

アプリケーション ID

このモジュールは無料で利用できるウェブ API を使って、ブログの記事の内容を解析します。

モジュールの動作には無料で取得できる「アプリケーションID」が必要になるので、事前に取得してください。

アプリケーション ID の登録 (Yahoo! Japan デベロッパーネットワーク)

アプリケーション ID を取得するためには「Yahoo! Japan ID」が必要です。
もし Yahoo! Japan ID を持っていない場合は、先にそちらの ID を取得してください(無料)。

Yahoo! Japan ID の取得 (Yahoo! Japan)

キーフレーズ抽出の利用制限

Yahoo! Japan が提供するウェブ API は無料で利用できますが、そのアクセスには制限事項があるので気をつけてください。
しかしブログの記事を解析する上では問題にならないほどとても緩い制限です。

使用できるタグ

タグ説明
{METAKEYS}抽出されたキーワードを出力
{METADESC}概要を出力

スキンファイルへの記述方法

<head>〜</head> 内に以下の記述を加えてください。

  1. <meta name="keywords" content="{METAKEYS}" />
  2. <meta name="description" content="{METADESC}" />

概要を表示する(タグ拡張モジュールとの連携)

ブログに概要を表示したい場合は「タグ拡張モジュール」をインストールして {LOGLOOP} 〜 {/LOGLOOP} 内に {XT_LOG_METADESC} と記述してください。

管理画面

管理画面からモジュールの動作に関する設定を変更できます。

アプリケーション ID

Yahoo! Japan デベロッパーネットワークで取得した「アプリケーション ID」を入力してください。

キーワード

キーフレーズ抽出」を利用し、日本語文を解析し、特徴的な表現(キーフレーズ)を抽出します。

1つの記事に対し、重要度の高い順に最大20個のキーフレーズを得る事ができます。
ここの抽出方法の設定をいじる事で、ブログに埋め込むキーワードの個数を変更できます。

例えば、上位「10」件+重要度「1」以上に設定する事で、常に10個のキーワードが埋め込まれるようになります。

概要

記事の概要は以下の3通りの抽出方法から選択できます。

抽出方法について詳しくは次のセクションを参照。

概要の抽出方法

タイプA(手動)

本文の行頭に [[ ]] を書くと、その二重角括弧内の文章を概要として抽出します。

この例では投稿者が行頭の [[ ]] 内に書いた『夏目漱石の長編小説「吾輩は猫である」』が概要になります。

※ 投稿後は本文内から [[ 概要文 ]] は除去されるので、ブログ内にはその痕跡は残りません。
記事を再編集した場合は以前に投稿した概要が読み込まれるため、編集の都度毎回 [[ 概要文 ]] を書く必要はありません。
概要を変更したい場合は新たに [[ 概要文 ]] を投稿する事で、新しい概要で上書きされます。

※ データベース版 BlognPlus では新規投稿時に不具合(後述の「モジュールの仕様・他」参照)があるため、[[ 概要文 ]] は新規記事投稿時には書かないでください(新規投稿時に書かれた内容は概要として保存されません)。

タイプB(自動)

本文の1行目(行頭から最初の改行まで)が概要となります。

この例では本文1行目『吾輩は猫である。名前はまだ無い。』が概要になります。

タイプC(自動)

最重要キーワードを含んだ文が概要として扱われます。

吾輩は猫である。名前はまだ無い。

どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くとそれは書生という人間中で一番獰悪な種族であったそうだ。この書生というのは時々我々を捕えて煮て食うという話である。しかしその当時は何という考もなかったから別段恐しいとも思わなかった。ただ彼の掌に載せられてスーと持ち上げられた時何だかフワフワした感じがあったばかりである。掌の上で少し落ちついて書生の顔を見たのがいわゆる人間というものの見始であろう。この時妙なものだと思った感じが今でも残っている。第一毛をもって装飾されべきはずの顔がつるつるしてまるで薬缶だ。その後猫にもだいぶ逢ったがこんな片輪には一度も出会わした事がない。のみならず顔の真中があまりに突起している。そうしてその穴の中から時々ぷうぷうと煙を吹く。どうも咽せぽくて実に弱った。これが人間の飲む煙草というものである事はようやくこの頃知った。

最重要キーワードは『書生』(上述の「キーワード抽出の例」を参照)なので、文章中で該当キーワードが初めて出現する文『しかもあとで聞くとそれは書生という人間中で一番獰悪な種族であったそうだ。』が概要になります。

※ 機械的に概要を抽出しているため、必ずしも適切な概要になるとは限りません。

モジュールの仕様・他

仕様

データベース版の不具合

MySQL/PostgreSQL/TextSQL 版では新規投稿時に記事 ID を取得できないため、記事用のキーワードファイルが作成できない不具合があります。
新規記事投稿後、もう一度 [投稿] ボタンを押してください。

Text 版に限り、上記の不具合はなく、新規投稿でもキーワードファイルが作成され、[投稿] ボタンを再度押す必要はありません。

アップグレードの仕方

Ver1.00 → 1.10

「config.php」と「data」ディレクトリ以外のファイルを上書きアップロードしてください。
その後、モジュール管理画面で [アップデート]ボタンを押してください。
設定項目が増えているので、「キーワード+概要生成モジュール」の管理画面に入り、設定を見直してください。

アンインストール方法

  1. モジュール管理画面から「モジュールアンインストール」ボタンを押す。
  2. スキンの HTML ファイルに追加したモジュール独自タグを削除する。
  3. /metagen/ ディレクトリを削除する。

バージョンアップ情報

2009/10/10
ver1.10 概要の抽出&埋め込み機能追加({METADESC})
2009/10/08
ver1.01 キーワードの保存書式変更(末尾のカンマ除去)
2009/09/30
ver1.00 公開

サイト作成のヒント集に戻る