« 手塚プロ×リリー・フランキー=アトムくん | トップページ | 立命館大・応援団リーダー部、暴力行為で解散処分に »

2008/03/26

日本のブログの4割はスパム nifty/ニフティが調査

nifty/ニフティは、日本の全ブログ記事の約4割が、ほとんど意味のないスパムブログだとの調査結果を発表。アフィリエイト収入や特定サイトへの誘導を狙って、自動的に頻繁に更新されるのが特徴だという。

検索エンジン経由でアクセスすると「中身は、他のサイトの記事のパクリだけ」「言葉がランダムにつながっていて、文章の意味が通じない」といった経験をしたことはないだろうか。それがブログスパムだ。

ニフティスパムブログをその特徴から、他のサイトのコンテンツを自動的に取得する引用スパム、アフィリエイトリンクだけで内容がないアフィリエイトスパムなどの七つに分類(詳細は本文最後)。

その上で、それぞれの特徴を抽出して、特定のブログがスパムブログかどうかを自動的に判定するフィルタリング技術を開発した。

フィルタリング技術を使って昨年10月から今年2月にかけて、月ごとに日本のブログから約10万記事をサンプリングして調べたところ、平均して約40%がスパムブログであることがわかったという。

Photo_4ニフティは、特定のキーワードについて、ブログ上の評判を分析するサービスBuzzPulseを展開している。
今後は、BuzzPulseフィルタリング技術を搭載していく予定だという。

     ◇

ニフティによるスパムブログの分類は以下の通り。

引用スパム】他ブログやニュース記事、検索されやすいワードの検索結果などの引用を自動的に取得して、記事を生成している。

アフィリエイトスパム】商品写真とそのアフィリエイトリンクを大量に自動で掲載しているブログ。内容がほとんどない。

ワードサラダ】文章をフレーズ単位で機械的に組み合わせて生成しているブログ。一見、人間が書いているように見えて、良く見ると文章の意味が通じていない。

自動マルチポスト】同一記事を複数のブログに機械的に投稿する。

わいせつ記事】猥褻な文章や画像、動画などが掲載されている。

出会い系】出会い系サイトを運営しているブログや、その入り口。

ワンクリック詐欺】ワンクリック詐欺を運営しているブログや、ワンクリック詐欺に誘導する為の入り口となっているブログ。(アサヒ・コム)


|

« 手塚プロ×リリー・フランキー=アトムくん | トップページ | 立命館大・応援団リーダー部、暴力行為で解散処分に »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック


この記事へのトラックバック一覧です: 日本のブログの4割はスパム nifty/ニフティが調査:

« 手塚プロ×リリー・フランキー=アトムくん | トップページ | 立命館大・応援団リーダー部、暴力行為で解散処分に »