Shaw's Home Page(本館)

はてなダイアリーから引っ越しました。

続・SmartNewsからのアクセス流入

先週、スマートニュースからの突発的なアクセスがあったをことを書いた。
shaw.hatenablog.com

本日また同じ現象が起きたので、もうちょっと踏み込んで調べてみた。予想通り、スマートニュースのはてなチャンネルで掲載されていた模様。気づいたタイミングでアプリを立ち上げてみるとこんなふうになっていた。

f:id:shaw:20160318220027p:plain
なかなかインパクトありますね。

ちょいと検索をかけてみると、はてなブログ開発ブログでもこのように書かれてた。
staff.hatenablog.com
staff.hatenablog.com

はてなブログを使ってるいろんな人がスマートニュースからのアクセス流入について書いていたので、格段珍しい事でもないらしい。やっててよかったはてなブログ、ということなんでしょうかね。

さて、ここで気になってくるのが、スマートニュースで記事がピックアップされる基準はどうなっているのか、という点。上述のはてな開発ブログではこのように書かれている。

開設時点の「はてな」チャンネルでは、はてなブログの新着から選出された人気の記事を読むことができます。

はて…?「はてなブログの新着」はわかる。「から選出された人気の記事」がわからない。というのもですよ、スマートニュースに掲載された私のブログ記事は、前回も今回も全然人気の記事ではなかったから。だってさ、スマートニュースに掲載された時点でせいぜい該当ページのPVが10~30程度しかなかったことがわかっているし、はてブも1とか2しかついていなかったわけです。普通こんな埋もれている記事のことを人気記事とは言わないよね。

ここからは仕事でかじった知識も交えながら、もうちょっと推測してみよう。

スマートニュースってアプリ立ち上げ当初は、スマートニュース側が各ニュースメディアのWEBサイトを独自にクロールして、自前のアルゴリズムを元に記事をピックアップしてました。ただそれだと、WEB媒体側が記事を修正したり落としたりといった時のコントロールができずいろいろ不便です。そこで、スマートニュースはSmartFormatというRSSの拡張仕様を策定し、WEB媒体側はそのRSSフィード情報をスマートニュースに提供することで提供記事の状態を管理できるようになりました。

というわけで、おそらくはてなブログも新着情報をSmartFormatという形でスマートニュースに渡しているはずなのですね。ただ、全ての新着記事を提供しても玉石混交すぎるので、最低限のフィルタをかけているのではないだろうか。これは完全に私の想像なのだけど、「記事の公開日が○日以内で、かつはてブが1件以上ついている」ようなはてなブログ記事だけをSmartFormatにわたしているんじゃないかなぁ。このフィルタリングが上記「はてなブログの新着から選出された人気の記事」という表現になっているのでないかと。

ところでこのSmartFormatという仕様、基本はRSSなので、ブログ記事の情報(見出しや本文、公開日など)が一通り網羅されているのだけど、プライオリティのようなものがありませぬ。なので、WEB媒体側がイチオシしたい記事があったとしても、それをスマートニュースに伝えることができません。つまり、WEB媒体側が選出した記事はフラットな状態でスマートニュースにフィードされ、それをどう優先度をつけてアプリに掲載するかはスマートニュース次第になるんですね。

上記を踏まえると、スマートニュースアプリのはてなチャンネルに掲載される記事は、はてなブログでゆるくフィルタリングされた新着記事がスマートニュース側のアルゴリズムでさらに取捨選択され、優先度が付けられた結果だと思われるのだけど…。

そうなると、ほとんど人の目に止まることなく埋もれそうだった私のブログ記事は、ぎりぎりはてな側のSmartFormatにひっかかって、さらにスマートニュースの謎アルゴリズムに拾われたことになるけど、その基準がさっぱりわからないのですよ…w はてブ件数は限りなく0に近いうえ、SNSで拡散されていたわけでもないし。となると、本文が何かしらの基準でスコア化されて評価されたのだろうか?うーむ、わからん。

こちらとしては、自分がおもしろいと思った本を紹介した文章が、思いのほか多くの人にリーチできたのは嬉しいことなんだけど、そこに至る経緯がよくわからないのでなんかこうもやもやが…。