ステマとアフィリエイトの境界

ついでなので,今さらながらステマについても少し書いてみる.

食べログステマ問題で世間が盛り上がっていた頃,ステマ(のレビュー)を自動判別できるかという話題を見かけた.その少し前に

という論文を眺めていて,opinion spam の判別を人間よりうまくできたと見た記憶があったので,さほど難しくないだろうなという印象を持った.
個人的には,ham の再現率を100%にしなければならない E-Mail の spam 判別と違い,opinion spam 判別は(ユーザの立場からは)ham の再現率を100%にする必要が必ずしもない場合が多いので,分類問題として厳密に解くほどの価値はないと考えている.ステマのレビューで実際に無いメニューや食材に関する虚偽の産地情報など虚偽の事実が書かれているなら問題だと思うが,極端な賛美や非難が意見として並べてあるだけなら,書かれている事実にだけ目を向けて読み流せば実害は無い.CGM 全盛の昨今,レビューなど世の中に溢れているので,ステマでないレビューが多少落ちても,別に困らない.読むレビューの数が減って助かるぐらい.濁った意見など,すべて捨ててしまえば良い.そう考えると,例えばアフィリエイトリンクを含むブログ記事(宣伝)を正例 (spam) にして(アフィリエイトリンクはもちろん除いて)分類器を学習し,spam の再現率が100%になるよう閾値を調整するぐらいで良いのではなかろうか(正例をオーバーサンプルする,でも良い).
意見の信頼性という意味では,営利目的でなく純粋に意見を書いているような顔をして,しっかりアフィリエイトのリンクを張っているサイトが巷に大量に溢れていることの方がよほど問題.

読むに値するまともな意見など,ステマ以前にそもそもどれだけあるだろうか.

アフィリエイトリンクを強調表示してウェブを閲覧するようになってから,そんなふうに考えるようになった.
自分がクリックするリンクの URL を意識しない世の中の大半の人にとっては,アフィリエイトステマも(それと意識せずに広告(宣伝記事)を見せられているという点では)同じ*1アフィリエイトステマは確かにある一線において決定的に違うが,大多数の閲覧者の立場からするとその違いにはほとんど意味がない.いずれにせよ,要点を得ずだらだらだと書かれた宣伝記事を読むほど自分は暇ではない.
アフィリエイトプログラムで最近気になったのは,海外サプリの通販で有名な iHerb.com報酬プログラム.これは iHerb.com での初回購入時にユーザに提供される報酬コードを使って第三者が iHerb から購入すると,その第三者の(その後一年間の購入に関して)購入額の4%が報酬コードが配ったユーザに配当されるというもの(紹介された第三者の報酬コード経由でも四世代まで辿って収益が得られる).iHerb, クーポンとかで検索してみるとわかるが,多くの人は自身の報酬コードを,さも一般的な割引クーポンであるかのように引用している.中にはサイトでの買い方の説明を丁寧にした上で,その中に自分の報酬コードを自然に忍ばせる記事なども少なからず見かける.果たして,これはステマなのか,そうでないのか.
企業が広告を広めるのに個人を積極的に利用するようになってから,ウェブは変わった.
[追記] 長くなったので別項目にしてみた.

*1:前者が非難されず,後者が非難される理由はもちろん分かるけれど.