悪い研究:人気のセックス検索用語
オギオガス研究員とサイガダム研究員は最近本を出版し、 10億の邪悪な考え、Dogpile検索エンジンから収集した4億回の検索の分析の詳細。これらの4億回の検索のうち、13%(5500万回)はエロティックなコンテンツに対するものでした。
5500万回の検索はどのように失敗しましたか?調べてみましょう...しかし、これらの研究者の方法論を見て、調査結果が印刷された論文に値するかどうかを確認しましょう。 (あなたがそう思わないとしたら、あなたはおそらく正しいです。)
性的関心に関して、Dogpileの人々が検索するのは次のとおりです。以下の用語は、その興味に対する検索の一般的なカテゴリであり、用語のあらゆる種類の順列を含むことに注意してください。これらの順列(乳房の「乳房」など)は以下にリストされていません。想像力を使って。
- 若者– 13.5パーセント
- ゲイ– 4.7%
- MILFs(母親は私がF ***に欲しい)– 4.3%
- 乳房– 4.0%
- 浮気妻– 3.4%
- ヴァギナス– 2.8%
- ペニス– 2.4%
ガベージイン、ガベージアウト
コンピュータプログラミングには古い格言があります— GIGO:Garbage In、Garbage Out。それはあなたが分析することを選択したデータと同じくらい良いだけであるどんな科学的な試みにも等しくうまく適用されます。疑わしい一般化可能性または価値のデータセットから始める場合、現実とはほとんど関係のない結論を導き出すことがあります。
この場合、これらの研究者が集めた研究データには大きな問題があります。 GoogleやBingからのものではありません。これらは、「Dogpile」と呼ばれるあまり知られていない検索エンジンからのものですが、検索エンジンすらありません。 Dogpileとは、単にGoogle、Yahoo、Bingの検索結果を集約したエンジンです(Bingは現在Yahooに検索データを提供しているため、なぜこのような違いがあるのかはわかりません)。
これは、Google.comを介してGoogleで行われた検索、またはBing.comを介してBingで行われた検索とは異なります。これらの結果(現在の研究者のデータセットを形成した結果)を取得するには、実際にDogpile Webサイトにアクセスする必要があります。 Google.comで検索を行った場合、検索はこれらの研究者によって分析されていません(GoogleとBingが検索で収集したデータを研究者が簡単に利用できるようにしていないため、これは理にかなっています)。
Dogpileがほとんど使用されていないのは、スポンサード検索広告とオーガニック検索結果が混在しているため、視覚的な手掛かりがほとんどないためです。各検索結果の最後にある小さな印刷により、それが「スポンサー付き」の結果であるかどうかを知ることができます(例:広告)。 Dogpileで「うつ病」を検索したところ、最初の20件の検索結果のうち14件は広告でした。これは、ほとんどの一般の人が長い間我慢していたことではありません。
オンラインでコンテンツを探している人々は、広告と実際の結果を混ぜ合わせようとする検索エンジンの使用を断念することを長い間決めてきました。理由は単純です。人々は、提供されている製品やサービスに興味があるときに広告をクリックします。彼らは、だまされた広告であることがわかるだけのために、だまされて検索結果であると思ったものをクリックするのは好きではありません。
では、誰がDogpileを使用するのでしょうか。誰もが知っているが、確かに主流のインターネットユーザーである可能性は低い。 1億5,000万人以上がGoogleを使用し、9千万人がBing.comを使用していますが、Dogpileの月間わずか200万〜300万人は比較すると青ざめ、検索エンジン市場全体の0.05%をはるかに下回っています。
このような小さなデータセットについて調査を実施し、煙と鏡を使用して、1950年代と1960年代にキンジーインスティテュートが行ったのと同じ種類の画期的な研究を実際に行ったように見せることができますか?できます。
たとえば、Ogi OgasとSai Gaddamは、4億のインターネット検索を分析したと述べています。しかし、オンライン分析会社であるHitwiseによると、この数を毎日実行される30億回の検索と比較してください。突然4億人—真空状態では印象的な数のように見えますが—ある種のデータコンテキストに配置すると、それほど印象的に見えなくなります。 4億回の検索は、約3時間で行われるものに相当します。一日で。
もちろん、コンテキストは、データセットに関してはすべてです。特に、それらのデータセットが調査する必要のない方法でバイアスされている可能性がある場合は特にそうです。この例では、データセットは、他の母集団とは異なる母集団の特定のサブセットで使用されない可能性が高い、小さなニッチな検索エンジンであるDogpile検索エンジンの使用によって偏っています。
だから、このリストを一粒の塩と一緒に取りなさい。興味深いですが、一般の人々を反映しているとは思いません。そして、この欠陥のあるデータセットを掘り下げる本全体を購入する価値は確かにありません。