ビッグデータ:健康アプリを通じて人口の傾向(幸福のように)を予測できますか?

5年以上前、私はWeb 2.0の世界における信頼性と有効性というタイトルの作品を書きました。偏見のあるサンプルからデータを収集することの懸念について話しました。どのような方法で正確に、これらのサンプルが偏っているのかを最初に理解することなく。

現在、アプリの普及により、人々のスマートフォン用のダウンロード可能なプログラムが、同じ問題が発生しているのを目にしています。開発者や起業家は、信頼性の高い優れた科学的データ収集の基本を理解せずに、これらのアプリからのデータを追求しています。そして、なぜそれが重要なのか—特に、この「ビッグデータ」のすべてを分析したいと思うとき(たとえば、疫学では、科学者は単に「データ」と呼んでいます)。

これらのアプリによって個人の健康データを偏りなく収集し、どういうわけかより大きなものの測定に変換できますか?

短い答え:いいえ、簡単ではありません。

確かに、「定量化された自己」運動の一部である人々-彼らの個人的な健康(そしておそらくメンタルヘルス)のあらゆる側面を追跡して測定したい人々がいます。しかし、それらの人々は現在1外れ値であり、決して一般的な人口を表すものではありません。

そのような少数派は、健康または幸福の傾向を分析するために、より大きなデータセットを収集するための努力の大部分をすぐに占める可能性があります。結果として得られる分析からこのグループの人々について何かを知ることができますが、それを残りの人口(人口統計学的および行動学的に非常に異なって見えたり行動したりする)に一般化することを提案することは不適切です。

ほとんどのヘルスアプリはユーザーによってダウンロードされ、1回または2回使用された後、放棄されるため、これはすぐには変わりません。ほとんどの人が健康アプリの使用をやめる理由があります。特に、データの日記として機能するアプリです。彼らは退屈だ!自分でデータを収集することは、ほとんどの場合、毎日(または毎週)積極的に行うことを約束するのは非常に退屈な作業です。

複雑な答え:アプリはよりスマートで接続されている必要がある

データを収集するための健康アプリは、ユーザーによるアクティブな入力を必要とするため、最終的に失敗します。これが、個人の健康記録がほとんど意味のある方法で離陸したことがない理由です。2人々は自分の生活を送るのに忙しくて、アプリ3に毎日の測定基準が何であるかを伝えることに煩わされません。

健康アプリが最終的に成功するのは、個人の健康追跡ソフトウェアでの他のほとんどの試みが失敗した場合、アプリが受動的にデータを収集することです。つまり、ユーザーからの入力は必要ありません。

もちろん、意味のあるデータを提供するこのような指標からはかけ離れています。もちろん、実行量を追跡する実行中のデバイスがあります(もちろんNikeから)。ただし、実行中のアプリは、ダイエットアプリ、栄養アプリ、またはエクササイズアプリと通信しないと役に立ちません。または私のマインドフルネスアプリ。それは私である複雑な存在の中で単一のメトリックを測定する1つのアプリです。続行するだけで十分ではありません。

信頼は重要な礎石

健康データのすべてを共有するこのようなネットワーク化されたアプリの採用には、技術的ではない別の障害もあります。それは信頼です。 FacebookやNikeのような企業は、最終的には1組の人々、つまり株主のみに答えます。つまり、彼らが利益を生むことができるものについてデータを分析することが彼らの最善の利益であるなら、彼らはそうするでしょう。

スタートアップは株主の代わりに、ベンチャーキャピタリスト、つまり投資に対して最高かつ最速のリターンを求めているだけの貸し手にしか答えないので、スタートアップは良くありません。

私のプライバシーを保護することにほとんど関心がない企業に対して、私の健康情報(将来の保険の拒否または保険率の設定のために使用される可能性のあるデータ)を信頼したいのはなぜですか?

これにより、最初のポイント、つまり偏ったサンプルに戻ることができます。すべての健康情報を営利企業に喜んで提供して分析し、照合し、最終的にはあなたに関連付けます(そのようなデータが最初に匿名化されていても)のは、ほとんどの人とは異なります。私たちのほとんどはまだ自分の健康情報を自分自身に保持することを気にしています。

ここから先

健康アプリから人口ベースのデータを収集しようとする(たとえば、疫学調査を行う)には、私が特定したいくつかの問題と機会があります。

  • 健康アプリを積極的かつ継続的に使用している人々のごく少数のため、偏ったサンプリング
  • サンプリングと継続的な使用は、 受動的活発な データ収集
  • データの収集と保存に信頼できる機関を使用することで、サンプリングと使用をさらに改善できます(営利企業やスタートアップではありません)。
  • お互いを認識し、私に関する関連する健康データを交換するアプリは、サイロ化された、認識されていない(愚かな?)アプリの現在の富ではなく、次世代です。

開発者が健康上の問題を見て、そのためのアプリを開発し、世界中にリリースするのは素晴らしいことだと思います。しかし、多くの場合、これらのアプリはどこにも行かず、聴衆もいません。または、関心の欠如のために元の開発者によって孤立しています。強い聴衆を獲得するいくつかの人気の健康アプリは例外であり、ルールではありません。そして、彼らが広く受け入れられても、わが国の電子医療記録システムのように、彼らは互いに話しません。

アプリから収集されたデータについて信頼できる、または意味のある何かを言いたい場合は、データが母集団の代表的なサンプルからのものであることを示す必要があります。それがなければ、あなたのデータは私たちのほとんどのように見えない、人口の1つの小さなグループについてのみ私たちに伝えます。

脚注:

  1. そして、予見可能な未来のためにあります[↩]
  2. そして、なぜGoogleはついに明日、自身の個人の健康記録をシャットダウンするのか。 [↩]
  3. またはさらに悪いことに-より一般的には- アプリ全体 他の人を認識しておらず、互いにデータを交換できない[↩]

!-- GDPR -->