TOKYO COLLEGE Booklet Series 6
25/50

23 4. デデーータタガガババナナンンスス上上のの課課題題 現状としてはデータ活用がこうして進んでいるのですが、データガバナンスにおいてはプライバシーの保護以外に三つの問題があると考えます。 1つ目に、先ほど紹介したような行動データやテキストデータを集めると、感染症予防といった社会的に公共性が高い目的であれば皆さん合意していただけると思うのですが、株価予測に使ったり、一部の産業だけに得するような目的外使用をされてしまうという問題点があります。目的外使用ではないとしても、大量のデータを集めること自体で何かしらの有利なものが生じた場合に、公平性の問題が出てくると思います。 2つ目は研究上の問題点なのですが、シミュレーションをして予測のアナウンスを世間にした場合、それ自身がインプットになって人々の行動変容を引き起こしてしまうかもしれません。そうすると、発表したがために結果自体が外れてしまうことがあり得ると思うので、非常に難しいのです。特に社会や集団を相手にした場合の分析・研究に関しては、アナウンスメント効果を考えつつ、自分の立場や結果を発表したことによる影響も考えて制度設計をしていくことが必要になると思います。 3つ目は結構見落とされがちなのですが、数値データと違ってテキストデータはプライバシー保護が非常に難しいのです。固有名詞をマスキングするだけでは駄目で、例えば何月何日にどこで会ったかというだけで個人が特定される可能性もあります。テキストの意味によって分かるような匿名性というのは研究としても非常にチャレンジングで、難しいところだと思います。テキストデータは非常に多くの情報を含んでいますが、プライバシー保護は今後問題になると思います。

元のページ  ../index.html#25

このブックを見る