- Amazon.co.jp ・本 (322ページ)
- / ISBN・EAN: 9784062180610
作品紹介・あらすじ
2013年最大のキーワード「ビッグデータ」を初めて本格的に論じたベストセラー、待望の翻訳!!
我々の未来の生活、仕事、意識、すべてが「ビッグデータ」によって大きく変わる。
■なぜグーグルは複数の検索語と数式を組み合わせてインフルエンザの流行を予測できるのか■なぜアマゾンは社内の編集者や書評家をすべてお払い箱にして、データによる「お勧め本」システムを採用したのか■なぜ日本の研究者が集める「一人一人のお尻の形」のデータが「金の成る木」に変身するのか■なぜ「オレンジ色に塗られた中古車は故障が少ない」と判明したのか■なぜ電子書籍が発達すると「本」「読書」の概念が根本から変わってしまうのか?■なぜ今日の映画産業は、クランクインの前から「ヒット作」や「具体的な黒字・赤字」を予想できるのか?■なぜ「これからもっともセクシーで金を稼げる職業」は「データ・サイエンティスト」なのか
伊藤穰一(MITメディアラボ所長)
「押し寄せる情報の波によって、世の中の捉え方自体が根本から変わろうとしている。この事実をあぶり出すうえで新境地を切り開いたのが、本書『ビッグデータの正体』だ。企業はいかに新たな価値を生み出すことができるのか、人々は物事の認知のあり方をどのように変える必要があるのか――本書は大胆な主張と見事な語り口でその答えをはっきりと示している」
ローレンス・レッシグ(ハーバード大学ロースクール教授、『Free Culture』著者)
「物の見方を大きく変えてしまう本が10年に数冊は登場するが、まさに本書がそれだ。社会はビッグデータがもたらす変化に目を向け始めている。本書はその重要な出発点となる」
感想・レビュー・書評
-
本書は、ビッグデータを取り扱うための技術書ではありません。
ビッグデータとは何か。ビッグデータの本質と、それがもたらす功罪を説いた書です。
・インフルエンザの流行を予測したのは、政府の衛生当局者ではなくグーグルの検索結果であった。
・多量のデータがあれば、斬新な方法で情報を活用し、新たな知見や価値ある製品・サービスを生み出すことができる。
・データはビジネスの素材に生まれ変わり、重要な経済資源として、新たな経済価値の創出に活用されることになった。
・小規模ではなしえないことを大きな規模で実行し、新たな知の抽出や価値の創出によって、市場、組織、さらに市民と政府の関係などを変えること。これがビッグデータである。
・ビッグデータがもたらす3つの大変化
①ビッグデータは限りなくすべてのデータを扱う (標本抽出ではなく、全データを扱うという意)
②量さえあれば精度は重要ではない
③因果関係、すなわち「原因と結果」を求める古い体質からの脱却。(理由はわからないが、ある事象がみられるという「事実」が得られる)
・全体ではなく標本を相手にするということは、常に何らかの犠牲を伴う。ならば、すべてのデータをめざそう。
・あるコミュニティ内で多くの接点をもつ人がいなくなると、残った人々の交流は低下するものの、交流自体がとまることはない。一方あるコミュニティの外部に接点を持つ人がいなくなると、残った人々はまるでコミュニティが崩壊してしまったかのように、突如として求心力を失う。すべてのデータを扱って得られた結果。
・量は質さえも凌駕する。
・データという言葉はラテン語の「与えられるもの」が語源で、「与えられた事実」を意味する。
・画像などをコンピュータで処理できるようにすることをデジタル化といい、その中で言葉を文字として処理できるようにすることをデータ化という。データ化すれば人間が読めるだけでなく、コンピュータによる分析も可能となる。
・データの価値を考えるときに、単に現在の用途だけに着目するのではなく、将来的に利用可能な用途をすべて吟味する必要がある。
・メディチ家の繁栄は、複式簿記の活用と無縁ではない。
・位置情報を利用することで、利用客の店舗内での動線を把握できる。
・ビッグデータによって我々の生活は細かく監視されるため法的なプライバシー保護手段では時代遅れになりかねない。
・コンピューターのプロセッサの高速化、メモリーの大量化、ソフトウエアやアルゴリズムの高度化があるが、そうしたおぜん立ては、ビッグデータ活用の理由の1つに過ぎない。根本的な理由は「膨大なデータを持てるようになったこと」である。
・データの価値の大半は2次利用から生まれる。
結論は、
ビッグデータは、常に不完全であり、究極の答えを出す道具ではない。ただ、現時点では十分と言えるレベルだ。今後もっと優れた手法が登場し、ずっと精度の高い答えが得られる可能性もある。
それでもビッグデータというツールを使うときに常に忘れてはならないことがある。それは十分に謙虚な姿勢と人間性である。
目次は以下です。
第1章 世界を変えるビッグデータ
第2章 第1の変化「すべてにデータを扱う」
第3章 第2の変化「精度は重要ではない」
第4章 第3の変化「因果から相関の世界へ」
第5章 データフィケーション
第6章 ただのデータに新たな価値が宿る
第7章 データを上手に利用する企業
第8章 リスク ビッグでーたのマイナス面
第9章 情報洪水時代のルール
第10章 ビッグデータの未来詳細をみるコメント0件をすべて表示 -
2013年の作品。一見、無駄と思えるようなデータを大量に収集できるようになると、データをもとにした相関関係から、次に起きることが予測できるようになる。それは、因果関係で判断されてきた事項が変わることを意味する。因果関係としては不明だが相関関係としては正しいということが発生するからである。
ビッグデータというのは、相関関係で物事を予測できるようになることであるという主張が非常にわかりやすく、その本質を捉えているように思う。このあと、AIの進化で、さらにその威力、予測力が増してくるわけである。
AI+Big Dataというのは、インターネットの登場に匹敵する革命であると思う。そんな革命が短い期間のうちに次々と起こる現代。10年後の世界はもう、今とは全く異なるものになっていても別におかしくはない。 -
最近流行りのビッグデータについて。
中心的な話題は、ビッグデータは(数学的に)どのような手法で宝を見つけるかということよりも、どのようにビッグデータを使うかということ。
ビッグデータの具体的な例を交えて説明している。
本書を読んだ結果、ビッグデータという分野をあまり好きになれない。
理由は2つ。
1つは、どんなデータでも、ある程度数学の素養があれば、あるデータ間の相関関係は見つけることができるだろう。いわんや、ビッグデータと呼ばれる、巨大なデータの集合ならば・・・
が、これらの相関を見つけるのがビッグデータの本質なのだろう。
つまり、どんなデータでも都合よくデータを解析すれば、ある程度のアウトプットは見つけられるのです。
従って、そのアウトプットが正しいことを検証する必要があると思います。
そこで、2つめ。
ビッグデータで評価された結果(相関)については、因果関係を問わないという風潮なのだとか。
これは科学ではない。なぜならば、科学とは反証可能性を有する必要があるからである。
しかしながら、ビッグデータのアウトプットは、複雑すぎてどのような計算結果から因果関係が出てきたのか調べることができない(著しく困難)。さらに、できたとしてもこじつけでしかない。
例えば、アメリカではハリケーンが近づと、あるお菓子(ストロベリー味!)の売り上げが伸びるそうだ。
なるほど。ビジネスをする限りでは因果関係なんて必要ない。
全てはデータが語ってくれるのだから。
しかし、エンジニアとして考えを述べると理由が必要なのです。
全ての物事には因果関係があるのです(あるはずなのです)。
なぜ、特定のお菓子の、特定の味の売上が伸びるのだろうか。。。
この「なぜ」を突き詰めるのが面白いのですが、結果が使えれば全てよし。という姿勢。
話がそれたが、ストロベリー味のお菓子の売り上げが伸びるのはハリケーンが来るからなのか、そこに別の隠れたパラメータがあって、それがハリケーンと関係があり、結果として、お菓子が売れるという可能性もある。
が、反証できないし検証もできない。
再度いうが、ビジネスという純粋に利潤を追い求めるのであれば、それはそれで価値があると思うが、科学として興味の対象とはなりえないと思います。 -
2章から4章の章題が端的に言い表されていますね。
壮大な帰納法、大掛かりなデータ・フィッティング。
例えば、e^xという真理に基づく現象であると人類が気が付かなくても、a+bx+cx^2+dx^3+・・・と知っている関数で「近似式」ができればそれでいいじゃないか、という割り切り。
実際には多項式だけでなく、例えばシグモイド関数?とか、〇〇関数、とかの変な関数もたくさん入れて、線形連結しても、データがビッグだから各項の係数は求められる、
いや普通データの方が多くなるはずなので最小二乗近似の考えで「input→outputを予測する まともそうなモデル」ができるじゃないか、という考え方。
要点は「モデルを記述するパラメータが3つ以上になると、人間の頭や手計算では 主因の3つのパラメータがどれか見出すことや、
そこそこ当たる予測モデルを作るには どれだけ時間かけても判らん、となる現象であっても、
計算機の力でフィッティングモデルが生成できて、それを用いて改善策とか未来を予測できる」という所かと思います。
便利な道具があるのなら、これからどんどん それを使うべき。
しかしエンジニアにとって悩ましいのは、以下の2点です。
1)ブラックボックスのままで使えるなんて認めたら、人類は馬鹿のまま進化しないのでは?と思えてしまう。 本書p112あたりの話に関係します。
2)本書第3章「精度は重要ではない」は上記の「まともそうなモデルができさえすれば、それで使い物になる」という点で認めます。
しかし、ゴミデータを含むことを許容した際に、他のデータと著しく異なる「外れ値」を「バグ」とか「ゴミ」だと思い込むのは危ない気がします。
その外れ値は、実は ある鋭敏かつ決定的な前提条件に依存している現象で、その発見が、「イノベーションの芽」が、見過ごされないか?が心配。
p65~p66には「スペルミスや文法間違いがあっても間違いがどれくらいの確率で起こるか分かることが重要。
その間違いも「あなたの言いたいことは〇〇では?」と自動修正コメント出せるので」とありますが、
「間違い発見」の意味でのゴミの重要性ではなく、そのスペルミスや間違いが「新たな若者言葉発生」予測とか「言語の進化(変質)」予測になりえる、という様な捉え方です。
1)2)を通じ、人間の役割は未だ残っていて、
「ブラックボックスに甘んじず、その現象を言い表す真のモデルを考える努力をすること」と、
「突飛な外れ値(異端児)を捨てずに、どうして突飛になったのか放っとかないこと」ではないかと思います。
本書p288では「予測不能な物事、が人間に残されたこと」とありますが、それはビッグデータが未だ集まらない時点だけ人間が必要、という意味なら寂しい話です。
あとは
3)意図的なことがない自然科学、サイエンスの世界でも、この考え方は有用ですが、
意図的なことが混じったり、因果関係が余計判らない人文科学、特に(社会)心理学や行動経済学方面に絶大な効果を示す気がします。p141当たりに関連します。
ここが今後の莫大な利益の源泉になりそうなので、躍起になっている人たちがいるんですね。
人類の常識が通じずコミュニケーションがとれない「宇宙人」の行動予測をするのに効果的、いや嫁さんの次の発言や行動を予測するのに有用な気がします。 -
データの活用が、社会やビジネスを劇的に変えていっている様子が、簡潔に分かりやすく描写されている。ビッグデータは、バズワードではなく、本当に世の中を変えるムーブメントなのかもしれない。ただし、今の世の中に存在もしないものを生み出す人間の独創性は依然として必要とも述べられており、個人的には、ビッグデータと独創性を生み出すデザイン思考の組み合わせが、これからのビジネスや社会の発展のエンジンになっていくのではないかと感じた。
-
買う価値あり
-
ビッグデータの特徴として「因果から相関の関係へ」、つまり、答えが分かれば理由は要らないという点を本書は掲げている。これは大事な視点。しかし、この2つの関係は対立軸ではない。相関関係がわかることで因果関係の解明につながる。そいの意味で統計学だけが重要ではない。デザイン思考が求められる。また、知恵や価値創造といった部分がより重要な要素を持つ世界になるだろう。非常に落ち着いた視点でビッグデータを分析した良書。ぜひご一読を。
-
☆は3つ
この手のビジネス書は途中で眠くなって放り出してしまうので久しく読まなかったのだけれど、あることがきっかけで何年か振りに読んでしもうた。
いつもほとんど本の内容やそれにまつわる感想を書くことは無いのだけれど今回は何も印象に残らなかったので感想を書く?
人間は、なぜ?何?どうした?という「因果関係」を知りたがるのだそうだ。でもビッグデータがもたらすものは「相関関係」だけであってそこにあるかも知れない「因果関係」という事には端から注目しないらしい。換言すると、原因なんてどうでもよくて結果さえ予測出来ればそれで良し、ということになるのだ!
ビッグデータと呼ばれるものの正体は、盗聴や盗撮はそこら中で行われているので、みなさま重々気をつけないといけんのだよ・・・というようなことではなくて、電話やNETを遣ったり、とにかく電気/電子機器を使った情報発信をすると、それらは全部記録されていて、悪い奴らがしたなめずりしながらこのビッグデータをどうやって使ってみんなを騙して金儲けしようか、と企んでいるから気をつけないといかんよ、ということなのらしい。
ありゃ結局金儲けの話と、あんた気をつけにゃいかんよ、ということが結論の本やったのか。存外つまらんかったのう。
しかし、巻末の参考文献のページが27ペシもあるのには参った。そんでそれが英語で書いてある!ときたもんだぁ~。もちろん全部無視したけどさw。 すまんこってす。すごすこ。-
おけえさん、こばんわぁ。今日はとても暑くてあつくてびぃ-るが旨くて幸せだよね。
>流石の境地、ってなんかどっかの名所旧跡みたいな名前だねぇ。...おけえさん、こばんわぁ。今日はとても暑くてあつくてびぃ-るが旨くて幸せだよね。
>流石の境地、ってなんかどっかの名所旧跡みたいな名前だねぇ。行くと、でかいお地蔵さんとかが居そうだし。すまぬ。2013/06/13 -
何度見ても『ビッグダディの正体』に見えてしまう。
・・・ま、はやりモンとゆうことで。
よく知らないのですケド。何度見ても『ビッグダディの正体』に見えてしまう。
・・・ま、はやりモンとゆうことで。
よく知らないのですケド。2013/06/14
-