26703715 مشاوره آموزشی رایگان

26703715 مشاوره آموزشی رایگان

دادۀ بزرگ، دادۀ بهتری است

Kenneth Cukier

Big data is better data

Self-driving cars were just the start. What's the future of big data-driven technology and design? In a thrilling science talk, Kenneth Cukier looks at what's next for machine learning -- and human knowledge.


تگ های مرتبط :

Data, Future, Technology
شیرینی پایِ مورد علاقۀ آمریکایی ها چیه؟ حضار: سیبه. کنث کوکی اِر: البته که سیبه! از کجا می دونیم؟ به خاطر داده ها. از مشاهدۀ فروش فروشگاه ها. از مشاهدۀ فروش پای های ۳۰ سانتی متریِ منجمد در فروشگاه ها و بدون هیچ مسابقه ای، سیب برنده س. اکثریت فروش متعلق به سیبه. فروشگاه ها شروع کردن به فروش پای کوچک تر، پای ۱۱ سانتی متری، و ناگهان سیب به مکان چهارم یا پنجم تنزل کرد. چرا؟ چه اتفاقی افتاد؟ بهش فکر کنید. وقتی شما پای ۳۰ سانتی متری می خرید،
همه ی خانواده باید موافق باشند، و سیب، انتخابِ دوم همه ست. (خنده ی حضار) اما وقتی پای یک نفره ی ۱۱ سانتی متری می خرید، می تونید اونی رو که دوست دارید بخرید. می تونید انتخاب اول تون رو بخرید. داده های بیشتری دارید. می تونید چیزی رو ببینید که وقتی مقدار کم تری از اون رو داشتید نمی دیدید. نکته اینجاست که داده های بیشتر فقط دیدِ وسیع تر نمی دن، داده های بیشترِ آنچه بهش نگاه می کردیم؛ داده های بیشتر به ما اجازه می دهند تازه ها رو ببینیم.
اجازه می دهند بهتر ببینیم. اجازه می دهند متفاوت ببینیم. در این مورد به ما اجازه می دهند پای مورد علاقه ی آمریکایی ها رو ببینیم: که سیب نیست! احتمالاً همۀ شما واژۀ دادۀ بزرگ رو شنیدید. در واقع حالتون از شنیدن این واژه به هم می خوره. واقعیته که اعتیاد زیادی به این واژه وجود داره، و این خیلی ناراحت کننده ست، چون دادۀ بزرگ، ابزار بسیار مهمیه برای پیشرفت جامعه. در گذشته، ما به داده های کوچک نگاه می کردیم و فکر می کردیم چطور می شه
دنیا رو درک کرد، و حالا ما کلی از اون داریم، خیلی بیشتر از آنچه در گذشته داشتیم. چیزی که متوجه می شیم اینه که وقتی مقدار زیادی داده داریم، اساساً قادر به انجام کارهایی هستیم که با داشتن داده های کم نمی تونستیم. دادۀ بزرگ مهمه، و دادۀ بزرگ جدیده، و وقتی بهش فکر می کنید، تنها راهِ رویارویی این سیاره با چالش های جهانیش، تغذیۀ مردم، تامین بهداشت شون، تامین انرژی، الکتریسیته، اطمینان از جزغاله نشدن شون به خاطر گرم شدن کرۀ زمین؛
به دلیل استفادۀ موثر از داده هاست. خُب نکتۀ جدید در مورد دادۀ بزرگ چیه؟ نکتۀ قابل توجه؟ خُب... برای پاسخ به این سوال به این فکر کنید که اطلاعات چه شکلی بوده، در گذشته و به صورت فیزیکی. در سال ۱۹۰۸، بر روی جزیرۀ کِرِت، باستان شناسان لوحی رُسی کشف کردند. عمر آن را ۲۰۰۰ سال قبل از میلاد تخمین زدند، یعنی ۴۰۰۰ سال. نوشته هایی روی این لوح هست، اما اِشرافی به معانیش نداریم. کاملاً یک رازه. اما نکته اینه که اطلاعات به این شکل بودند ۴۰۰۰ سال پیش. جامعه اطلاعات رو به این شکل
نگهداری و منتقل می کرد. امروز، جامعه آنقدرها پیشرفت نکرده. ما هنوز اطلاعات رو در لوح ها ذخیره می کنیم. اما امروز ما می تونیم بیشتر اطلاعات ذخیره کنیم، بیشتر از گذشته. جستجوش راحت تر شده، و کپی کردنش... پردازش و به اشتراک گذاشتنش. ما می تونیم دوباره از این اطلاعات استفاده کنیم برای مصارفی که وقتی مشغول جمع آوری داده ها بودیم حتا تصورش رو هم نمی کردیم. به همین منوال، داده تغییر کرد از سکون به جریان، از چیزی راکد و بی حرکت، به چیزی سیال و متحرک.
اگر بخواهید، متوجه سیالیت اطلاعات می شید. لوح مکشوفه از کِرِت چهار هزار ساله ست، و سنگین، ظرفیت زیادی نداره، و این اطلاعات متغییر نیست. از سوی دیگر، کل فایل هایی که اِدوارد اِسنودِن از آژانس امنیت ملی آمریکا به سرقت برد روی یک حافظۀ فلش به اندازۀ ناخن بود. و به سرعت نور تکثیر می شه. داده های بیشتر... بیشتر. یکی از دلایل وجود خیل اطلاعات امروز جمع آوری چیزهایی ست که ما همیشه اطلاعات را روی آنها جمع می کردیم؛
دلیل دیگر این که ما چیزهایی جمع آوری می کنیم که همیشه جنبۀ اطلاعاتی داشته اند اما هرگز به قالب داده تبدیل نشده اند و ما آنها را به داده تبدیل می کنیم. برای مثال به موقعیت چغرافیایی فکر کنید. مثلاً مارتین لوثِر. اگر بخواهیم بدونیم سال ۱۵۰۰ مارتین لوثر کجا بوده، باید همیشه دنبالش می کردیم، شاید با یک قلم پر و یک دوات، تا ثبتش کنیم. اما فکر کنید امروز چگونه است. می دونید در جایی، احتمالاً در پایگاه دادۀ یک شرکت مخابراتی،
صفحه گسترده یا حداقل پایگاه داده ای وجود دارد که اطلاعات را ذخیره می کند همۀ مکان هایی که آنجا بوده اید. اگر تلفن همراه داشته باشید، و تلفن شما جی.پی.اس داشته باشد، یا حتا نداشته باشد، اطلاعات شما را ذخیره می کند. به این ترتیب، موقعیت جغرافیایی به داده بدل می شه. حالا برای مثال به موردِ حالت بدن فکر کنید. جوری که الان نشسته اید. جوری که شما نشستید، جوری که شما نشستید، جوری که شما نشستید، کاملاً متفاوته، و مربوط به طول پاهاتون و پشت، و خطوط پشت، و اگه الان حسگر وصل بود، شاید ۱۰۰ تا
به صندلی هاتون، می تونستم نموداری مختص شما ایجاد کنم. چیزی شبیه اثر انگشت! ولی اثر انگشت شما نیست. خُب این کار چه فایده ای برامون داره؟ محققان در توکیو، از اون به عنوان یک دستگاه ضد سرقت خودرو استفاده می کنند. به این شکل که دزد پشت فرمون می شینه، سعی می کنه خودرو رو بدزده، و خودرو تشخیص می ده که راننده، ذیصلاح نیست. و ممکنه موتور خاموش شه، تا شما کلمۀ عبور رو جایی روی داشبورد وارد کنید و بگین: "هی! من مجوز رانندگی دارم". عالیه! چی می شه اگر تمام خودروهای داخل اروپا
از این فناوری برخوردار باشند؟ چه کاری می تونستیم انجام بدیم؟ اگر داده ها رو جمع کنیم، شاید بتونیم علامت های ثبت شده رو ببینیم بهترین راه تشخیص این که در ۵ ثانیۀ آینده، یک تصادف اتفاق می افته. و نکتۀ بعدی که ازش بهره می گیریم، خستگیِ راننده است، خدمات به این شکل ارائه می شه که مثلاً وقتی ماشین متوجه این حالت راننده می شه، آلارم داخلی رو به صورت خودکار فعال می کنه که مثلاً فرمون رو می لرزونه، یا یه بوق می زنه که بگه: "هی! بیدار شو، بیشتر به جاده توجه کن"
این ها مصداق هایی از توانایی هامون هستند، وقتی جنبه های بیشتری از زندگی رو به داده بدل می کنیم. حالا ارزش دادۀ بزرگ چیه؟ خب... بهش فکر کنید. اطلاعات بیشتری دارید. می تونید کارهایی انجام بدبد که قبلاً نمی تونستید. یکی از تاثیرگذارترین جاهایی که این مفهوم کاربردیه زمینۀ یادگیریه ماشینه. یادگیریه ماشین، شاخه ای از هوش مصنوعی ست، که خود شاخه ای از علوم رایانه ست. ایدۀ کلی به این شکله که به جای آموزش رایانه برای کاری، ما خیلی ساده، داده ها رو کنار مشکل میگذاریم
و به رایانه می گیم، خودت حلش کن. دانستن منشا این مسئله، به درکش کمک می کنه. در سال ۱۹۵۰، یک دانشمند رایانه در آی.بی.ام به نام آرتور ساموئل به چکِرز علاقه داشت و برنامه ای برایش نوشت تا بتونه مقابل رایانه بازی کنه. او بازی کرد. و او برد. بازی کرد. برد. بازی کرد. برد. چون رایانه، تنها حرکت های قانونی رو می دونست. آرتور ساموئل چیز دیگه می دونست. آرتور ساموئل استراتژی می دونست. پس یه برنامۀ تکمیلی در کنارش نوشت
که پشت زمینه کار کنه، و این احتمال رو بسنجه که بعد از هر حرکت ترکیب مهره های صفحه، به سمت برد می ره یا باخت. او با رایانه بازی می کنه. و می بره. بازی می کنه. و می بره. بازی می کنه. و می بره. و سپس آرتور ساموئل رایانه رو تنها می گذاره تا با خودش بازی کنه. بازی می کنه. و دادۀ بیشتر جمع می کنه. دادۀ بیشتر جمع می کنه. و دقت پیش بینی رو بالا می بره. بعد آرتور ساموئل برمی گرده به رایانه و بازی می کنه، می بازه.
و بازی می کنه، و می بازه، و بازی می کنه، و می بازه، و آرتور ساموئل ماشینی ابداع می کنه که از اون در توانایی ای که یادش داده بود، سبقت می گیره. و این ایدۀ یادگیری ماشین به همه جا می ره. فکر می کنید ماشین های بدون راننده از کجا اومدن؟ آیا ما جامعه ای هستیم که تمام قوانین جاده رو به نرم افزار بدیم؟ نه! حافظه ارزون تره، نه! الگوریتم ها سریع ترند، نه! پردازنده ها بهترند، نه! همۀ اینها مهم اند، اما پاسخ ما نیستند. پاسخ اینه که ما ماهیت مسئله رو تغییر دادیم.
ماهیت مسئله رو از این که سعی کنیم آشکارا و به جزء به رایانه بگیم که چطور رانندگی کنه، به این شکل تغییر دادیم: این مقدار اطلاعات در مورد خودرو هست. خودت حلش کن. خودت بفهم که این چراغ راهنماییه، که چراغ راهنما قرمزه و نه سبز، که این یعنی باید بایستی و جلو نری. یادگیری ماشین، پایۀ بسیاری از کارهای آنلاین ماست. موتورهای جستجو، الگوریتم شخصی سازی آمازون، مترجم رایانه ای،
سیستم های تشخیص صدا. محققین اخیرن به مسئلۀ بافت برداری پرداختند، بافت های سرطانی. آنها از رایانه خواستند که با مشاهدۀ داده ها و میزان نجات بررسی کند که آیا در واقع سلول ها سرطانی اند یا نه، و مطمئناً، با افزودن داده به آن، به الگوریتم یادگیریِ ماشین، ماشین قادر بود به شناساییِ ۱۲ تا از بهترین نشانه های پیش بینی که نمونۀ سلول های سرطان پستان واقعاً سرطانی اند. مسئله: دایرۀ المعارف پزشکی
تنها ۹ تای آنان را می شناخت. سه تا از ویژگی ها، آنهایی بودند که مردم نیازی به پیدا کردن آنها نداشتند، اما ماشین آنها را پیدا کرد. ابعاد تاریکی هم برای دادۀ بزرگ وجود دارد. زندگی مان را بهبود می بخشد اما مشکلاتی هم هست، که باید به آنها آگاه باشیم. اولی، ایده ایست که شاید برای این پیش بینی ها مجازات شویم! مثلن پلیس برای مقاصدش از آن استفاده کند. کمی شبیه فیلم "گزارش اقلیت". امروزه واژۀ پیش بینیِ پلیسی هست، یا جرم شناسی الگوریتمی که اگر داده های زیادی داشته باشیم،
مثلاً محل وقوع جرم های پیشین، می دانیم گشت ها را به کجا اعزام کنیم. به نظر منطقی می آد، اما مشکل اینه که مسئله به دادۀ موقعیت ختم نمی شه، و به مسائل فردی وارد خواهد شد. چرا از ریزنمرات فردی در دوران دبیرستان استفاده نکنیم؟ شاید باید از این حقایق استفاده کنیم که آیا بیکارند یا نه، اعتبار بانکی شان، رفتاروب گردی آنها آیا تا دیروقت بیدارند. دست بندشان، اگر قادر به تشخیص بیوشیمی باشد، تصورات تهاجمی شان را نشان خواهد داد. می شه الگوریتم هایی اشته باشیم که تقریباً
کارهایمان را پیش بینی می کنند، و ممکنه قبل از ارتکاب جرم دستگیر شیم. حریم خصوصی، چالش اصلی در عصر دادۀ کوچک بود. در دورۀ دادۀ بزرگ، چالش، حفاظت از اختیار است، انتخاب اخلاقی، ارادۀ انسان وکالت انسان. مشکل دیگری هم هست: دادۀ بزرگ ما را بیکار می کند. دادۀ بزرگ و الگوریتم ها به مصاف کارمندان و کار حرفه ای می روند در قرن ۲۱. به همان ترتیب که اتوماسیون کارخانه ها
و خطوط تولید در قرن بیستم به مصاف کارگران رفتند. مثلاً تکنسین آزمایشگاه که زیر میکروسکوپ نمونۀ سرطانی می بیند و نتیجه می گیرد که آیا سرطانی ست یا نه. شخص به دانشگاه رفته. شخص املاک می خره. او رای می دهد. او در جامعه ذینفع است. و شغل اون شخص، مثل همۀ ناوگانِ حرفه ای ها مانند اون شخص، خواهند فهمید که شغلشان کاملاً تغییر کرده یا کاملاً از بین رفته.
ما دوست داریم اینگونه فکر کنیم که فناوری بعد از مدتی ایجاد شغل می کنه بعد از مدت کوتاه یا موقت جابجایی، و این برای ارجاع به انقلاب صنعتی که با اون زندگی می کنیم، درسته چون دقیقاً همونیه که اتفاق افتاده. اما چیزی رو در اون آنالیز فراموش کردیم: دسته ای از مشاغل هستند که به راحتی از بین می رن و بر نمی گردند. انقلاب صنعتی خیلی خوب نبود، اگر شما اسب بودید. پس باید دقت کنیم و دادۀ بزرگ رو برای خواسته هامون به کار بگیریم، خواسته های انسانی مون.
باید ارباب این فناوری باشیم، نه بنده اش. ما هنوز در ابتدای عصر دادۀ بزرگ هستیم، و صادقانه، خیلی خوب نیستیم در ادارۀ داده هایی که امروز می تونیم جمع کنیم. این فقط مشکلی برای آزانس امنیت ملی نیست. شرکت ها داده های زیادی جمع می کنند از آنها استفادۀ نادرست هم می کنند، باید این قسمت رو بهبود بدیم، و این زمان بره. کمی مشابه چالشی که انسان اولیه با آتش داشت. این یک ابزار است. اما ابزاری که بر اثر استفادۀ نادرست، ما را به آتش می کشد. دادۀ بزرگ، روند زندگی ما را متحول خواهد کرد،
روند کارمان را و روند تفکرمان را. به ما کمک می کند در مدیریت سوابق مان در هدایت زندگیِ راضی کننده و امیدبخش در خوشحالی و در سلامت اما در گذشته، اغلب به فناوری اطلاعات نگاه می کردیم و چشم هایمان فقط "ف" را دیده اند فناوری... سخت افزار... چون آنها فیزیکی بودند. اکنون باید به "ا" بنگریم، اطلاعات... که کمتر اشکار است. اما در برخی جهات بسیار مهم تر. بشریت سرانجام از اطلاعات خواهد آموخت اطلاعاتی که جمع می کند،
در راستای تلاش بی پایان مان برای فهمیدن جهان و جایگاهمان در آن، و به این دلیله که دادۀ بزرگ مهمه. (تشویق حضار)
America's favorite pie is? Audience: Apple. Kenneth Cukier: Apple. Of course it is. How do we know it? Because of data. You look at supermarket sales. You look at supermarket sales of 30-centimeter pies that are frozen, and apple wins, no contest. The majority of the sales are apple. But then supermarkets started selling smaller, 11-centimeter pies, and suddenly, apple fell to fourth or fifth place. Why? What happened? Okay, think about it. When you buy a 30-centimeter pie,
the whole family has to agree, and apple is everyone's second favorite. (Laughter) But when you buy an individual 11-centimeter pie, you can buy the one that you want. You can get your first choice. You have more data. You can see something that you couldn't see when you only had smaller amounts of it. Now, the point here is that more data doesn't just let us see more, more of the same thing we were looking at. More data allows us to see new.
It allows us to see better. It allows us to see different. In this case, it allows us to see what America's favorite pie is: not apple. Now, you probably all have heard the term big data. In fact, you're probably sick of hearing the term big data. It is true that there is a lot of hype around the term, and that is very unfortunate, because big data is an extremely important tool by which society is going to advance. In the past, we used to look at small data
and think about what it would mean to try to understand the world, and now we have a lot more of it, more than we ever could before. What we find is that when we have a large body of data, we can fundamentally do things that we couldn't do when we only had smaller amounts. Big data is important, and big data is new, and when you think about it, the only way this planet is going to deal with its global challenges — to feed people, supply them with medical care, supply them with energy, electricity,
and to make sure they're not burnt to a crisp because of global warming — is because of the effective use of data. So what is new about big data? What is the big deal? Well, to answer that question, let's think about what information looked like, physically looked like in the past. In 1908, on the island of Crete, archaeologists discovered a clay disc. They dated it from 2000 B.C., so it's 4,000 years old. Now, there's inscriptions on this disc, but we actually don't know what it means. It's a complete mystery, but the point is that
this is what information used to look like 4,000 years ago. This is how society stored and transmitted information. Now, society hasn't advanced all that much. We still store information on discs, but now we can store a lot more information, more than ever before. Searching it is easier. Copying it easier. Sharing it is easier. Processing it is easier. And what we can do is we can reuse this information for uses that we never even imagined when we first collected the data.
In this respect, the data has gone from a stock to a flow, from something that is stationary and static to something that is fluid and dynamic. There is, if you will, a liquidity to information. The disc that was discovered off of Crete that's 4,000 years old, is heavy, it doesn't store a lot of information, and that information is unchangeable. By contrast, all of the files that Edward Snowden took from the National Security Agency in the United States fits on a memory stick
the size of a fingernail, and it can be shared at the speed of light. More data. More. Now, one reason why we have so much data in the world today is we are collecting things that we've always collected information on, but another reason why is we're taking things that have always been informational but have never been rendered into a data format and we are putting it into data. Think, for example, the question of location. Take, for example, Martin Luther. If we wanted to know in the 1500s
where Martin Luther was, we would have to follow him at all times, maybe with a feathery quill and an inkwell, and record it, but now think about what it looks like today. You know that somewhere, probably in a telecommunications carrier's database, there is a spreadsheet or at least a database entry that records your information of where you've been at all times. If you have a cell phone, and that cell phone has GPS, but even if it doesn't have GPS, it can record your information.
In this respect, location has been datafied. Now think, for example, of the issue of posture, the way that you are all sitting right now, the way that you sit, the way that you sit, the way that you sit. It's all different, and it's a function of your leg length and your back and the contours of your back, and if I were to put sensors, maybe 100 sensors into all of your chairs right now, I could create an index that's fairly unique to you, sort of like a fingerprint, but it's not your finger. So what could we do with this?
Researchers in Tokyo are using it as a potential anti-theft device in cars. The idea is that the carjacker sits behind the wheel, tries to stream off, but the car recognizes that a non-approved driver is behind the wheel, and maybe the engine just stops, unless you type in a password into the dashboard to say, "Hey, I have authorization to drive." Great. What if every single car in Europe had this technology in it? What could we do then? Maybe, if we aggregated the data, maybe we could identify telltale signs
that best predict that a car accident is going to take place in the next five seconds. And then what we will have datafied is driver fatigue, and the service would be when the car senses that the person slumps into that position, automatically knows, hey, set an internal alarm that would vibrate the steering wheel, honk inside to say, "Hey, wake up, pay more attention to the road." These are the sorts of things we can do when we datafy more aspects of our lives. So what is the value of big data?
Well, think about it. You have more information. You can do things that you couldn't do before. One of the most impressive areas where this concept is taking place is in the area of machine learning. Machine learning is a branch of artificial intelligence, which itself is a branch of computer science. The general idea is that instead of instructing a computer what do do, we are going to simply throw data at the problem and tell the computer to figure it out for itself. And it will help you understand it
by seeing its origins. In the 1950s, a computer scientist at IBM named Arthur Samuel liked to play checkers, so he wrote a computer program so he could play against the computer. He played. He won. He played. He won. He played. He won, because the computer only knew what a legal move was. Arthur Samuel knew something else. Arthur Samuel knew strategy. So he wrote a small sub-program alongside it operating in the background, and all it did
was score the probability that a given board configuration would likely lead to a winning board versus a losing board after every move. He plays the computer. He wins. He plays the computer. He wins. He plays the computer. He wins. And then Arthur Samuel leaves the computer to play itself. It plays itself. It collects more data. It collects more data. It increases the accuracy of its prediction. And then Arthur Samuel goes back to the computer and he plays it, and he loses,
and he plays it, and he loses, and he plays it, and he loses, and Arthur Samuel has created a machine that surpasses his ability in a task that he taught it. And this idea of machine learning is going everywhere. How do you think we have self-driving cars? Are we any better off as a society enshrining all the rules of the road into software? No. Memory is cheaper. No. Algorithms are faster. No. Processors are better. No. All of those things matter, but that's not why. It's because we changed the nature of the problem.
We changed the nature of the problem from one in which we tried to overtly and explicitly explain to the computer how to drive to one in which we say, "Here's a lot of data around the vehicle. You figure it out. You figure it out that that is a traffic light, that that traffic light is red and not green, that that means that you need to stop and not go forward." Machine learning is at the basis of many of the things that we do online: search engines,
Amazon's personalization algorithm, computer translation, voice recognition systems. Researchers recently have looked at the question of biopsies, cancerous biopsies, and they've asked the computer to identify by looking at the data and survival rates to determine whether cells are actually cancerous or not, and sure enough, when you throw the data at it, through a machine-learning algorithm, the machine was able to identify the 12 telltale signs that best predict
that this biopsy of the breast cancer cells are indeed cancerous. The problem: The medical literature only knew nine of them. Three of the traits were ones that people didn't need to look for, but that the machine spotted. Now, there are dark sides to big data as well. It will improve our lives, but there are problems that we need to be conscious of, and the first one is the idea that we may be punished for predictions, that the police may use big data for their purposes,
a little bit like "Minority Report." Now, it's a term called predictive policing, or algorithmic criminology, and the idea is that if we take a lot of data, for example where past crimes have been, we know where to send the patrols. That makes sense, but the problem, of course, is that it's not simply going to stop on location data, it's going to go down to the level of the individual. Why don't we use data about the person's high school transcript? Maybe we should use the fact that they're unemployed or not, their credit score,
their web-surfing behavior, whether they're up late at night. Their Fitbit, when it's able to identify biochemistries, will show that they have aggressive thoughts. We may have algorithms that are likely to predict what we are about to do, and we may be held accountable before we've actually acted. Privacy was the central challenge in a small data era. In the big data age, the challenge will be safeguarding free will, moral choice, human volition, human agency.
There is another problem: Big data is going to steal our jobs. Big data and algorithms are going to challenge white collar, professional knowledge work in the 21st century in the same way that factory automation and the assembly line challenged blue collar labor in the 20th century. Think about a lab technician who is looking through a microscope at a cancer biopsy and determining whether it's cancerous or not. The person went to university. The person buys property.
He or she votes. He or she is a stakeholder in society. And that person's job, as well as an entire fleet of professionals like that person, is going to find that their jobs are radically changed or actually completely eliminated. Now, we like to think that technology creates jobs over a period of time after a short, temporary period of dislocation, and that is true for the frame of reference with which we all live, the Industrial Revolution, because that's precisely what happened.
But we forget something in that analysis: There are some categories of jobs that simply get eliminated and never come back. The Industrial Revolution wasn't very good if you were a horse. So we're going to need to be careful and take big data and adjust it for our needs, our very human needs. We have to be the master of this technology, not its servant. We are just at the outset of the big data era, and honestly, we are not very good at handling all the data that we can now collect.
It's not just a problem for the National Security Agency. Businesses collect lots of data, and they misuse it too, and we need to get better at this, and this will take time. It's a little bit like the challenge that was faced by primitive man and fire. This is a tool, but this is a tool that, unless we're careful, will burn us. Big data is going to transform how we live, how we work and how we think. It is going to help us manage our careers and lead lives of satisfaction and hope and happiness and health, but in the past, we've often looked at information technology
and our eyes have only seen the T, the technology, the hardware, because that's what was physical. We now need to recast our gaze at the I, the information, which is less apparent, but in some ways a lot more important. Humanity can finally learn from the information that it can collect, as part of our timeless quest to understand the world and our place in it, and that's why big data is a big deal. (Applause)