我們正進入物聯網時代,許多連網設備將使用傳感器/信號相互通信,預計這些設備將產生大量數據。處理大量數據(大數據)并從中生成可操作的見解將是一項挑戰。
公司正在投入大量資源來構建能夠處理大量數據并從中獲取見解的平臺。物聯網會產生無限多的數據,那么,這些平臺是否仍然能夠應對這種情況,并處理從數千臺設備收集到的數據,并且仍然具有成本效益?
例如,Skyserver數據庫中有2億個星系的數據。SDSS的數據超過150萬億字節,覆蓋了2.2億多個星系和2.6億顆恒星。隨著時間推移,設備的準確性會提高,它們的發現能力也會提高,從而產生更多的PB級數據。我們會繼續添加服務器、內存、硬盤和處理器來管理所有這些數據嗎?
為什么我們不能投入資源來使設備智能化?每臺設備都在自身進行必要的智能化,其輸出接口只向外界提供可操作的數據?
例如,太空望遠鏡可以比較所有圖像,只將一些具有新見解的圖像發送到太空服務器。某種內置于太空望遠鏡中的機器學習可以幫助它從過去學習,并在此基礎上產生可操作的見解……簡而言之,在望遠鏡中安裝一個大腦,將大數據轉換成智能數據。在SkyServer上存儲、管理和處理垃圾(大數據)對我們來說毫無意義,我們為什么要承擔垃圾數據的傳輸成本?
在物聯網世界中,如果所有設備的輸出接口都能提供智能數據,這將大大減少需要在物聯網線路上傳輸的數據量。我們還需要重新思考我們今天使用互聯網的方式,隨著時間推移,從互聯網生成的數據正在急劇增加,而未來的軟硬件技術根本無法應對這種局面。也許我們可以為互聯網創造一種新的語言,它可以用幾個信號來傳遞信息,而不是寫一個1000字的故事。如果你看到聾啞人之間的對話,你會發現他們幾乎不用信號,只用很少的動作講述一個完整的故事。將互聯網用戶看作聾啞人,并創造一種可以用很少信號講述故事的語言。
我認為圍繞物聯網的平臺可以幫助連網設備,并幫助我們理解今天在互聯網上生成的數據。將世界轉向智能數據,而不是浪費金錢來處理垃圾(大數據)。。