這些年,我們一起追過的buzzword

karolina-zuraw-335264-unsplash
Photo by Karolina Zuraw on Unsplash

每過幾年科技界總會出現幾個 buzzword
四、五年前是Big Data
近兩年是Blockchain跟AI、ML
對了,還有那個現在不知道有多少人還記得的VR

buzzword 從 Big Data 變到 Blockchain 與 AI
不變的是大家總是一聽到就興奮的不得了
好像用了Big Data我們就能踏上冥王星
用了Blockchain就可以數鈔票
用了AI我們就會變聰明
別人要用我們也要用不能輸人
別人沒用我們更要第一個用
一窩蜂的搶灘像諾曼第登陸一樣

我完全同意這些buzzword的技術突破有時代價值
但事實上,他們的應用領域都非常的有限

Big Data 的技術突破是從看似無關的資料當中找出因果
從Walmart開始
大家拚命的收資料,有多少收多少
以為資料量越大越能掏出金沙
這是很大的誤解
真正重要的不是量,而是資料的關聯性
而在企業的穀倉時代
重點也不在於你把更多有關聯的資料都收進自己的穀倉
關鍵能力在於打造穀倉間資料流通的渠道
或者
效法紐約市消防局 mining 火災高危險建築物的做法
以一組人穿梭於各大穀倉
接觸各部門的資料,理解資料,找到資料的關聯性
關鍵能力在於能夠從無限範圍的資料中的尋找關聯,不分資料屬於企業內部或外部
關鍵是尋找對的資料的能力

Blockchain 的技術突破是去中心化的可靠簿記機制
目前為止,Blockchain 最有利可圖也最合理的應用就是虛擬貨幣了
除了虛擬貨幣之外
另一個合理的應用就是北大性侵案時北大學生以blockchain記錄事件
以區塊鏈難以被攻擊跟防篡改的特徵,對抗威權當局,可以理解也非常合理
除了以上兩點,其他blockchain的應用屬於東施效顰得多
我不懂蘭嶼原住民的身份認證系統需要靠blockchain突破什麼
參與挖礦的人可以得到比特幣做為報酬
這是比特幣防範51%算力攻擊的有效機制
當參與的機器越多,blockchain越容易避免51%算力攻擊
身份認證與其他的blockchain應用扣除政績考量以及吸引創投的錢,看不出有什麼非鏈不可的原因
當參與的機器不夠多的時候,用blockchain被攻擊的風險其實高過單一中心化的設計

AI 的技術突破在於ML在摩爾定律大量倍增的computing power與極大量資料的加持下,把Deep NN變得可行
自此發展出各種功能的NN model
各自解決它們適用的特定領域的問題
ML 容易被誤解成一件魔術
以為把硬幣丟進去,就可以從帽子裡抓出兔子,機器也學會了好棒棒
那叫巫術
ML 需要領域知識,定義對的feature
即使是目前號稱auto feature extraction的一些NN model
也是先有對該領域有高度了解
從而設計出的架構才能做到auto extration

不理解問題或model而用錯了model、
選擇了不痛不癢的feature還以為遇到了梯度消失、
無法收斂的training data還以為遇到了梯度爆炸、
不夠大量的資料則導致 overfitting
以上種種都會讓你的機器走入歹路一無是處
採用ML的重點不在於機器會不會學
採用ML的成敗關鍵不在技術,那麼多modulize的ML SDK,都很好用
關鍵在於對領域有高度的理解,對適合的model有足夠的理解

在ML需要domain knowledge的現實下
一些號稱ML的大平台的
除了政治意義或是說不出口的請給我你的資料之外
也想不到有什麼目標了
無需對號入座,因為市場上這樣做的很多,也不是什麼罪大惡極,只是座位已滿

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s