開放數據 世界進一步透明化

2017

若利用大數據將世界進一步透明化,可以是怎麼樣的呢?我又借用金庸的武俠小說來做個說明。上期我用了最喜愛的《倚天屠龍記》做了一個文字雲,今期我用《射鵰英雄傳》的文字雲來表現在內容上的關注點,字詞的大小就代表了受關注的程度。如果社會上各種事情事物的數據開放程度如一部小說般一字不漏地讓大家閱讀,那就可以運用人工智能進行大數據分析看清楚每一刻發生的大小事情和關聯性。

《射鵰英雄傳》是射鵰三部曲中的第一部,依背景時間順序分別是:

  • 《射鵰英雄傳》(南宋中期)
  • 《神鵰俠侶》(南宋末年)
  • 《倚天屠龍記》(元末年)

現時圖中的顏色並不代表武功強弱,但現在的技術是已經可做到透過不同顏色表現當中的不同正負面程度的訊息,當然未達至百份百準確,應用在這小說的行文用詞手法大概只可做到六成左右準確度,即是大家看待同一劇情得出的自身感受和機器分析的結果大約有六成相近,所以上圖的顏色層次暫只可當作為視覺效果好了。

但對於當下一般的字詞理解是可做到七至八成準確度,若機器學習在某些範疇做得好的話可做到八至九成準確度。要謹記,人也不可能做到百份百準確,不同人去理解相同事情事物也可有很大分歧。

對我來說,這幅圖已令我回味當中不少劇情,大家是否「英雄所見略同」!