從專家到社群 即時資訊採集分析系統
TRANSCRIPT
次級資料
1. 我們有時只能從已抓的資料下手, 而不是最實際的資料
2. 這種指數的計算是簡化其複雜度, 一定會失去一些意義
3. 我們可以視其須要及適用度, 去調整演算法或資料搜集
4. 對於資料的可能性與適用性, 我們還須要一段路來學習
網路民意與抽樣調查最不一樣的地方
1. 網路民意是搜集使用者主動的行為, 而抽樣調查是被動被問問題. 2. 網路民意是可以做到所有的母體/群眾, 而抽樣調查是子集合/子體. 3. 網路民意是每天或隨時都在變化有數字, 而抽樣調查一定是個區間或有時間間隔. 4. 網路民意是特定一個族群, 而抽樣調查的族群較為廣泛. 5. 網路民意不見得知道其背景資料, 而抽樣調查通常會詢問其背景資料
新文易數的系統流程 (I)
1. 抓取媒體的文章列表2. 每篇文章的 Tags3. 計算 Tags 總數4. 計算分數 (Normalization)5. 從趨勢計算爆發力6. 計算 Tag 關聯與距離等基本數值