發表文章

目前顯示的是 9月, 2014的文章

紅蔥頭-巨量資訊-談東談西-140911

又是個當書蟲啃書的日子。最近老為了找到有意義的研究議題傷神,結果在研究遊戲議題時看到了有國內學者以系統動力學討論遊戲產業的發展,雖然不是很清楚建構模型的來源,但至少又打開了一扇窗。而翻著youtube,又找到MIT 拍攝的影片在討論big data的應用,所以,再次拾人牙慧,參考一下: 在討論big data的應用時,不妨以 Madden所提的架構做為發想的基礎,我在這邊試做一下: Learning-  啊~~ 怎麼想不到.... Science- data mining, weather, earthquake...forcasting Retailing- money issues, inventory, shopping behavior... Entertainment- game, movie, TV, a tone fit all??... Government- tax, ticket, spying??...the SHIELD Dept. (Iron Man...)?? Health/ Medical, health insurance... potential risk identify?? Social- ID, social network, Finance- stock, bank account, credit card... Transporting- traffic, waiting time, logistic,... +++ Political- policy implement, voting, ... 上述的應用最多討論到的是風險管理Risk management, 購物行為shopping behavior與預測,例如有了健保資料,購物資料,就如同美國百貨會在尿布的旁邊擺放啤酒一般,嬰孩的父親在買尿布"照顧"孩子時,也不會忘記買一手啤酒"照顧"一下自己。當然,巨量資訊也是雙面刃,也是試圖用過去來估計未來,仍舊會有準確性的問題。 有趣的是,看電影也能學科學,以美國隊長2為例,就是在說明big data被壞人與好人應用的差別... 真是,米國人科學強,連科學用來拍電影的娛樂性都高... 別阻止我看漫畫啊~~~ 該反省的是,我們的科學幻想度實在不足啊&

紅蔥頭-巨量資訊 關鍵字1

譚磊的書由資料開始談起,解釋所謂的巨量資料時代,亦即資訊具有3V的概念: 大量化 (Volume)、多樣化 (Variety)及快速化(Velocity),更加入說明為何巨量資訊近年來為何如此熱門的原因,因為商業界需要增加第四個"V",即"Value"。此外,他也論及一般作者較少論及的採集演算法 ( algorithm ),並論及資料採集所需的軟體,甚至將電子商務的堂奧做簡要的說明,為了補足自己不頂好的記憶,將重要的關鍵字詞記錄下來,當作為來採礦的參考。   當然Hurwitz et al. (2013)的書也編寫的淺顯易懂,且重要的項目都粗黑體標示,也非常值得參考 。不知台灣哪天才會將此系列的書全部翻成中文。說真的,若非是得靠這技能吃飯的,若能至少找到本入門書看一下,或許能說是趕上科技討論的熱潮,在討論時才不會顯得孤單。   RFM模型 (譚磊,2013,8-21)為Authur Hughes所提出的論點,認為消費者交易的三個核心指標為下列三種: R: Recency: 最近購物與data mining當日的購物時間差異。 F: Frequency: 在"一定時期"的購買次數,消費頻率。 M: Monetary Value: 客戶在"一定時期"內的"每次"購買金額。 跳離率 (Bounce Rate)為網路上常用的指標 (譚磊,2013,9-3),指的是進入一個網站之後不再繼續瀏覽,   也因為譚磊在文中極力推薦"R"程式,因此,我的衍生閱讀清單越來越長,書的厚度也越來越厚。   陳景祥 (2014: 12)認為程式語言的五個基本功能: 1. 變數與常數: 具有表達常數、一般變數及陣列變數的功能 2. 輸入與輸出: 收到訊號->處理->產生反應。 3. 條件執行 (conditional execuation)與邏輯判斷 (logical decision): if-else, while-then... etc. 如迷  宮鼠在檢測地板的磁條,或是遇到坑洞的處理原則。 4. 迴圈: for, while, until ... etc; 重覆執行的功能 5.