Re: [請益] 外商面試題目

看板 Soft_Job
作者 chucheng (時間太少事情太多)
時間 2013-04-25 05:02:03
留言 6 ( 3推 0噓 3→ )
※ 引述《pologuy (購物慾好強)》之銘言: : ex: : 甲買商品A 同時會購買BC : 乙買商品A 同時會購買CD : 因此A和C的關聯性較高 : 那麼要如何將A商品的關聯性商品記錄下來,並且將較高關聯性的商品(如上述C)推薦給 : \ : 消費者? : 這是小弟之前面試的題目,想不到好的方法,想請教各位! 如果是面試,簡單的作法是把甲和乙(或其它user 假設是相同一個人) 並假設ABC與時間無關(想成賣永久,不會下架) 這樣問題可以簡化成frequent itemset/ Association rule learning 的問題 看這裡:http://en.wikipedia.org/wiki/Association_rule_learning 其中最簡單的解法是aprior: http://en.wikipedia.org/wiki/Apriori_algorithm 每一本資料探碪的書一定都會教這個演算法,本身很簡單,這裡就略過 面試要求現場寫出apriori的code挺合理的,基本上就是算confidence和support 這算是Data Mining 101,寫不出來/講不出來,很有可能被面試者 根本沒學/修過這門課,如果應徵data engineer/ data scientist 大概可以直接fail掉他 那…如果甲乙丙(user有不同偏好)不是同一個人,且東西有時效性(想成電影) 這幾年最經典的2010 KDD Best paper的 BellKor's Pragmatic Chaos 演算法 Paper下載點:http://dl.acm.org/citation.cfm?id=1721677 後者那個鬼東西要看懂(不要講實作)都要好幾天 不可能現場寫得出來 相關的面試問題還有很多,基本上這是在考 Recommendation System Design或是Collaborative Filtering 有時候還會被加問如果資料很大(超大,大到放不到一台電腦如何解決) 正解是map-reduce over hadoop,配上Apache Mahout 裡面有現成的Collaborative Filtering 函式庫可以使用 -- ※ 發信站: 批踢踢實業坊(ptt.cc)

留言

※ 編輯: chucheng 來自: 131.179.64.104 (04/25 05:05)
gmoz 推 NICE 04/25 16:43 1F
lance70176 嗚嗚 看不懂 04/25 17:53 2F
robler 這個有趣..有空來研究一下 04/25 19:15 3F
aa155495 修完課之後一段時間,就忘記了 qq 04/26 04:40 4F
iincho 有書單可以推薦嗎? 對這個還挺有興趣的 04/26 12:21 5F
chucheng 隨便買一本Data Mining的書應該都有Apriori 04/26 13:22 6F

最新文章

[請益] 特定農業區-交通用地
home-sale wade0617
2024-12-05 04:25:30
[台中/個人] 找鋼琴編曲 人才
part-time hohoha123
2024-12-05 03:25:32
Re: [閒聊] 新莊Volvo濫告消費者
car wagwag
2024-12-05 03:00:30
[公告] 水桶名單 montbless
salary sf820624
2024-12-05 02:24:45
[問題] 車美仕主機升級建議?
car n2234
2024-12-05 02:12:26
[贈送] 全國 2025 日曆
give naccieriai
2024-12-05 01:27:38
[徵求] 7-11貓福三麗鷗27 點
e-coupon dragon823
2024-12-05 01:09:51
[情報] 1204 上市櫃股票週轉率排行
1 1 stock steveisaman
2024-12-05 00:59:34
[贈送] 全國 黑色側背包包
give lionccc
2024-12-05 00:59:18