買買提上轉帖過來的, 看一看

來源: deepsigh 2020-10-23 09:14:05 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (21308 bytes)

Facebook有兩種data scientist, 一種是core data scientist, 招的人比較像MSR, 或
者Google Research那種profile. 另一種是product data scientist. 我下麵主要針對
第二種說.

先說analytics org, 基本可以概括成分散集中製, 工作時分散的, 管理是集中的.
Facebook大體上可以分成product org和business org. 後者是sales/HR/marketing/
Finance等等那些部門, 而data scientists是屬於product org. 對於product org, 又
分成眾多的product units, 大體有100多個. 每個team基本是4個主要pillars組成
engineering, pm, analysts (data scientist), product designers. 所以整個
Facebook一共有一百多個data scientists, 工作領域是分散在不同units, 但是
reporting structure是集中的. 所以hiring也是集中的. 麵試Facebook的data
scientist, 是general hiring pool, 不分組的, 進來以後再allocate. 這點上和
engineers, PMs 什麽的都相同. 之所以要這樣, 是為了讓analytics保持獨立性, 更好
的為產品提供insights,而不完全受product的製約, 換句話說, 你的老板是analytics
head, 而不是你工作的那個product的head. 再有就是這樣會形成analytics community
, 容易share resources, best practices, 等等.

再說data scientists的日常工作組成, 基本分四項
(1) data pipelines, 這包括各種ETL, 處理數據, reporting, dashboard 等等
(2) product operation, 包括監測和產品的走向, own key metrics, 和各種ad hoc的
product support. 這種可以簡單概括成被動分析, 就是有人問你關於產品問題, 你得
回答.
(3) strategic analysis, 各種exploratory的分析, 提供insight來幫助產品set
roadmaps. 這種可以簡單概括成主動分析, 就是沒人問你問題, 你自己要問你合適的問
題, 並且回答, 主動為產品提供發展方向.
(4) cross functional influencing. 有了insights, 要和另外幾大pillars打交道(
eng, pm等等), 所以influencing必不可少.
可以想想, 每個產品的analysts, 都是和那個產品的團隊坐在一起的, 而不是和你老板
坐在一起. 同一個analytics team裏的人, 往往是分散坐在不同的樓裏, 而你老板可能
是坐在他最involve的一個產品那個組裏. Analytics team有weekly meeting, 但是你
更多的時候是meet同一product team裏的人.

再說data scientists麵試的要點.
(1) 有"一定"的技術能力, Python + big data (比如Hive/SQL). R也可以, 但是很多
麵試題用R來做恐怕有些困難, 會Python是很有幫助的. 不需要啃算法書, CS麵試那種
算法題不會考. 我們隻需要知道你有獨立handle data的能力, 遇上事情能有技術能力
unblock你自己. 光會SQL是不行的.
(2) 有"極好"的分析能力, 這是analysts的本質, 也是麵試的重點. 給你一個問題(
open ended), 看能不能 think analytically and structurally. 隨便舉個例子: 怎
麽用FB數據分析日本核電站爆炸的影響. 這裏要自己formalize這個問題, 提出假設,
思考可以用哪些數據, 怎麽分析, 沒有某些數據怎麽替代 等等一係列步驟.
(3) 有"極好"的product sense. 因為實際工作中, 很多時候沒人問你問題, 你要自己
問問題, 問正確的問題, 需要對產品有很好的理解. 這裏也舉個例子: 假如印度的某個
城市停電三天, 你覺得對FB會有哪些影響, 這些影響對Twitter會如何? 回答這個問題,
先得對行業和產品有一定了解, 否則根本無從下手.
當然一些其他的東西, 比如對數字的敏感度, 交流的能力等等很重要, 但是哪些都表現
在上麵這些回答當中.

很大程度上, FB的data scientists需要的是通才, 而不是專才, 從上麵這些問題就能
看的出來. 這也是為什麽我們招進來的人什麽背景的都有. 背景可以千差萬別, 但是上
麵三條都一定滿足. 對於學統計的人, 尤其是對互聯網行業比較陌生的, 可能在
product sense方麵會有些challenge. 我們也麵試過很多統計PhD, 有些人回答很好,
有些人就一塌糊塗, 最後的差別並不在於統計, 而是分析頭腦和product sense. 這裏
要說一點, 大多數中國人都比較適合回答close-ended questions(這個和咱們的教育背
景有關), 糾結於"怎麽分析". 很多時候遇上"分析什麽" 這種 open-ended questions
反而不知如何下手.

最後明確一下, FB現有大量的data scientists空缺, 剛興趣的請自己申請, 也可以找
FB的朋友推薦. 因為我個人也是hiring manager之一, 也是interviewers之一, 所以我
不負責推薦.
https://www.facebook.com/careers/department?req=a0IA000000CyDjDMAV

最後說點題外話. 這個版上稍微老點的人恐怕都知道我, 我來FB之前在Google工作了7
年半. Google是個給錢多還不累的地方. FB可完全不是, FB比Google忙的多的多的多的
多, 整個公司都是這個文化. 對於mediocre performer, Google更tolerant, 而FB很多
就直接fire了. 所以追求work life balance的, 基本就不要考慮FB了.
Google是很好的公司, 也有很多牛人, 但也有很多不幹活的人在公司的各個角落. FB可
以說基本沒有, 至少整個analytics org一百多人, 我還沒發現任何一個人有任何一點"
混"的跡象. Analytics從director到
manager到IC, 都是要做IC活的. 光管人耍嘴皮子, 在FB是吃不開的. 我老板director,
基本每天也就睡4,5個小時, 剩下時間全在工作, 又management, 又自己分析東西. 很
大程度上, FB這麽大的公司, 能保持這種模式, 也算是奇跡了.  以前我在Google的時
候, 基本天天泡在這個版, 可是現在可能一兩個月都不來一次了, 實在是沒時間, 有時
一天忙到最後都渴的不行餓得不行了, 才發現自己一天忙得都沒喝口水的時間.
 

所有跟帖: 

上麵說他經理一天隻睡4,5個小時 -deepsigh- 給 deepsigh 發送悄悄話 deepsigh 的博客首頁 (0 bytes) () 10/23/2020 postreply 09:15:17

都是神人/牛人,精力旺盛。。。知道差距,我們混混仰望一下就好 :) -成功的兔- 給 成功的兔 發送悄悄話 (0 bytes) () 10/23/2020 postreply 09:19:18

嗯。一同仰視。我的娃兒十點就要上床,到點就要下班。周末隻尋思何處去攀岩 -瓜希- 給 瓜希 發送悄悄話 瓜希 的博客首頁 (0 bytes) () 10/23/2020 postreply 09:27:00

你家美女娃是在FB還是打算去FB? -acreek- 給 acreek 發送悄悄話 (0 bytes) () 10/23/2020 postreply 09:24:40

我孩子對現在的工作滿意, 和FB無關 -deepsigh- 給 deepsigh 發送悄悄話 deepsigh 的博客首頁 (0 bytes) () 10/23/2020 postreply 09:44:10

加跟帖:

當前帖子已經過期歸檔,不能加跟帖!